
Groq menyebut prosesor streaming tensor arsitektur (TSP). Dua tahun yang lalu dikatakan telah merekrut delapan dari sepuluh orang yang mengembangkan Unit Pemrosesan Tensor Google (TPU).
Perusahaan telah mengumpulkan dana $ 62,3 juta.
Arsitektur Groq setara dengan satu kuadriliun operasi per detik, atau 1E15 ops / s dan mampu melakukan operasi floating-point hingga 250 triliun per detik (jepit).
"Perusahaan GPU top telah memberitahu pelanggan bahwa mereka berharap dapat memberikan satu kinerja Petaop dalam beberapa tahun ke depan; Groq mengumumkannya hari ini, "kata CEO Groq Jonathan Ross," Arsitektur Groq banyak berlipat ganda daripada apa pun yang tersedia untuk inferensi, dalam hal latensi rendah dan kesimpulan per detik. Kami memiliki program Silicon Back, Power-On First-On, berjalan pada minggu pertama, disampel dengan mitra dan pelanggan dalam waktu kurang dari enam minggu, dengan A0 Silicon masuk ke produksi "
Dengan pola pikir perangkat lunak - pertama, arsitektur TSP Groq mengklaim untuk mencapai fleksibilitas komputasi dan paralelisme besar-besaran tanpa sinkronisasi overhead arsitektur GPU dan CPU tradisional.
Arsitektur Groq dapat mendukung model pembelajaran mesin tradisional dan baru, dan saat ini beroperasi di situs pelanggan di sistem X86 dan Non-X86.
Arsitektur ini dirancang khusus untuk persyaratan kinerja visi komputer, pembelajaran mesin dan beban kerja terkait AI lainnya.
Perencanaan eksekusi terjadi dalam perangkat lunak, membebaskan silikon real estat sebaliknya didedikasikan untuk eksekusi instruksi dinamis.
Kontrol ketat yang disediakan oleh arsitektur ini memberikan pemrosesan deterministik yang sangat berharga untuk aplikasi di mana keselamatan dan akurasi adalah yang terpenting.
Dibandingkan dengan arsitektur tradisional yang kompleks berdasarkan CPU, GPU dan FPGA, chip Groq juga merampingkan kualifikasi dan penyebaran, memungkinkan pelanggan untuk secara sederhana dan cepat menerapkan sistem per-watt yang dapat diskalakan, kinerja tinggi.