
Groq numește procesorul de streaming de telestectură de arhitectură (TSP). Doi ani înapoi a spus că a recrutat opt dintre cei zece persoane care au dezvoltat unitatea de procesare a tensorului Google (TPU).
Compania a ridicat 62,3 milioane de dolari în finanțare.
Arhitectura lui Groq este echivalentă cu o operațiune de cvadrillion pe secundă sau 1E15 OP / S și capabilă de până la 250 de trilioane de puncte plutitoare pe secundă (flops).
"Companiile de top GPU au spus clienților că ei sperau să poată furniza o performanță PETAOP / s în următorii câțiva ani; Groq anunță-o astăzi ", spune CEO-ul Groq Jonathan Ross", arhitectura Groq este multiplii mai repede decât orice altceva disponibil pentru inferență, atât de latență scăzută, cât și de inferențe pe secundă. Am avut primul Silicon Back, Pornicii de prima zi, programe care rulează în prima săptămână, eșantionate la parteneri și clienți în mai puțin de șase săptămâni, cu A0 Silicon intră în producție "
Cu o mentalitate de software-prima mentalitate, Arhitectura TSP a Groq susține că a realizat atât flexibilitatea și paralelismul masiv, fără sincronizarea generală a arhitecturilor tradiționale GPU și CPU.
Arhitectura lui Groq poate suporta atât modele tradiționale, cât și noi de învățare a mașinilor și este în prezent în funcțiune pe site-urile client în ambele sisteme X86 și Non-X86.
Arhitectura este concepută special pentru cerințele de performanță ale viziunii computerului, învățarea mașinilor și a altor volume de muncă legate de AI.
Planificarea executării se întâmplă în software, eliberând imobile din silicon, altfel dedicat executării dinamice a instrucțiunilor.
Controlul strâns oferit de această arhitectură oferă o prelucrare deterministă, care este deosebit de valoroasă pentru aplicațiile în care siguranța și acuratețea sunt esențiale.
În comparație cu arhitecturile tradiționale complexe bazate pe CPU-uri, GPU și FPGA, Chipul Groq simplifică, de asemenea, calificarea și desfășurarea, permițând clienților să implementeze simplu și rapid sisteme scalabile, de înaltă performanță-per-watt.