
Groq kalder sin arkitektur Tensor Streaming Processor (TSP). To år tilbage sagde det, at det havde rekrutteret otte af de ti personer, der udviklede Googles Tensor Processing Unit (TPU).
Virksomheden har rejst 62,3 mio. USD i finansiering.
GROQs arkitektur svarer til en quadrillionsoperationer pr. Sekund eller 1E15 OPS / S og i stand til op til 250 billioner flydende point-operationer pr. Sekund (flops).
"Top GPU-virksomheder har fortalt kunder, at de havde håbet på at kunne levere en petaop / s præstation inden for de næste par år; Groq annoncerer det i dag, "siger Groq CEO Jonathan Ross," Groq Arkitekturen er mange multipler hurtigere end noget andet til rådighed for indledning, hvad angår både lav latens og afledninger pr. Sekund. Vi havde første silicium tilbage, første dags power-on, programmer, der løber i den første uge, samplet til partnere og kunder på under seks uger, med A0 silicium i produktion "
Med en software-første tankegang hævder Groqs TSP-arkitektur at opnå både beregning af fleksibilitet og massiv parallelisme uden synkronisering overhead af traditionelle GPU og CPU-arkitekturer.
GROQs arkitektur kan understøtte både traditionelle og nye maskinindlæringsmodeller og er i øjeblikket i drift på kundesider i både X86 og ikke-X86-systemer.
Arkitekturen er designet specielt til præstationskravene til computersyn, maskinindlæring og andre AI-relaterede arbejdsbelastninger.
Udførelsesplanlægning sker i software, frigør Silicon Real Estate, der ellers er dedikeret til dynamisk instruktion.
Den stramme kontrol, der leveres af denne arkitektur, tilvejebringer deterministisk behandling, der er særligt værdifuld for applikationer, hvor sikkerhed og nøjagtighed er afgørende.
Sammenlignet med komplekse traditionelle arkitekturer baseret på CPU'er, GPU'er og FPGA'er, strømmer Groqs chip også kvalifikation og implementering, hvilket gør det muligt for kunderne at simpelthen og hurtigt implementere skalerbare, højtydende per-watt-systemer.