
GROQ kallar sin arkitektur tensor streaming processor (TSP). Två år tillbaka sa det att det hade rekryterat åtta av de tio personer som utvecklade Googles Tensor-bearbetningsenhet (TPU).
Företaget har ökat 62,3 miljoner dollar i finansiering.
GROQs arkitektur motsvarar en quadrillionsverksamhet per sekund, eller 1E15 OPS / S och kan upp till 250 biljoner flytande punktverksamhet per sekund (flops).
"Top GPU-företag har berättat kunder att de hade hoppats kunna leverera en PETAOP / s-prestanda inom de närmaste åren. GROQ meddelar det idag, säger Groq VD Jonathan Ross, "GROQ-arkitekturen är många multiplar snabbare än någonting annat tillgängligt för inferens, när det gäller både låg latens och slutsatser per sekund. Vi hade först kiselback, första dagens power-on, program som körde under den första veckan, samplas till partners och kunder på under sex veckor, med A0-kisel som gick in i produktion "
Med en mjukvara-första tankegång, hävdar GROQs TSP-arkitektur för att uppnå både beräkning av flexibilitet och massiv parallellitet utan synkronisering över huvudet av traditionella GPU och CPU-arkitekturer.
GROQs arkitektur kan stödja både traditionella och nya maskininlärningsmodeller, och är för närvarande i drift på kundsajter i både x86 och icke-x86-system.
Arkitekturen är utformad speciellt för prestandakraven för datorsyn, maskininlärning och andra AI-relaterade arbetsbelastningar.
Exekveringsplanering sker i programvara, frigör kiselfastigheter, annars dedikerad till dynamisk instruktion.
Den täta kontrollen som tillhandahålls av denna arkitektur ger deterministisk bearbetning som är särskilt värdefull för applikationer där säkerhet och noggrannhet är avgörande.
Jämfört med komplexa traditionella arkitekturer baserade på CPU, Gpus och FPGAS, effektiviserar GROQs chip också kvalifikation och implementering, vilket gör det möjligt för kunder att helt enkelt och snabbt implementera skalbara, högpresterande per-watt-system.