
Groq noem sy argitektuur tensor streaming verwerker (TSP). Twee jaar terug het dit gesê dat dit agt van die tien mense gewerf het wat Google se tensorverwerkingseenheid (TPU) ontwikkel het.
Die maatskappy het $ 62,3 miljoen in befondsing verhoog.
Groq se argitektuur is gelykstaande aan een vierwillige operasies per sekonde, of 1e15 ops / s en in staat tot 250 triljoen swaai-punt operasies per sekonde (flops).
"Top GPU-maatskappye het kliënte vertel dat hulle gehoop het om binne die volgende paar jaar een PETAOP / S-prestasie te kan lewer; Groq maak dit vandag bekend, "sê Jonathan Ross, uitvoerende hoof van die Groq." Die Groq-argitektuur is baie veelvoude vinniger as enigiets anders beskikbaar vir inferensie, in terme van lae latensie en afleidings per sekonde. Ons het die eerste silikon terug, eerste-dag-kragopwekking in die eerste week, wat in die eerste week aan vennote en kliënte in minder as ses weke gehardloop het, met A0-silikon in produksie "
Met 'n sagteware-eerste ingesteldheid beweer Groq se TSP-argitektuur om beide 'n beperkte buigsaamheid en massiewe parallelisme te behaal sonder die sinkronisasiebokoste van tradisionele GPU en CPU-argitekture.
Groq se argitektuur kan beide tradisionele en nuwe masjienleermodelle ondersteun, en is tans in werking op kliënte-webwerwe in beide X86 en nie-x86 stelsels.
Die argitektuur is spesifiek ontwerp vir die prestasievereistes van rekenaarvisie, masjienleer en ander AI-verwante werklading.
Uitvoering beplanning gebeur in sagteware, die vrystelling van silikon Real Estate andersins toegewy aan dinamiese onderriguitvoering.
Die streng beheer deur hierdie argitektuur verskaf deterministiese verwerking wat veral waardevol is vir toepassings waar veiligheid en akkuraatheid van die grootste belang is.
In vergelyking met komplekse tradisionele argitektuur gebaseer op CPU's, GPU's en FPGAS, stroom die Groq se chip ook kwalifikasie en implementering, wat kliënte in staat stel om eenvoudig skaalbare, hoë prestasie-per-watt-stelsels vinnig te implementeer.