
Groq appelle son processeur de streaming Tensor de l'architecture (TSP). Deux ans de retour, il a déclaré qu'il avait recruté huit des dix personnes qui ont développé une unité de traitement de tenseurs de Google (TPU).
La société a collecté 62,3 millions de dollars de financement.
L'architecture de Groq équivaut à une quadrillion d'opérations par seconde, ou 1E15 OPS / s et pouvant accueillir jusqu'à 250 000 milliards d'opérations à point flottant par seconde (tops).
"Les meilleures entreprises GPU ont raconté leurs clients qu'ils espéraient pouvoir offrir une performance de Petaop / S au cours des prochaines années; Groq l'annonce aujourd'hui », explique Jonathan Ross Jonathan Ross,« L'architecture Groq est de nombreux multiples plus rapidement que tout ce qui est disponible pour l'inférence, en termes de faible latence et d'inférences par seconde. Nous avons eu du premier silicium de retour, la mise sous tension de premier jour, des programmes qui fonctionnent dans la première semaine, échantillonnés aux partenaires et aux clients de moins de six semaines, avec une production de silicium A0.
Avec un logiciel - Première mentalité, le TSP de Groq prétend guider à la fois la flexibilité de calcul et le parallélisme massif sans la surcharge de synchronisation des architectures traditionnelles GPU et CPU.
L'architecture de Groq peut prendre en charge les modèles d'apprentissage automatique traditionnels et nouveaux et actuellement en activité sur les sites des clients des systèmes X86 et non-X86.
L'architecture est spécialement conçue pour les exigences de performance de la vision informatique, de l'apprentissage automatique et d'autres charges de travail liées à l'AI.
La planification d'exécution se produit dans les logiciels, libérant ainsi l'immobilier de silicium dédié à l'exécution d'instructions dynamiques.
Le contrôle serré fourni par cette architecture fournit un traitement déterministe spécialement précieux pour les applications où la sécurité et la précision sont primordiales.
Par rapport aux architectures traditionnelles complexes basées sur les processeurs, les GPU et les FPGA, la puce de Groq rationalise également la qualification et le déploiement, permettant aux clients de mettre en œuvre simplement et rapidement des systèmes évolutifs et performants-per-watt.