
GROQ는 아키텍처 TENSOR 스트리밍 프로세서 (TSP)를 호출합니다. 2 년 후에 Google의 Tensor Processing Unit (TPU)을 개발 한 10 명의 사람들 중 8 명을 모집했다고 말했습니다.
이 회사는 6230 만 달러의 기금을 모금했습니다.
GROQ의 아키텍처는 초당 1 차 4 루일 작업 또는 1EE15 OPS / s와 250 루피의 부동 소수점 연산 (FLOPS)과 동일합니다.
"Top GPU 회사는 향후 몇 년 내에 Petaop / S 성능을 하나의 Petaop / S 성능을 제공 할 수 있기를 희망했다고 고객에게 알려 왔습니다. Groq CEO가 Jonathan Ross "라고 말하는 Groq Groq은"GROQ Architecture가 초당 낮은 대기 시간 및 추론의 관점에서 추측 할 수있는 다른 것보다 더 빠른 배수입니다. 우리는 첫 번째 실리콘 백, 첫날 전원을 흘리며, 6 주 미만의 파트너 및 고객에게 샘플링 된 프로그램, A0 실리콘이 생산 "
소프트웨어 - 첫 번째 사고 방식으로 GROQ의 TSP 아키텍처는 전통적인 GPU 및 CPU 아키텍처의 동기화 오버 헤드없이 유연성 및 대규모 병렬 처리를 모두 달성하기위한 것입니다.
GROQ의 아키텍처는 전통적인 및 새로운 기계 학습 모델을 모두 지원할 수 있으며 현재 x86 및 비 x86 시스템 모두에서 고객 사이트에서 작동 중입니다.
아키텍처는 컴퓨터 비전, 기계 학습 및 기타 AI 관련 작업 부하의 성능 요구 사항을 위해 특별히 설계되었습니다.
실행 계획은 소프트웨어에서 발생하므로 실리콘 부동산을 해제하는 데있어 역동적 인 명령 실행 전용으로 전용됩니다.
이 아키텍처에서 제공하는 엄격한 제어 기능은 안전과 정확성이 가장 중요한 응용 프로그램에 특히 중요한 결정 론적 처리를 제공합니다.
CPU, GPU 및 FPGA를 기반으로하는 복잡한 전통적인 아키텍처와 비교할 때 GROQ의 칩은 자격 및 배포를 간소화하여 고객이 확장 가능하고 고성능의 와트 시스템을 단순히 구현할 수있게합니다.