
Groq chama ao seu procesador de transmisión de Tensor Tensor (TSP). Dous anos atrás dixo que reclutara oito das dez persoas que desenvolveron a unidade de procesamento de Tensor de Google (TPU).
A empresa aumentou 62,3 millóns de dólares en financiamento.
A arquitectura de Groq é equivalente a unha operación de cuadrillón por segundo, ou 1E15 ops / s e capaces de ata 250 billóns de operacións de punto flotante por segundo (flops).
"As principais compañías de GPU foron contando aos clientes que esperaban poder entregar un rendemento de PETAOP / s nos próximos anos; Groq está anunciando hoxe, "di o CEO de Groq Jonathan Ross", a arquitectura de groq é moitos múltiples máis rápidos que calquera outra cousa dispoñible para a inferencia, en termos de baixa latencia e inferencias por segundo. Tivemos un primeiro silicio de volta, power-on de primeira vez, programas que se executan na primeira semana, mostrados a socios e clientes en menos de seis semanas, con A0 SILICION que entra en produción "
Cun software-primeiro mentalidade, a arquitectura de Groq de Groq afirma alcanzar a flexibilidade de calcular e un paralelismo masivo sen a sincronización sobre a sobrecarga das arquitecturas tradicionais de GPU e CPU.
A arquitectura de Groq pode soportar modelos tradicionais e novos de aprendizaxe de máquinas e está actualmente en funcionamento en sitios de clientes en sistemas X86 e non X86.
A arquitectura está deseñada especificamente para os requisitos de rendemento da visión informática, a aprendizaxe automática e outras cargas de traballo relacionadas con AI.
A planificación de execución ocorre no software, liberando a inmobles de silicio dedicada á execución de instrución dinámica.
O control axustado proporcionado por esta arquitectura proporciona un procesamento determinista que é especialmente valioso para as aplicacións onde a seguridade e a precisión son primeiras.
Comparación coas arquitecturas tradicionais complexas baseadas en CPUs, GPUs e FPGAs, chip de Groq tamén agiliza cualificación e de implantación, permitindo aos clientes sistemas simples e rápida implantación scalable e de alto rendemento por vatio.