
groqは、そのアーキテクチャテンソルストリーミングプロセッサ(TSP)を呼び出します。 2年後にそれはGoogleのテンソル処理装置(TPU)を開発した10人のうちの8人を募集したと述べた。
同社は資金調達で6230万ドルを調達しています。
GroQのアーキテクチャは、1秒あたりの1つの4倍の演算、または1E15 OPS / Sに相当し、1秒あたり最大250兆の浮動小数点演算(FLOP)が可能です。
「TOP GPU企業は、今後数年以内に1つのPetaop / Sのパフォーマンスを提供できることを望んでいることをお客様に伝えてきました。 Groqは今日それを発表しています」とGroq Ceo Jonathan Rossは、groqアーキテクチャは推論に利用できる他のものよりも多くの倍数です。私たちは最初のシリコンバック、初日の電源投入、最初の週に運営されていたプログラムが、6週間以内にサンプリングされ、パートナーや顧客にサンプリングされました。
ソフトウェアファーストマインドセットでは、GroqのTSPアーキテクチャは、従来のGPUおよびCPUアーキテクチャの同期オーバーヘッドなしに、計算柔軟性と大規模な並列処理の両方を達成することを主張しています。
Groqのアーキテクチャは、伝統的な機械学習モデルと新しい機械学習モデルの両方をサポートでき、現在x86と非x86システムの両方で顧客サイトで稼働しています。
アーキテクチャは、コンピュータビジョン、機械学習、その他のAI関連のワークロードの性能要件のために特別に設計されています。
実行計画はソフトウェアで発生し、それ以外の場合はダイナミック命令実行専用のシリコンの不動産を解放します。
このアーキテクチャによって提供される厳密な制御は、安全性と正確さが最も重要であるアプリケーションに特に価値ある決定論的処理を提供します。
CPU、GPU、およびFPGAに基づく複雑な従来のアーキテクチャと比較して、GroQのチップはまた、顧客が簡単にそして迅速にスケーラブルで高性能なシステムを実装することを可能にすることができます。