Qualcomm Incorporated(本社:アメリカ)は2025年10月28日(現地時間)、データセンター向けAI推論アクセラレータ
「Qualcomm AI200」および
「Qualcomm AI250」を発表した。 データセンター向けAI推論に最適化されており、ラックおよびアクセラレータカードのソリューションを提供。「ラックスケールAI推論の可能性を再定義する」と謳い、特にラック規模でのパフォーマンスとメモリ容量、消費電力、コスト面で他のアクセラレータより優れるという。
|
「Qualcomm AI200」は、NVIDIAやAMDなどの競合を上回るカードあたり768GBのLPDDRメモリをサポート。大規模言語やマルチモーダルモデル(LLM、LMM)の推論ワークロードにおいて、総所有コストを低減し最適化されたパフォーマンスを発揮するとされる。 また、「Qualcomm AI250」はニアメモリコンピューティングに基づいたメモリアーキテクチャを搭載し、実効メモリ帯域幅を10倍以上向上させつつ消費電力を大幅に削減。AI推論ワークロードの効率とパフォーマンスを飛躍的に向上させるという。どちらのラックソリューションも熱効率を高める直接液体冷却を採用、ラックレベルでの消費電力は160kWとされる。 なお、QualcommはAIアクセラレータと合わせてサウジアラビアの政府系AI新興企業であるHumainとの提携を発表。「Qualcomm AI200」および「Qualcomm AI250」のラックソリューションを200MW規模で導入する予定という。
Qualcomm Unveils AI200 and AI250—Redefining Rack-Scale Data Center Inference Performance for the AI Era