東京工業大学や富士通など、スパコン「富岳」を活用して生成AIを構築中

2023年5月22日、富士通と東京工業大学を中心に、2023年度にスーパーコンピュータ「富岳」を活用した先進的な生成AIの構築が進行中であることが公表されました。

日本独自の基盤技術として、日本語の深い理解に基づいたAIを構築し、24年度より無償で国内企業へ提供する予定です。米国のOpenAIが開発したChatGPTに世界が注目する中、日本の産学界は自身のテクノロジーで対抗する計画です。

理化学研究所や東北大学も参画

この生成AI開発プロジェクトには、理化学研究所や東北大学等も名を連ねています。共同開発では大規模な言語モデルの開発に挑戦し、このモデルはAIが学習するための基盤となるものです。

学習のためには、Wikipediaなどの公開されている日本語のWebデータを利用し、日本語の対話能力を強化することを図っています。さらに、自社開発の生成AIを目指す企業として知られるサイバーエージェントも共同開発に参加します。

関連記事

サイバーエージェントが社内新人スタッフの適切な部署割り当てを補助するAIツール、「ミカエル」を導入したと発表した。ビジネス職の新人約170名の部署配置にこの春より活用し始めている。これまで100以上の部署と新入社員の間の仲介役を務めていた[…]

巨大なパラメーター数を持つモデルの開発

日本でも生成AIの開発は行われていますが、例えばサイバーエージェントが最近公開した大規模言語モデルも最大で68億程度に留まるなど、パラメータ数は現状数十億程度で止まっています。

しかし今回の開発では東京工業大学を中心に、ChatGPTの基礎となる「GPT-3」が持つ1750億に迫る約1000億のパラメータ数を持つ大規模言語モデルの構築を進めています。

スーパーコンピュータ「富岳」の活用

大規模な言語モデルの構築には、高度な計算力を持つスーパーコンピュータが必須です。しかし、現在日本の民間企業が所有しているスーパコンピュータは、全世界との競争力を持つ機種が少ないのが現状です。

そこで、世界ランキング2位のスーパーコンピュータ「富岳」を運用する理化学研究所などが、生成AIの開発を新たな重点テーマに掲げ、その開発成果となる大規模言語モデルを産業界や研究機関が利用できるように公開する計画です。

富岳は、生成AIの学習に適した画像処理半導体(GPU)は搭載していませんが、他の国内AI専用スーパーコンピュータと比較しても、高性能のCPUが多数搭載されており、AI開発においても性能が優れていることから「富岳」の活用が決定されました。

今後の展望

OpenAIなどの海外AI企業は、学習済みのAIを外部企業に提供することが多いですが、今回のプロジェクトでは、東京工業大学などが開発する大規模言語モデルそのものを公開し、日本企業が自社のデータを使って学習させ、独自の生成AIを開発することを可能にする方針を発表しています。

関連記事:

関連記事

引用:東京工業大学 世界中で大きな議論を呼んでいる生成系AIの大学におけるレポート課題などへの使用について、東京工業大学が指針と注意事項をまとめた声明を発表しました。 生成系AIに対する東京工業大学の指針 本学[…]