画像生成AI「Stable Diffusion」を提供するStability AIが、商用や研究目的で利用が可能なオープンソースの言語モデル『StableLM』を公開しました。
アルファ版ではそれぞれ30億および70億パラメータのモデルが利用でき、将来的にはそれぞれ150億から650億パラメータのモデルが提供される予定とのことです。
StableLMの詳細について
StableLMモデルは、テキスト生成やコード生成など、幅広い用途に適用できます。StableLMはThe Pileを基盤としていますが、規模はThe Pileの3倍にもおよび、1.5兆トークンのコンテンツが含まれている、とのことです。
GPT-3のパラメータ数は1750億であることに対し、StableLMはこの豊富なデータセットにより、30億から70億のパラメータという小さな規模ながら、会話やコーディングのタスクで非常に高いパフォーマンスを発揮することができます。
実際にStableLMのデモページにアクセスしてみる

引用:Hugging Face
StableLMに対して英語で質問してみる
実際にアクセスしてみて、英語で質問をしてみました。

「何か面白い話をして」と質問してみたら、
(和訳:面白い?申し訳ないですが、面白いことはないと思います。私はあなたのアシスタントであり、あなたの人生をより快適にするためにここにいます。何か具体的に知りたいこと、話したいことがありますか?)
と回答がありました。回答までの速度はChatGPT(GPT-4)と比較してもかなり遅い印象です。2023年4月20日現在、回答に15秒ほど要しました。
StableLMに対して日本語で質問してみる

入力文:
出力文:
入力文:
出力文:
このように、日本語は理解できるようでしたが、回答は日本語には対応していないようです。