「QwQ-32Bって何?」
「他のAIモデルと何が違うの?」と悩んでいる方も多くいらっしゃるのではないでしょうか。
QwQ-32Bは高い計算効率を誇る中国の最新大型言語モデルです。
本記事ではQwQ-32Bの概要・特徴、開発背景、ベンチマーク、利用方法、法人導入のメリット、今後の展望について詳しく説明しています。
また、Promptyオリジナルで実際に利用し、性能を検証したのでぜひ最後までご覧ください。
QwQ-32Bとは
QwQ-32Bは、Alibabaが開発した最新の大型言語モデル(LLM)です。
QwQ-32Bのパラメータ数は320億ですが、6170億のパラメータ数を持つDeepSeek-R1と同じレベルの性能を実現したとされています。
QwQ-32Bの開発は、従来のLLMが複雑な推論タスクで直面する課題を解決するために行われました。
従来のLLMは、大量のテキストデータを用いた学習によって訓練されることが一般的であり、流暢な文章を生成できる一方で、論理的な推論や複座ルナ問題解決には限界がありました。
この課題に対して、強化学習を用いた開発を強化することで、より正確な推論プロセスや効果的な問題解決を行うことができるようになったのがQwQ-32Bです。
QwQ-32Bの特徴
ここではQwQ-32Bの特徴を説明します。
①パラメータ数と性能 | 320億のパラメータ、高い計算効率 |
②学習方法 | 多段階の強化学習 |
③能力 | 数学、プログラミング、エージェントなど多数の性能 |
①パラメータ数と性能
QwQ-32Bは320億のパラメータ(AIが持つ学習済みのデータ量)を持っています。
パラメータ数が比較的少ないにもかかわらずDeepSeek-R1と同等の性能を発揮できるため、高い計算効率を誇ります。
その結果、必要な計算リソースを大幅に抑えつつ、高度な推論やタスク処理が可能になり、コスト削減や軽量なデバイスでの運用にも適しています。
②学習方法
QwQ-32Bは多段階の強化学習(Reinforcement Learning)を採用しています。
第一段階では数学の問題を解いたり、プログラミングのコードを書くことで数学とコーディングの強化を行います。
第二段階では一般的な能力向上のために、AIの答えが正しいかを評価する「ルールベースの検証システム」を活用し、問題解決力を向上させます。
③能力
QwQ-32Bは数学的推論、コーディング能力、一般的な問題解決、指示に従う能力、人間の好みに合わせる能力、エージェント性能(ツール利用や環境フィードバックを含む)に優れています。
④オープンソースであること
QwQ-32BはオープンソースのLLMであり、ソースコードはHugging faceで公開されています。
そのため、各企業の活用方法に特化させて開発を行うことができ、柔軟性高く活用することができます。また、ローカル環境下で構築できる特性上、機密情報の流出などのセキュリティリスクを抑えることができます。
QwQ-32Bの性能
QwQ-32Bは以下のベンチマークで評価されました。

参考:Qwen
①AIME24
AIME24は数学の推論能力をテストするベンチマークで、AIが数学の問題をどれだけ正確に解けるかを評価します。
QwQ-32BはDeepSeek-R1と同等の性能を記録しています。
②LiveCodeBench
LiveCodeBenchはプログラミングのコードを書く能力をテストし、どれだけ正しく、効率的なコードを生成できるかを評価します。
QwQ-32BのスコアはDeepSeek-R1より少し低いですが、他のモデルよりは優秀な結果を残しました。
③LiveBench
LiveBenchは一般的なタスクに対するAIの推論能力や、質問への正確な回答力を評価します。
QwQ-32Bが最も優れた結果を残しました。
④IFEval
IFEvalは論理的な推論や一般知識に基づく問題解決能力をテストします。
DeepSeek-R1を上回りましたが、ChatGPT-o1 miniには劣る結果となりました。
⑤BFCL
BFCLはAIがどれだけ正確に複雑なタスクをこなせるかを測定します。
QwQ-32Bのスコアが他モデルよりも大幅に上回り、最高のスコアを記録しました。
QwQ-32Bを実際に使ってみた
QwQ-32Bを実際に利用して性能をテストしました。
以下が結果です。
①コーディング
ユーザーが名前を入力したらパーソナライズされた挨拶をしてくれるウェブページの作成を依頼しました。



実際にコードを書き、ウェブページを作成できました。
②論理的推論力
次に論理的推論力を試すため、以下の質問をしました。
「部屋には3つの電球があり、部屋の外には3つのスイッチがあり、それぞれ1つの電球を操作できます。部屋には1回しか入ることができません。どのスイッチがどの電球を操作しているかをどうやって判別しますか?」


結果、さまざまな選択肢を考慮し、最終的に正しい答えに辿り着くことができました。
③SVGコード
SVGコードとは画像を表示するために使われるコードです。
QwQ-32Bに左右対称の羽を持つ蝶々のSVGコード生成を依頼しました。


結果、左右対称ではあるものの、蝶々の形ではない画像が生成されました。
そのため、QwQ-32Bはまだ正確にSVGコードの作成ができないと言えます。
④数学的推論力
数学的推論力を試すために以下の質問をしました。
「列車Aは午後2時に駅Aを出発し、時速60kmで進みます。もう一方の列車Bは午後3時に駅Bを出発し、駅Aに向かって時速90kmで進みます。駅Aと駅Bの距離が300kmの場合、2つの列車はいつすれ違いますか?」


結果、正しい計算を行い答えを出すことができました。
⑤数学的問題解決力
次に、シンプルな数学の問題を解けるか試すため、以下の質問をしました。
「2、6、12、20、30に続く数字は?」


結果、正しい答えを出すことができました。
QwQ-32Bの利用方法
現在QwQ-32Bは二つのサイトから利用可能です。
①Hugging Face Spaces
Hugging Face Spacesのサイトにアクセスし、画面下にある枠にプロンプトを入力することで利用できます。

②Qwen Chat
Qwen Chatのサイトにアクセスし、「QwQ-32B」を選択することで利用できます。

QwQ-32Bの今後の展望
オープンソースの性質上、コミュニティからの貢献が期待され、さらに多くの派生モデルや応用が生まれる可能性が期待されています。
また、QwQ-32BはApache 2.0ライセンスで公開されており、商用利用が可能です。
これにより、企業のAI導入コストを大幅に削減し、AIエコシステムの拡大に寄与すると考えられます。
まとめ
今回はQwQ-32Bについて詳しく説明しましたが、いかがだったでしょうか。
以下が本記事の簡単なまとめです。
- 高性能で効率的:少ないパラメータで高い計算能力を発揮し、数学やプログラミングに強い
- 実用テストの結果:推論や数学は正確だが、SVGコード生成には課題あり
- 企業向けの利点:低コスト・高カスタマイズ性・セキュリティ強化が可能
QwQ-32Bは、今後のAI活用において新たな選択肢を提供し、さまざまな分野での活用が期待されます。