Qwenシリーズ、アリババクラウド(阿里巴巴雲)によって開発された大規模言語モデル(LLM)です。
2025年1月29日には、本シリーズの最新モデルである「Qwen2.5-MAX」がQwen chat上で公開されました。
今回PROMPTYでは、Qwenシリーズとその最新モデルであるQwen2.5-MAXの特徴や性能について実際に使いながら徹底解説します。
ぜひ最後までご覧ください。
Qwenとは
Qwenは、アリババクラウド(阿里巴巴雲)によって開発された大規模言語モデル(LLM)です。
2023年4月にベータ版が初公開され、アリババの各種サービス(企業向けチャットツール「釘釘(DingTalk)」や音声アシスタント「天猫精霊(Tmall Genie)」など)への統合が進められました 。
開発の背景には、ChatGPTをはじめとする生成AIの台頭があり、アリババは自社エコシステム全体の「知的変革」を加速させる基盤としてQwenを位置づけています。
当時のアリババグループCEO(クラウド部門CEOを兼任)の張勇(ダニエル・チャン)氏は「生成AIとクラウドがもたらす技術の分水嶺に立っており、あらゆる業界でビジネスがインテリジェント化を模索している」と述べ、「コンピューティングとAIサービスを企業や開発者により身近で手頃なものにしていく」との方針を示しました。
このようにQwenは、アリババのクラウドサービスを通じて企業ユーザーや開発者に提供され、自社データでのチューニングやカスタムAI機能の構築も可能なプラットフォームとなっています
Qwen2.5-MAXはQwenシリーズの最新モデル
Qwen2.5-Max(阿里巴巴クラウドの大型言語モデル)は、Mixture-of-Experts (MoE) アーキテクチャを採用した最先端モデルです。
約20兆トークンもの大規模データで事前学習され、追加の教師あり微調整と人間のフィードバックによる強化学習(RLHF)を経て開発されています。
Qwen2.5-MAXのベンチマーク評価
最新のベンチマークでは、Qwen2.5-Maxは多数の指標で極めて高い性能を記録しています。

引用:Qwen
MMLU(大学レベルの知識問題)など、複数のベンチマークテストにおいて、OpenAIの「GPT-4o」や「DeepSeek-V3」を上回る結果となっています。
また、Arena-Hard(人間の好む応答傾向を評価)やLiveBench(多様なタスクの総合評価)、LiveCodeBench(対話的コーディング評価)でも高い結果を記録しています。

引用:Qwen
総じて、Qwen2.5-Maxは総合的な知能・汎用性において最新鋭のモデルの一つと言えます。
Qwenシリーズの特徴
Qwenは上述の性能面に加え、ビジネス活用において以下のような強みを持っています。
①高度な推論・コーディング能力
Qwenは基盤モデルとしての汎用的な言語処理能力に優れるだけでなく、数学問題の解答やプログラミング支援など論理的推論が要求されるタスクにも強みを持ちます。
例えばQwen2.5-72B-Instructモデルは数学ベンチマーク「MATH」で83.1点を獲得し、従来モデルから大幅にスコアを向上させています 。またコーディング試験においても高い正確性を示し、コード自動生成やデバッグの提案など開発支援AIとして活用できる水準です。
②大容量コンテキストと長文処理
Qwenシリーズの一部モデルは極めて長い文章や大量のドキュメントを一度に処理可能です。例えば商用版のQwen-Plusでは最大13万字程度(約131,072トークン)の入力コンテキストを扱えます。
企業内の大型レポートや複数文書に跨る分析、長時間の会議記録の一括要約など、人手では困難な長文処理をAIで行えるようになります。長大な履歴を持つチャットにおいても、文脈を途切れさせずに一貫した応答を生成でき、複雑なプロジェクトのサポートや長期的な対話型AIとして活用できます。
③マルチモーダル対応
Qwenはテキスト以外のデータも扱える点でビジネス活用の幅を広げています。
Qwen-VLは画像を入力として受け取り、そこに含まれる文章や物体を認識したり、画像に基づく質問に答えたりできます、コールセンターの自動応答や音声アシスタントへの組み込みといった応用が可能です。さらに最新版のQwen2.5-Maxではウェブ検索能力や画像・動画生成能力まで備えており、テキスト入力から直接グラフやデザイン画を生成するといった高度な機能も実現しつつあります。
・WEBブラウジング機能

・画像生成

マルチモーダル対応により、ビジネスの現場に存在する様々なデータソースを統合的にAI処理できる強みがあります。
④オープンソース
Qwenは企業固有のニーズに合わせてカスタムモデルを構築しやすいよう設計されています。アリババクラウド上ではユーザー企業が自社データや業種特化データを用いてQwenを微調整(ファインチューニング)できるサービスが提供されており、自社データをクラウド上の隔離環境で学習させて専用AIを構築可能です。
加えて、Qwenの主要モデル(7Bや14Bなど)はオープンソースで公開されており、開発者や商用クライアントはライセンスの範囲内で無料でモデルを入手・利用できます。
これはソース非公開の米国製LLMにはない利点で、企業が自社サーバー環境にモデルをデプロイしてデータを外部に出さずに運用したり、モデル内部を検証・改良したりできます。
実際に米国スタートアップのAbacus AI社がQwenを改変・チューニングした独自モデルを発表するといった事例も生まれています。
商用利用で月間1億ユーザー超となる場合、ライセンス規約でアリババへの申請が義務付けられているため、注意してください。
⑤安価な費用
同じ中国AI企業である、DeepSeek社の影響もあり、アリババクラウドのLLM提供価格は大幅に引き下げられています。
DeepSeek-R1のAPI利用料と比較すると相対的に高く感じますが、GPT-o1のAPI料金と比較すると安価であることが分かります。
Qwen-2.5 Maxの性能はDeepSeek-R1と比べ高いとされる報告もあることや、新興企業であるDeepSeek社には、使用における権利関係で不透明な部分も存在します。
安全性と価格を総合的に判断した際、Qwen-2.5 Maxは非常におすすめのLLMと言えます。
トークン(100万あたり) | Qwen-2.5 Max | DeepSeek-R1 | ChatGPT-o1 |
入力トークン | $1.6 | $0.55 | $15.00 |
出力トークン | $6.4 | $2.19 | $60.00 |
⑥信頼性とエコシステム統合
Qwenは中国政府の生成AIに関する指導方針に適合して開発・提供されており、法規制順守やコンテンツ安全性に配慮されています。
そのため、Apple社が中国市場向けのiPhoneに搭載するAIサービスにQwenを採用するなど、他企業からのパートナーシップも獲得しています。
アリババ自身も、自社のあらゆるアプリケーションにQwenを統合していく計画を公表しており、実際にアリババの電子商取引や物流管理、顧客対応チャットボット等でQwenを活用した事例が報告されています。
Qwenの始め方
QwenのHPにはこちらからアクセスします
下記のような画面に遷移するため、右上の”ログイン”をクリックします。

電話番号や、Googleアカウントなどでアカウントのサインアップをすれば、数分でアカウント開設ができ、すぐに使用できます。
Qwenの注意点
優れた性能と多機能性を持つQwenですが、利用にあたっていくつか注意すべき点も存在します。
①ハルシネーション発生のリスク
あらゆる生成系AIに共通する課題ですが、モデルが事実に反する回答をもっともらしく生成してしまう現象(ハルシネーション)に注意が必要です。
ユーザーから見るとAIの回答が真実なのか誤情報なのか判別が難しいこともあり、誤った情報の業務利用や意思決定のリスクがあります。
実際の業務でQwenを活用する際は、AIの出力をそのまま鵜呑みにせず、必要に応じて人間が検証・補完するプロセスを組み込むことが推奨されます。また、社内ナレッジベースとの突き合わせや、出力の根拠提示を求めるプロンプト設計など、ハルシネーションを低減する運用上の工夫も重要です。
②中国国内サーバー利用による制約
Qwenの業務利用上の懸念点は、データと規制面の問題です。
中国政府は2023年に生成AIに関する厳格な規制を施行しており、提供されるAIは「中国の社会秩序を乱す恐れのある内容」の出力を禁止されています。そのため、Qwenも政治的に敏感な話題や社会秩序を乱す恐れのある質問には回答拒否するよう対策されています。
政治思想であれば問題はありませんが、その他にも偏見などの恣意的あフィルターがかかった回答を出力する可能性が想定されます。
また、サービス上のユーザーデータ(入力プロンプトや生成結果)が中国国内のサーバーに蓄積される点についても、データ主権やプライバシーの観点から留意が必要です。中国の法律上、当局からの要請があればサービス提供企業はデータ提供や監視に協力する義務があります。
企業利用の場合は、オープンソース版を社内サーバーで動かすなど、自社の情報ガバナンスに沿った利用形態を検討することが重要です。
まとめ
今回は大規模言語モデルであるQwenとその最新モデルQwen2.5-MAXについてご説明しましたが、いかがでしたでしょうか。
以下は、本記事の簡単なまとめです。
- Qwen2.5-MAXはGPT-4oやDeepSeek-V3を上回る性能を発揮
- オープンソース系LLMであり、ローカル環境での使用が可能
- API料金も比較的安価であり、DeepSeekシリーズよりも安心して使用できる
Qwenシリーズはサービスページにアクセスすることで簡単に使用できるため、是非一度お試しください。