Qwenとは？Alibabaが公開する高性能なローカルLLM｜Qwen 3.5・3.6の特徴・性能・始め方を徹底解説

2026-05-242026-05-25

Qwen（通義千問、つういせんもん）は、中国Alibaba Cloudが開発・公開しているオープンモデルです。2026年5月時点ではAPI限定の「Qwen 3.7 Max」、オープンウェイト最新の「Qwen 3.6」「Qwen 3.5」など、世界トップクラスの性能を持つラインナップが揃っています。

「ローカルで動かせる高性能なモデルが欲しいけれど、LlamaやGemmaでは物足りない」と感じている方にこそ、Qwenは検証する価値があります。Apache 2.0ライセンスで配布されているため、商用利用の制約も最小限です。

本記事ではローカルで実用的に使えるQwen 3.5・3.6を中心に、Qwenの基本、性能、Ollamaを使った最短実行手順、GemmaやLlamaとの比較、活用例までを一気に解説します。記事末尾では最新のQwen 3.7 Maxの動向も触れます。

AI実装スキルを磨きたい人へ

これからのAI時代に 「市場価値の高い人材」 とは、「モデルを使える人」ではなく 「業務に組み込んで価値を出せる人」 です。AI実装＋エンジニアリング＋業務理解の三点セットを磨くことが、5年後・10年後のキャリアに直結します。

※以下、PRを含みます

▶ AI実装に強くなれるオンラインスクールを見る

Qwenとは？Alibabaが開発したオープンモデルファミリー

通義千問（Qwen）の概要

Qwenは、Alibaba CloudのAI研究部門が開発しているモデルファミリーの総称です。2023年の初代Qwenから、Qwen 2、Qwen 2.5、Qwen 3、Qwen 3.5、Qwen 3.6、そして2026年5月にプレビュー公開されたQwen 3.7 Maxまで、驚異的なスピードで進化を続けています。

中国製モデルというと「中国語専用」というイメージを持たれがちですが、Qwenは201言語をサポートし、日本語性能でも他のオープンモデルに引けを取りません。最大256Kトークンの長大なコンテキストにも対応しています。

Qwenファミリーの派生モデル

Qwenには汎用モデル以外にも、用途特化の派生モデルが多数あります。

Qwen-Coder: コード生成・補完に特化
Qwen-Math: 数学的推論に特化
Qwen-VL: 画像理解（マルチモーダル）
Qwen-Audio / Qwen-TTS: 音声入出力
Qwen-Omni: テキスト・画像・音声統合

思考モード（Thinking Mode）の搭載

Qwen 3以降の大きな特徴が、複雑な推論に強い「Thinking Mode」と高速応答の「Non-Thinking Mode」を切り替えられる点です。OpenAIのo1やDeepSeek-R1と同様の推論モードを、オープンモデルで自由に試せます。

Qwenのバージョン進化｜オープンウェイト最新は3.6

Qwen 3｜2025年4月の実績モデル

2025年4月にリリースされたQwen 3は、初めて思考モードを搭載した世代です。0.6B〜32BのDense型と、30B-A3B・235B-A22BのMoE（混合エキスパート）型をラインナップ。今でも安定して動く定番モデルです。

Qwen 3.5｜2026年3月、長文・多言語が大幅強化

2026年2月16日に397B-A17B（active 17B）が先行公開され、3月2日までに0.8B〜397Bの全サイズが順次リリースされたQwen 3.5は、262K native（9Bは1M拡張）・201言語対応を実現し、日本語の回答品質も大きく向上しました。ノートPCから本格GPUまで幅広く対応できます。

Qwen 3.6｜2026年4月、オープンウェイト最新

2026年4月のQwen 3.6シリーズは、35B-A3B（4月16日）と27B Dense（4月22日）がオープンウェイトで提供されています。Qwen3.6-27Bは397BのMoEモデルを上回るエージェントコーディング性能を示すなど、サイズの割に強力です。

Qwen 3.7 Max｜2026年5月、API限定のPreview

2026年5月19日にAPI公開、5月20日に正式発表された最新のフラッグシップがQwen 3.7 Maxです。100万トークンのコンテキスト、拡張思考モードを備え、Artificial Analysis Intelligence Indexで56.6点と中国モデル1位、Gemini 3.5 Flashを上回るスコアを記録しています。ただし現時点ではAPI限定のPreview版で、オープンウェイトは未公開です。

ローカル運用ならどれを選ぶ？

オープンウェイトが必要なローカル運用では、安定動作のQwen 3.5または最新のQwen 3.6が現実的な選択肢です。最新性能を試したいなら、Alibaba CloudのAPI経由でQwen 3.7 Maxを使うルートもあります。

Qwen 3.5・3.6の性能｜オープンモデル最上位クラス

ベンチマークでの位置付け

Qwen3-235B-A22BやQwen3.5-397Bは、コーディング能力（LiveCodeBench）や数学（AIME 2024）、汎用推論（MMLU）など主要ベンチマークでGPT-4oやGemini 2.5 Proに迫る、もしくは凌駕するスコアを記録しています。

中規模のQwen3.6-27Bですら、Llama 3.3 70BやGemma 3 27Bを上回るベンチ結果を出しており、家庭用GPU環境でクラウド級の性能を引き出せます。

コード生成・数学・推論に強い

Qwenシリーズは伝統的にコード生成と数学に強く、専用派生モデル「Qwen2.5-Coder」「Qwen2.5-Math」も公開されています。エンジニア向けのアシスタント用途では、第一の選択肢になり得る性能です。

日本語応答品質

Qwen 3.5 / 3.6 の14B以上では、日本語の自然さがChatGPT 3.5を上回るレベルに到達しています。社内チャットボットや日本語ドキュメント要約など、実務に投入できる品質です。

Qwenで何ができる？代表的な活用シーン

1. ローカル動作の高性能チャットボット

クラウドAPIに頼らず、社内サーバーで動かせる高性能チャットボットの構築に最適です。Qwen3.5-14BやQwen3.6-27Bあたりが性能とハードウェア要件のバランスが良く、おすすめの選択肢です。

2. コーディングアシスタント

VS Codeの「Continue.dev」と組み合わせれば、ローカル版GitHub Copilotとして動作します。Qwen2.5-Coderの32BモデルはGPT-4o相当のコード生成品質があり、機密コードを扱う案件で重宝されています。

3. 多言語翻訳・ローカライズ

201言語に対応するため、翻訳タスクや多言語ローカライズの一次出力を自動化できます。中国市場向け展開がある企業では、Qwenは特に有力な選択肢になります。

スクロールできます

フリーランスエンジニア向け案件検索サイト。複数エージェントの案件を一括検索／登録無料

4. RAGの推論エンジン

LangChainやLlamaIndexを使ったRAGシステムの中核モデルとして、Qwenは安定したパフォーマンスを発揮します。256Kトークンの長文コンテキストを扱えるため、大規模文書の質問応答にも対応します。

5. エージェントワークフローの自動化

Qwen 3以降はTool Useやfunction callingに対応しているため、AutoGenやLangGraphと組み合わせてエージェントを構築可能です。社内SaaSの自動操作や定型業務の自動化に組み込めます。

6. ファインチューニングによる業界特化

オープンウェイトのため、Hugging FaceのPEFT（LoRA）でファインチューニングが容易です。医療・法務・製造などの業界特化モデルを自社で構築する案件で活用されています。

7. マルチモーダルなコンテンツ理解

Qwen-VLを使えば、画像の内容説明やOCRが行えます。Qwen-Audio・Qwen-TTSと組み合わせれば、音声入出力対応のAIアシスタントも構築可能です。

Qwenを試す3つの方法

方法1: ブラウザで即試す（Qwen Chat）

一番手軽なのは公式のWebアプリ「Qwen Chat」（chat.qwen.ai）です。アカウント登録なしでも基本のチャット機能が使え、最新モデルを無料で体感できます。

方法2: ローカルで動かす（Ollama）

開発機やオンプレで動かしたいならOllamaが最短ルートです。詳細手順は次章で解説します。

方法3: クラウドAPIで使う（Alibaba Cloud DashScope）

Qwen 3.7 Maxなどの最新フラッグシップを試したい場合や、自前GPUを持たずに本番運用したい場合は、Alibaba CloudのDashScope経由でAPI利用するのが現実的です。

Qwenの始め方｜Ollamaを使う最短手順

1. Ollamaをインストール

公式サイトからOllamaのインストーラーを取得し、各OS（macOS / Windows / Linux）に合わせて導入します。インストール後はollamaコマンドが使えるようになります。

2. Qwenのモデルをダウンロード

ターミナルで以下のコマンドを実行すれば、Qwen3-8Bが即座に動きます。Qwen 3.5や3.6を試したい場合はタグを変更してください。

# Qwen 3 (定番)
ollama run qwen3:8b

# Qwen 3.5 (2026年3月版)
ollama run qwen3.5:8b

# Qwen 3.6 (2026年4月最新)
ollama run qwen3.6:27b

3. Pythonから呼び出す

OllamaはHTTPサーバーとして起動するため、Pythonからは以下のように利用できます。

import requests
res = requests.post('http://localhost:11434/api/generate', json={
    'model': 'qwen3.5:8b',
    'prompt': 'データエンジニアの定義を300字で'
})
print(res.json()['response'])

OpenAI互換APIにも対応しているため、ChatGPT用に書いたコードがほぼそのまま動きます。

4. LM Studioで対話的に使う

GUIで使いたい場合はLM Studioが便利です。検索バーで「qwen」と入力するだけでモデル一覧が表示され、ワンクリックでダウンロード・対話できます。

Qwen・Llama・Gemmaを比較する

ライセンスの自由度

モデル	ライセンス	商用利用	制約
Qwen 3.5 / 3.6	Apache 2.0	可	最も自由
Llama 3.3	Llama 3 Community License	可	MAU 7億超で制限
Gemma 3	Gemma Terms	可	禁止用途あり

Apache 2.0は最も制約の少ないライセンスで、Qwenは商用化・改変・再配布が自由です。Llamaはサービス規模の制限があり、Gemmaは禁止用途が明文化されています。

性能とハードウェア要件

汎用ベンチマークでは、同サイズ帯ではQwen 3.5 / 3.6 > Gemma 3 > Llama 3.3 の順で性能が高い傾向があります。ただし、用途や言語によってベストモデルが変わるため、最終判断は実際に試した結果を基準にするのが確実です。

中国製モデルへの考慮

Qwenは中国Alibabaが開発しているため、企業によっては「中国製AIの利用方針」と照らし合わせる必要があります。完全オンプレで運用すれば外部通信は発生しませんが、組織のセキュリティポリシーを事前に確認しましょう。

Qwenを使うときの注意点

モデルサイズと性能のトレードオフ

Qwen3.5-397Bは強力ですが、本格的なGPU環境（A100 80GB×複数枚など）が必要です。コストとパフォーマンスのバランスを取るなら、Qwen3.5-14BやQwen3.6-27Bが現実的な選択肢になります。

ハルシネーション対策

高性能なQwenでも、もっともらしい誤情報を生成することがあります。重要な業務に組み込む場合は、RAGで根拠文書を参照させたり、人間によるレビュー工程を必ず挟みましょう。

中国製AIに関する組織方針

業種や顧客との契約によっては、中国製AIの利用が制限される場合があります。利用前に法務・情報セキュリティ部門と相談し、自社の方針と整合性を確認することが大切です。

バージョン進化が速い点に注意

Qwenは数ヶ月単位で新バージョンが出ます。本番運用ではバージョンを固定し、評価指標を定めてから移行する運用が安全です。

まとめ｜ローカルで動かせる最高峰のオープンモデル Qwen を試そう

Qwenは、Apache 2.0という最も自由なライセンスで配布されながら、世界トップクラスの性能を持つオープンモデルです。コード生成・数学・推論・多言語対応の総合力では、現時点で他のオープンモデルを上回る場面が多くあります。

ローカル運用なら、安定のQwen 3.5かオープンウェイト最新のQwen 3.6が現実解。最新の性能を試したいなら、Alibaba Cloud APIでQwen 3.7 Maxを触ってみる選択もあります。

まずはQwen Chatでブラウザから手応えを確かめ、必要に応じてOllamaでローカル運用へ、さらにAPIで本番利用へとステップアップしていく進め方がおすすめです。