不得不说,现在开源 AI 模型的发展速度,正在变得越来越快!就在前两天,一款名为 Qwythos-9B-Claude-Mythos-5-1M 的全新开源推理模型悄然发布,并迅速引起了本地 AI 社区的广泛关注。
与传统开源模型不同,Qwythos-9B 最大的亮点在于它吸收了大量来自 Claude Mythos 和 Claude Fable 的高质量推理轨迹,并通过专门的后训练技术,将这些推理能力迁移到一个仅有 9B 参数的开源模型之中。

更令人惊讶的是,它不仅支持超过 104 万 Token 的超长上下文窗口,同时还提供 GGUF 量化版本,最低仅需 4GB 显存即可本地部署运行。
那么这款被誉为“Claude Mythos 开源平替”的模型究竟表现如何?本文将带大家深入了解这款近期爆火的开源推理模型。
什么是 Qwythos-9B?
Qwythos-9B 是一个基于 Qwen3.5-9B 架构训练的全参数推理模型。
开发团队 Empero AI 在深度未审查版本的 Qwen3.5-9B 基础上,使用超过 5 亿条高质量 Claude Mythos 与 Claude Fable 推理轨迹进行了后训练。
这些推理轨迹并非简单问答数据,而是包含完整思维链(Chain of Thought)的高质量推理过程,其逻辑链由 Empero AI 内部的 rethink 系统自动生成。
简单来说,你可以把它理解为:
将 Claude Mythos 的推理思维方式迁移到了一个仅有 9B 参数的开源模型之中。
最终得到了一款兼顾推理能力、部署成本以及长上下文能力的新型开源模型。
本地部署要求
Qwythos 已提供 GGUF 格式。
可通过:
- llama.cpp
- llama-server
- OpenWebUI
- Cherry Studio
- OpenClaw
等工具直接运行。
不同量化版本对应显存需求如下:
| 显存 | 推荐量化 |
|---|---|
| 4GB | Q4_K_M |
| 6GB | Q5_K_M |
| 8GB | Q6_K |
| 12GB | Q8_K_M |
| 16GB | BF16 |
| 24GB | MTP-BF16 |
如果使用 BF16 全精度版本,则建议至少配备 24GB 显存。
部署教程:
1、下载Qwythos模型
【Huggingface】或 【打包下载】

2、安装llama.cpp
下载方式:GitHub 下载【点击前往】、或【备用下载】、【网盘下载】 内含启动脚本

3、一键启动脚本:
或者复杂下方的代码自行保存为BAT脚本
@echo off
setlocal EnableDelayedExpansion
chcp 936 >nul
title LingDu AI - Qwythos Launcher
color 0A
cd /d "%~dp0"
:: =====================================================
:: 自动查找模型
:: =====================================================
set MODEL=
set MMPROJ=
for %%F in (models\Qwythos*.gguf) do (
echo %%~nxF | find /I "mmproj" >nul
if errorlevel 1 (
set MODEL=%%F
)
)
for %%F in (models\mmproj*.gguf) do (
set MMPROJ=%%F
)
:MENU
cls
echo.
echo ============================================================
echo.
echo LingDu AI - Qwythos Launcher
echo.
echo Claude Mythos 5 Distilled Vision Model
echo.
echo ============================================================
echo.
if defined MODEL (
echo Model Found:
echo !MODEL!
) else (
echo Model Found:
echo NOT FOUND
)
echo.
if defined MMPROJ (
echo Vision Projector:
echo !MMPROJ!
) else (
echo Vision Projector:
echo NOT FOUND
)
echo.
echo ============================================================
echo.
echo Select Your GPU VRAM
echo.
echo [1] 4GB VRAM
echo Recommended Context: 16K
echo.
echo [2] 6GB VRAM
echo Recommended Context: 32K
echo.
echo [3] 8GB VRAM
echo Recommended Context: 64K
echo.
echo [4] 12GB VRAM
echo Recommended Context: 128K
echo.
echo [5] 16GB VRAM
echo Recommended Context: 256K
echo.
echo [6] 24GB VRAM
echo Recommended Context: 512K
echo.
echo ------------------------------------------------------------
echo.
echo OpenAI Compatible API
echo.
echo http://127.0.0.1:8080/v1
echo.
echo ------------------------------------------------------------
echo.
echo Supported Clients
echo.
echo OpenWebUI
echo Cherry Studio
echo Claude Code
echo OpenAI Codex
echo OpenClaw
echo.
echo ------------------------------------------------------------
echo.
echo [0] Exit
echo.
echo ============================================================
set /p choice=Select Option:
if "%choice%"=="1" (
set CTX=16384
set MODE=4GB
goto START
)
if "%choice%"=="2" (
set CTX=32768
set MODE=6GB
goto START
)
if "%choice%"=="3" (
set CTX=65536
set MODE=8GB
goto START
)
if "%choice%"=="4" (
set CTX=131072
set MODE=12GB
goto START
)
if "%choice%"=="5" (
set CTX=262144
set MODE=16GB
goto START
)
if "%choice%"=="6" (
set CTX=524288
set MODE=24GB
goto START
)
if "%choice%"=="0" exit
goto MENU
:START
cls
echo.
echo ============================================================
echo.
echo Starting Qwythos...
echo.
echo Mode:
echo %MODE%
echo.
echo Context:
echo %CTX%
echo.
echo Model:
echo !MODEL!
echo.
echo Vision:
echo !MMPROJ!
echo.
echo API:
echo http://127.0.0.1:8080/v1
echo.
echo ============================================================
echo.
if not defined MODEL (
echo ERROR:
echo No Qwythos model found in models folder.
echo.
pause
goto MENU
)
if not defined MMPROJ (
echo WARNING:
echo No mmproj found.
echo Starting as text-only model.
echo.
llama-server.exe ^
-m "!MODEL!" ^
-ngl 999 ^
-c %CTX% ^
-n 8192 ^
-fa on ^
--cont-batching ^
--host 127.0.0.1 ^
--port 8080
pause
goto MENU
)
llama-server.exe ^
-m "!MODEL!" ^
--mmproj "!MMPROJ!" ^
-ngl 999 ^
-c %CTX% ^
-n 8192 ^
-fa on ^
--cont-batching ^
--host 127.0.0.1 ^
--port 8080
pause
goto MENU
下载后将其进行解压,然后在根目录下创建一个新的文件夹,将其命名为 models,作为接下来存放模型的地方。
官方性能提升数据
根据开发团队公布的数据,在多个基准测试中,Qwythos 相比原始 Qwen3.5-9B 获得了显著提升。
MMLU
衡量模型知识理解能力的重要指标。
Qwythos 相比基础模型提升:
+34 分
GSM8K Strict
数学推理能力测试。
提升:
+30 分
GSM8K Flex
复杂数学与逻辑推理测试。
提升:
+19 分
对于一个仅有 9B 参数的模型来说,这样的提升幅度已经相当可观。
最大亮点:104 万 Token 上下文
Qwythos 最吸引人的地方并不是跑分。
而是其默认启用了 YaRN 长上下文扩展技术。
开箱即用即可支持:
1,048,576 Token
也就是:
104 万 Token
这是什么概念?
普通大模型通常仅支持:
- 8K
- 32K
- 64K
- 128K
上下文窗口。
而 Qwythos 理论上能够处理:
- 整个项目代码仓库
- 超长研究论文
- 多本电子书
- 长时间运行的 AI Agent 工作流
对于程序员而言,可以直接分析完整项目代码。
对于研究人员来说,可以一次性处理海量文档资料。
对于 AI Agent 来说,则意味着更长的记忆能力与更复杂的任务执行链条。
支持原生 Function Calling
除了推理能力之外,Qwythos 还支持符合 Qwen3.5 标准的原生 Function Calling。
这意味着:
- 无需额外插件
- 无需特殊微调
- 无需额外封装
即可直接调用外部工具。
例如:
- Python 执行器
- Web Search
- 数据分析工具
- Agent 系统
开发团队测试显示,在接入工具后,Qwythos 可以实现自我验证与自我纠错,从而显著提高答案准确率。
支持视觉识别
目前官方已经发布视觉版本。
模型包含:
Qwythos-9B-Claude-Mythos-5-1M
以及对应的视觉投影文件:
mmproj-Qwythos-9B-Claude-Mythos-5-1M-F16
部署后即可实现:
- 图片分析
- OCR 识别
- 图表理解
- 界面截图分析
- 多模态问答
对于本地 AI 用户来说,无需联网即可实现基础视觉能力。
实际体验如何?
经过简单测试,Qwythos 给人的第一印象非常接近 Claude 系列模型的风格。
主要体现在:
- 推理过程更加完整
- 逻辑链条更清晰
- 长文本分析能力优秀
- 工具调用表现稳定
尤其是在复杂逻辑推理和代码生成场景中,表现明显优于许多同级别 9B 模型。
当然,104 万 Token 更多属于理论上限。
对于普通用户而言:
32K ~ 128K 上下文已经足以满足绝大多数使用场景。
总结
Qwythos-9B-Claude-Mythos-5-1M 可以说是近期最值得关注的开源推理模型之一。
它不仅拥有 Claude Mythos 风格的推理能力,还提供:
- 104 万 Token 上下文
- 原生 Function Calling
- Vision 多模态能力
- GGUF 本地部署支持
- 最低 4GB 显存运行
如果你正在寻找一款兼顾推理能力、长上下文以及本地部署体验的开源模型,那么 Qwythos-9B 非常值得尝试。
接下来我也会继续测试它在代码生成、AI Agent、长文本分析以及实际生产力场景中的表现,感兴趣的朋友可以关注后续更新。






