不得不说，现在开源 AI 模型的发展速度，正在变得越来越快！就在前两天，一款名为 Qwythos-9B-Claude-Mythos-5-1M 的全新开源推理模型悄然发布，并迅速引起了本地 AI 社区的广泛关注。

与传统开源模型不同，Qwythos-9B 最大的亮点在于它吸收了大量来自 Claude Mythos 和 Claude Fable 的高质量推理轨迹，并通过专门的后训练技术，将这些推理能力迁移到一个仅有 9B 参数的开源模型之中。

20260624102941 302730

更令人惊讶的是，它不仅支持超过 104 万 Token 的超长上下文窗口，同时还提供 GGUF 量化版本，最低仅需 4GB 显存即可本地部署运行。

那么这款被誉为“Claude Mythos 开源平替”的模型究竟表现如何？本文将带大家深入了解这款近期爆火的开源推理模型。

什么是 Qwythos-9B？

Qwythos-9B 是一个基于 Qwen3.5-9B 架构训练的全参数推理模型。

开发团队 Empero AI 在深度未审查版本的 Qwen3.5-9B 基础上，使用超过 5 亿条高质量 Claude Mythos 与 Claude Fable 推理轨迹进行了后训练。

这些推理轨迹并非简单问答数据，而是包含完整思维链（Chain of Thought）的高质量推理过程，其逻辑链由 Empero AI 内部的 rethink 系统自动生成。

简单来说，你可以把它理解为：

将 Claude Mythos 的推理思维方式迁移到了一个仅有 9B 参数的开源模型之中。

最终得到了一款兼顾推理能力、部署成本以及长上下文能力的新型开源模型。

本地部署要求

Qwythos 已提供 GGUF 格式。

可通过：

llama.cpp
llama-server
OpenWebUI
Cherry Studio
OpenClaw

等工具直接运行。

不同量化版本对应显存需求如下：

显存	推荐量化
4GB	Q4_K_M
6GB	Q5_K_M
8GB	Q6_K
12GB	Q8_K_M
16GB	BF16
24GB	MTP-BF16

如果使用 BF16 全精度版本，则建议至少配备 24GB 显存。

部署教程：

1、下载Qwythos模型

【Huggingface】或【打包下载】

20260624103805 838681 scaled

2、安装llama.cpp

下载方式：GitHub 下载【点击前往】、或【备用下载】、【网盘下载】内含启动脚本

20260624104303 758333

3、一键启动脚本：

【点击下载】或【备用下载】

或者复杂下方的代码自行保存为BAT脚本

@echo off
setlocal EnableDelayedExpansion

chcp 936 >nul
title LingDu AI - Qwythos Launcher
color 0A

cd /d "%~dp0"

:: =====================================================
:: 自动查找模型
:: =====================================================

set MODEL=
set MMPROJ=

for %%F in (models\Qwythos*.gguf) do (
    echo %%~nxF | find /I "mmproj" >nul
    if errorlevel 1 (
        set MODEL=%%F
    )
)

for %%F in (models\mmproj*.gguf) do (
    set MMPROJ=%%F
)

:MENU
cls

echo.
echo ============================================================
echo.
echo             LingDu AI - Qwythos Launcher
echo.
echo          Claude Mythos 5 Distilled Vision Model
echo.
echo ============================================================
echo.

if defined MODEL (
    echo Model Found:
    echo   !MODEL!
) else (
    echo Model Found:
    echo   NOT FOUND
)

echo.

if defined MMPROJ (
    echo Vision Projector:
    echo   !MMPROJ!
) else (
    echo Vision Projector:
    echo   NOT FOUND
)

echo.
echo ============================================================
echo.
echo Select Your GPU VRAM
echo.
echo [1] 4GB VRAM
echo     Recommended Context: 16K
echo.
echo [2] 6GB VRAM
echo     Recommended Context: 32K
echo.
echo [3] 8GB VRAM
echo     Recommended Context: 64K
echo.
echo [4] 12GB VRAM
echo     Recommended Context: 128K
echo.
echo [5] 16GB VRAM
echo     Recommended Context: 256K
echo.
echo [6] 24GB VRAM
echo     Recommended Context: 512K
echo.
echo ------------------------------------------------------------
echo.
echo OpenAI Compatible API
echo.
echo http://127.0.0.1:8080/v1
echo.
echo ------------------------------------------------------------
echo.
echo Supported Clients
echo.
echo OpenWebUI
echo Cherry Studio
echo Claude Code
echo OpenAI Codex
echo OpenClaw
echo.
echo ------------------------------------------------------------
echo.
echo [0] Exit
echo.
echo ============================================================

set /p choice=Select Option:

if "%choice%"=="1" (
    set CTX=16384
    set MODE=4GB
    goto START
)

if "%choice%"=="2" (
    set CTX=32768
    set MODE=6GB
    goto START
)

if "%choice%"=="3" (
    set CTX=65536
    set MODE=8GB
    goto START
)

if "%choice%"=="4" (
    set CTX=131072
    set MODE=12GB
    goto START
)

if "%choice%"=="5" (
    set CTX=262144
    set MODE=16GB
    goto START
)

if "%choice%"=="6" (
    set CTX=524288
    set MODE=24GB
    goto START
)

if "%choice%"=="0" exit

goto MENU

:START
cls

echo.
echo ============================================================
echo.
echo Starting Qwythos...
echo.
echo Mode:
echo   %MODE%
echo.
echo Context:
echo   %CTX%
echo.
echo Model:
echo   !MODEL!
echo.
echo Vision:
echo   !MMPROJ!
echo.
echo API:
echo   http://127.0.0.1:8080/v1
echo.
echo ============================================================
echo.

if not defined MODEL (
    echo ERROR:
    echo No Qwythos model found in models folder.
    echo.
    pause
    goto MENU
)

if not defined MMPROJ (
    echo WARNING:
    echo No mmproj found.
    echo Starting as text-only model.
    echo.

    llama-server.exe ^
    -m "!MODEL!" ^
    -ngl 999 ^
    -c %CTX% ^
    -n 8192 ^
    -fa on ^
    --cont-batching ^
    --host 127.0.0.1 ^
    --port 8080

    pause
    goto MENU
)

llama-server.exe ^
-m "!MODEL!" ^
--mmproj "!MMPROJ!" ^
-ngl 999 ^
-c %CTX% ^
-n 8192 ^
-fa on ^
--cont-batching ^
--host 127.0.0.1 ^
--port 8080

pause
goto MENU

下载后将其进行解压，然后在根目录下创建一个新的文件夹，将其命名为 models，作为接下来存放模型的地方。

官方性能提升数据

根据开发团队公布的数据，在多个基准测试中，Qwythos 相比原始 Qwen3.5-9B 获得了显著提升。

MMLU

衡量模型知识理解能力的重要指标。

Qwythos 相比基础模型提升：

+34 分

GSM8K Strict

数学推理能力测试。

提升：

+30 分

GSM8K Flex

复杂数学与逻辑推理测试。

提升：

+19 分

对于一个仅有 9B 参数的模型来说，这样的提升幅度已经相当可观。

最大亮点：104 万 Token 上下文

Qwythos 最吸引人的地方并不是跑分。

而是其默认启用了 YaRN 长上下文扩展技术。

开箱即用即可支持：

1,048,576 Token

也就是：

104 万 Token

这是什么概念？

普通大模型通常仅支持：

8K
32K
64K
128K

上下文窗口。

而 Qwythos 理论上能够处理：

整个项目代码仓库
超长研究论文
多本电子书
长时间运行的 AI Agent 工作流

对于程序员而言，可以直接分析完整项目代码。

对于研究人员来说，可以一次性处理海量文档资料。

对于 AI Agent 来说，则意味着更长的记忆能力与更复杂的任务执行链条。

支持原生 Function Calling

除了推理能力之外，Qwythos 还支持符合 Qwen3.5 标准的原生 Function Calling。

这意味着：

无需额外插件
无需特殊微调
无需额外封装

即可直接调用外部工具。

例如：

Python 执行器
Web Search
数据分析工具
Agent 系统

开发团队测试显示，在接入工具后，Qwythos 可以实现自我验证与自我纠错，从而显著提高答案准确率。

支持视觉识别

目前官方已经发布视觉版本。

模型包含：

Qwythos-9B-Claude-Mythos-5-1M

以及对应的视觉投影文件：

mmproj-Qwythos-9B-Claude-Mythos-5-1M-F16

部署后即可实现：

图片分析
OCR 识别
图表理解
界面截图分析
多模态问答

对于本地 AI 用户来说，无需联网即可实现基础视觉能力。

实际体验如何？

经过简单测试，Qwythos 给人的第一印象非常接近 Claude 系列模型的风格。

主要体现在：

推理过程更加完整
逻辑链条更清晰
长文本分析能力优秀
工具调用表现稳定

尤其是在复杂逻辑推理和代码生成场景中，表现明显优于许多同级别 9B 模型。

当然，104 万 Token 更多属于理论上限。

对于普通用户而言：

32K ～ 128K 上下文已经足以满足绝大多数使用场景。

总结

Qwythos-9B-Claude-Mythos-5-1M 可以说是近期最值得关注的开源推理模型之一。

它不仅拥有 Claude Mythos 风格的推理能力，还提供：

104 万 Token 上下文
原生 Function Calling
Vision 多模态能力
GGUF 本地部署支持
最低 4GB 显存运行

如果你正在寻找一款兼顾推理能力、长上下文以及本地部署体验的开源模型，那么 Qwythos-9B 非常值得尝试。

接下来我也会继续测试它在代码生成、AI Agent、长文本分析以及实际生产力场景中的表现，感兴趣的朋友可以关注后续更新。

Claude Mythos 5 被“蒸馏”了？Qwythos-9B 突然开源，百万 Token 上下文，4GB 显存即可部署！

什么是 Qwythos-9B？

本地部署要求