Claude Mythos 5 被“蒸馏”了?Qwythos-9B 突然开源,百万 Token 上下文,4GB 显存即可部署!

不得不说,现在开源 AI 模型的发展速度,正在变得越来越快!就在前两天,一款名为 Qwythos-9B-Claude-Mythos-5-1M 的全新开源推理模型悄然发布,并迅速引起了本地 AI 社区的广泛关注。

与传统开源模型不同,Qwythos-9B 最大的亮点在于它吸收了大量来自 Claude Mythos 和 Claude Fable 的高质量推理轨迹,并通过专门的后训练技术,将这些推理能力迁移到一个仅有 9B 参数的开源模型之中。

20260624102941 302730

 

更令人惊讶的是,它不仅支持超过 104 万 Token 的超长上下文窗口,同时还提供 GGUF 量化版本,最低仅需 4GB 显存即可本地部署运行。

那么这款被誉为“Claude Mythos 开源平替”的模型究竟表现如何?本文将带大家深入了解这款近期爆火的开源推理模型。

20260624103058 792356

什么是 Qwythos-9B?

Qwythos-9B 是一个基于 Qwen3.5-9B 架构训练的全参数推理模型。

开发团队 Empero AI 在深度未审查版本的 Qwen3.5-9B 基础上,使用超过 5 亿条高质量 Claude Mythos 与 Claude Fable 推理轨迹进行了后训练。

这些推理轨迹并非简单问答数据,而是包含完整思维链(Chain of Thought)的高质量推理过程,其逻辑链由 Empero AI 内部的 rethink 系统自动生成。

简单来说,你可以把它理解为:

将 Claude Mythos 的推理思维方式迁移到了一个仅有 9B 参数的开源模型之中。

最终得到了一款兼顾推理能力、部署成本以及长上下文能力的新型开源模型。

本地部署要求

Qwythos 已提供 GGUF 格式。

可通过:

  • llama.cpp
  • llama-server
  • OpenWebUI
  • Cherry Studio
  • OpenClaw

等工具直接运行。

不同量化版本对应显存需求如下:

显存 推荐量化
4GB Q4_K_M
6GB Q5_K_M
8GB Q6_K
12GB Q8_K_M
16GB BF16
24GB MTP-BF16

如果使用 BF16 全精度版本,则建议至少配备 24GB 显存。

部署教程:

 

1、下载Qwythos模型

 

Huggingface】或 【打包下载

 

20260624103805 838681 scaled

 

 

2、安装llama.cpp

 

下载方式:GitHub 下载【点击前往】、或备用下载】、【网盘下载】 内含启动脚本

 

20260624104303 758333

 

 

3、一键启动脚本:

点击下载】或 【备用下载

或者复杂下方的代码自行保存为BAT脚本

@echo off
setlocal EnableDelayedExpansion

chcp 936 >nul
title LingDu AI - Qwythos Launcher
color 0A

cd /d "%~dp0"

:: =====================================================
:: 自动查找模型
:: =====================================================

set MODEL=
set MMPROJ=

for %%F in (models\Qwythos*.gguf) do (
    echo %%~nxF | find /I "mmproj" >nul
    if errorlevel 1 (
        set MODEL=%%F
    )
)

for %%F in (models\mmproj*.gguf) do (
    set MMPROJ=%%F
)

:MENU
cls

echo.
echo ============================================================
echo.
echo             LingDu AI - Qwythos Launcher
echo.
echo          Claude Mythos 5 Distilled Vision Model
echo.
echo ============================================================
echo.

if defined MODEL (
    echo Model Found:
    echo   !MODEL!
) else (
    echo Model Found:
    echo   NOT FOUND
)

echo.

if defined MMPROJ (
    echo Vision Projector:
    echo   !MMPROJ!
) else (
    echo Vision Projector:
    echo   NOT FOUND
)

echo.
echo ============================================================
echo.
echo Select Your GPU VRAM
echo.
echo [1] 4GB VRAM
echo     Recommended Context: 16K
echo.
echo [2] 6GB VRAM
echo     Recommended Context: 32K
echo.
echo [3] 8GB VRAM
echo     Recommended Context: 64K
echo.
echo [4] 12GB VRAM
echo     Recommended Context: 128K
echo.
echo [5] 16GB VRAM
echo     Recommended Context: 256K
echo.
echo [6] 24GB VRAM
echo     Recommended Context: 512K
echo.
echo ------------------------------------------------------------
echo.
echo OpenAI Compatible API
echo.
echo http://127.0.0.1:8080/v1
echo.
echo ------------------------------------------------------------
echo.
echo Supported Clients
echo.
echo OpenWebUI
echo Cherry Studio
echo Claude Code
echo OpenAI Codex
echo OpenClaw
echo.
echo ------------------------------------------------------------
echo.
echo [0] Exit
echo.
echo ============================================================

set /p choice=Select Option:

if "%choice%"=="1" (
    set CTX=16384
    set MODE=4GB
    goto START
)

if "%choice%"=="2" (
    set CTX=32768
    set MODE=6GB
    goto START
)

if "%choice%"=="3" (
    set CTX=65536
    set MODE=8GB
    goto START
)

if "%choice%"=="4" (
    set CTX=131072
    set MODE=12GB
    goto START
)

if "%choice%"=="5" (
    set CTX=262144
    set MODE=16GB
    goto START
)

if "%choice%"=="6" (
    set CTX=524288
    set MODE=24GB
    goto START
)

if "%choice%"=="0" exit

goto MENU

:START
cls

echo.
echo ============================================================
echo.
echo Starting Qwythos...
echo.
echo Mode:
echo   %MODE%
echo.
echo Context:
echo   %CTX%
echo.
echo Model:
echo   !MODEL!
echo.
echo Vision:
echo   !MMPROJ!
echo.
echo API:
echo   http://127.0.0.1:8080/v1
echo.
echo ============================================================
echo.

if not defined MODEL (
    echo ERROR:
    echo No Qwythos model found in models folder.
    echo.
    pause
    goto MENU
)

if not defined MMPROJ (
    echo WARNING:
    echo No mmproj found.
    echo Starting as text-only model.
    echo.

    llama-server.exe ^
    -m "!MODEL!" ^
    -ngl 999 ^
    -c %CTX% ^
    -n 8192 ^
    -fa on ^
    --cont-batching ^
    --host 127.0.0.1 ^
    --port 8080

    pause
    goto MENU
)

llama-server.exe ^
-m "!MODEL!" ^
--mmproj "!MMPROJ!" ^
-ngl 999 ^
-c %CTX% ^
-n 8192 ^
-fa on ^
--cont-batching ^
--host 127.0.0.1 ^
--port 8080

pause
goto MENU

 

 

下载后将其进行解压,然后在根目录下创建一个新的文件夹,将其命名为 models,作为接下来存放模型的地方。

 

 

官方性能提升数据

根据开发团队公布的数据,在多个基准测试中,Qwythos 相比原始 Qwen3.5-9B 获得了显著提升。

MMLU

衡量模型知识理解能力的重要指标。

Qwythos 相比基础模型提升:

+34 分

GSM8K Strict

数学推理能力测试。

提升:

+30 分

GSM8K Flex

复杂数学与逻辑推理测试。

提升:

+19 分

对于一个仅有 9B 参数的模型来说,这样的提升幅度已经相当可观。

最大亮点:104 万 Token 上下文

Qwythos 最吸引人的地方并不是跑分。

而是其默认启用了 YaRN 长上下文扩展技术。

开箱即用即可支持:

1,048,576 Token

也就是:

104 万 Token

这是什么概念?

普通大模型通常仅支持:

  • 8K
  • 32K
  • 64K
  • 128K

上下文窗口。

而 Qwythos 理论上能够处理:

  • 整个项目代码仓库
  • 超长研究论文
  • 多本电子书
  • 长时间运行的 AI Agent 工作流

对于程序员而言,可以直接分析完整项目代码。

对于研究人员来说,可以一次性处理海量文档资料。

对于 AI Agent 来说,则意味着更长的记忆能力与更复杂的任务执行链条。

支持原生 Function Calling

除了推理能力之外,Qwythos 还支持符合 Qwen3.5 标准的原生 Function Calling。

这意味着:

  • 无需额外插件
  • 无需特殊微调
  • 无需额外封装

即可直接调用外部工具。

例如:

  • Python 执行器
  • Web Search
  • 数据分析工具
  • Agent 系统

开发团队测试显示,在接入工具后,Qwythos 可以实现自我验证与自我纠错,从而显著提高答案准确率。

支持视觉识别

目前官方已经发布视觉版本。

模型包含:

Qwythos-9B-Claude-Mythos-5-1M

以及对应的视觉投影文件:

mmproj-Qwythos-9B-Claude-Mythos-5-1M-F16

部署后即可实现:

  • 图片分析
  • OCR 识别
  • 图表理解
  • 界面截图分析
  • 多模态问答

对于本地 AI 用户来说,无需联网即可实现基础视觉能力。

 

实际体验如何?

经过简单测试,Qwythos 给人的第一印象非常接近 Claude 系列模型的风格。

主要体现在:

  • 推理过程更加完整
  • 逻辑链条更清晰
  • 长文本分析能力优秀
  • 工具调用表现稳定

尤其是在复杂逻辑推理和代码生成场景中,表现明显优于许多同级别 9B 模型。

当然,104 万 Token 更多属于理论上限。

对于普通用户而言:

32K ~ 128K 上下文已经足以满足绝大多数使用场景。

总结

Qwythos-9B-Claude-Mythos-5-1M 可以说是近期最值得关注的开源推理模型之一。

它不仅拥有 Claude Mythos 风格的推理能力,还提供:

  • 104 万 Token 上下文
  • 原生 Function Calling
  • Vision 多模态能力
  • GGUF 本地部署支持
  • 最低 4GB 显存运行

如果你正在寻找一款兼顾推理能力、长上下文以及本地部署体验的开源模型,那么 Qwythos-9B 非常值得尝试。

接下来我也会继续测试它在代码生成、AI Agent、长文本分析以及实际生产力场景中的表现,感兴趣的朋友可以关注后续更新。

×

感谢您的支持

alipay
支付宝
wechat
微信支付
bitcoin
Bitcoin
usdt
USDT
QR Code