腾讯混元Hy3 preview发布:主打实用,Agent能力大幅提升
腾讯发布并开源Hy3 preview语言模型。这是一款快慢思考融合的混合专家模型,总参数达295B,激活参数为21B,最大支持256K上下文长度。
这是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、Agent等能力及推理性能上实现了大幅提升。
自2026年2月起,腾讯重建了其预训练与强化学习基础设施,聚焦于提升混元系列模型在实际应用场景中的实用性,并遵循三大核心原则:一是打造全面能力——覆盖推理、长文理解、指令遵循和工具调用等维度;二是优先真实评估——主动跳出易被“刷榜”的公开榜单,以更准确反映模型真实能力,并持续评估和改进;三是融合模型与推理设计——以强烈的业务应用思维实现成本效率,让更大价值触手可及。
腾讯首席AI科学家姚顺雨表示:“我们正在持续扩大预训练和强化学习的规模,提升模型智能上限。我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。与此同时,通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。”
目前,Hy3 preview已在腾讯多款主线产品首发上线,包括腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等,还将陆续接入其他多款腾讯生态内的核心产品。
以元宝为例,混元与产品深度协同设计,大幅提升了意图理解准确率和文本生成质量。Hy3 preview在CodeBuddy和WorkBuddy上也表现卓越,首字延迟(TTFT)降低54%,端到端响应时间缩短47%,同时成功率超过99.99%。
在真实用户环境中,该模型已验证可稳定支撑长达495步的复杂智能体工作流,覆盖文档处理、数据分析、知识检索、MCP(模型上下文协议)工具链编排等多元工作场景。在腾讯文档的AI PPT功能中,该模型相较前代(混元Hy2)取得显著进步,生成成功率提升20%。
混元Hy3 preview支持接入OpenClaw、OpenCode、KiloCode等主流开源智能体框架,现已上线腾讯云大模型服务平台TokenHub。此外,Hy3 preview API已登陆OpenRouter,限时两周免费开放使用。
混元Hy3 preview在综合实用性与Agent能力基准中表现领先
多项评估结果显示,混元Hy3 preview在模型能力上实现了全面提升:
- 外部及自研基准测试均显示,Hy3 preview的上下文学习与指令遵循能力显著增强。
- 在STEM应用领域,Hy3 preview在AI基准测试及真实考试中均表现出色,复杂推理能力突出。
- Hy3 preview亦被证明是OpenClaw等复杂智能体场景与框架中最实用的模型选择之一。
得益于混元预训练与强化学习框架的重建,Hy3 preview在代码编写(开发环境下执行)和搜索执行(从开放源中检索、筛选并整合信息)等智能体主导的任务中表现卓越。
推理效率提升40%,实现最优智能密度
混元Hy3 preview整体推理效率提升40%,在相同成本下实现最优智能密度。这一成果得益于模型与推理框架的深度协同优化,以及在推理全栈、算子性能与量化算法等全面提升。
在腾讯云大模型服务平台TokenHub上,Hy3 preview提供高性价比定价:每百万tokens输入价格低至1.2元,缓存输入价格最低0.4元,输出价格低至4元。此外,腾讯云推出定制化Hy3 preview Token套餐,个人版月费低至28元,可在OpenClaw等智能体开发平台与框架中调用该大模型。
作为开源模型,Hy3 preview现已上线GitHub、Hugging Face、ModelScope、GitCode等平台,支持vLLM、SGLang等主流推理框架,开发者可直接下载部署。