騰訊混元Hy3 preview發布:主打實用,Agent能力大幅提升

2026.04.24

騰訊發布並開源Hy3 preview語言模型。這是一款快慢思考融合的混合專家模型,總參數達295B,激活參數為21B,最大支持256K上下文長度。

這是混元迄今最智能的模型,在複雜推理、指令遵循、上下文學習、代碼、Agent等能力及推理性能上實現了大幅提升。

20262月起,騰訊重建了其預訓練與強化學習基礎設施,聚焦於提升混元系列模型在實際應用場景中的實用性,並遵循三大核心原則:一是打造全面能力——覆蓋推理、長文理解、指令遵循和工具調用等維度;二是優先真實評估——主動跳出易被「刷榜」的公開榜單,以更準確反映模型真實能力,並持續評估和改進;三是融合模型與推理設計——以強烈的業務應用思維實現成本效率,讓更大價值觸手可及。

騰訊首席AI科學家姚順雨表示:「我們正在持續擴大預訓練和強化學習的規模,提升模型智能上限。我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升Hy3正式版的實用性。與此同時,通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,並開始探索特色模型能力。」

目前,Hy3 preview已在騰訊多款主線產品首發上線,包括騰訊雲、元寶、imaCodeBuddyWorkBuddyQQQQ瀏覽器、騰訊文檔、騰訊樂享等,還將陸續接入其他多款騰訊生態內的核心產品。

以元寶為例,混元與產品深度協同設計,大幅提升了意圖理解準確率和文本生成質量。Hy3 previewCodeBuddyWorkBuddy上也表現卓越,首字延遲(TTFT)降低54%,端到端響應時間縮短47%,同時成功率超過99.99%

在真實用戶環境中,該模型已驗證可穩定支撐長達495步的複雜智能體工作流,覆蓋文檔處理、數據分析、知識檢索、MCP(模型上下文協議)工具鏈編排等多元工作場景。在騰訊文檔的AI PPT功能中,該模型相較前代(混元Hy2)取得顯著進步,生成成功率提升20%

混元Hy3 preview支持接入OpenClawOpenCodeKiloCode等主流開源智能體框架,現已上線騰訊雲大模型服務平台TokenHub。此外,Hy3 preview API已登陸OpenRouter,限時兩周免費開放使用。

混元Hy3 preview在綜合實用性與Agent能力基準中表現領先

多項評估結果顯示,混元Hy3 preview在模型能力上實現了全面提升:

  • 外部及自研基準測試均顯示,Hy3 preview的上下文學習與指令遵循能力顯著增強。
  • STEM應用領域,Hy3 previewAI基準測試及真實考試中均表現出色,複雜推理能力突出。
  • Hy3 preview亦被證明是OpenClaw等複雜智能體場景與框架中最實用的模型選擇之一。

得益於混元預訓練與強化學習框架的重建,Hy3 preview在代碼編寫(開發環境下執行)和搜索執行(從開放源中檢索、篩選並整合信息)等智能體主導的任務中表現卓越。

推理效率提升40%,實現最優智能密度

混元Hy3 preview整體推理效率提升40%,在相同成本下實現最優智能密度。這一成果得益於模型與推理框架的深度協同優化,以及在推理全棧、算子性能與量化算法等全面提升。

在騰訊雲大模型服務平台TokenHub上,Hy3 preview提供高性價比定價:每百萬tokens輸入價格低至1.2元,緩存輸入價格最低0.4元,輸出價格低至4元。此外,騰訊雲推出定制化Hy3 preview Token套餐,個人版月費低至28元,可在OpenClaw等智能體開發平台與框架中調用該大模型。

作為開源模型,Hy3 preview現已上線GitHubHugging FaceModelScopeGitCode等平台,支持vLLMSGLang等主流推理框架,開發者可直接下載部署。