腾讯混元开源 Hy-MT2 系列翻译大模型,端侧部署能力突破
腾讯混元团队近日正式宣布开源 Hy-MT2 系列多语种翻译大模型,这是继去年底发布的 HY-MT1.5 版本后的重要升级。该系列涵盖 1.8B、7B 及 30B-A3B(MoE 架构) 三个规模版本,支持 33 种语言及 5 种中国方言的互译功能。
技术突破:端侧部署成为核心亮点
此次升级的重点在于端侧部署能力的显著提升。借助混元自研的 AngelSlim/Sherry 量化框架,1.8B 模型实现了 1.25-bit 的极低精度量化,模型体积压缩至仅 440MB。在苹果 A15 芯片上的推理速度较前代 4-bit 量化版本提升 1.5 倍,基本具备在主流手机端侧流畅进行离线推理的能力,真正实现「装进口袋的翻译助手」。
多平台适配与生态扩展
相关模型权重与代码已在 Hugging Face、ModelScope 及 GitHub 同步上线,并在 ARM、高通、Intel、沐曦、天数智芯等多个硬件平台完成适配部署,展现了良好的跨平台兼容性。
性能对标:挑战顶级商业模型
根据官方披露的数据,7B 与 30B-A3B 版本在 FLORES-200 国际评测榜单上已击败 DeepSeek-V4-Pro,并在真实世界与垂直领域测试中,达到 Gemini 3.1 Pro 约 96% 至 99% 的性能水平。此外,腾讯混元还开源了翻译指令遵循评估基准 IFMTBench,以推动行业透明评测。
国际化合作与赛事
腾讯混元已与 WMT26 官方达成合作,共同主办「视频字幕翻译比赛」,进一步推动学术研究与产业应用的结合。
产品化落地
基于该模型底座的「腾讯 Hy 翻译」微信小程序现已开放体验,主打语音输入、风格预设与个性化定制指令等功能。支持离线端侧推理的 iOS 和 Android 原生 APP 也即将在近期上架,届时用户将在无网络环境下也能获得高质量翻译服务。