MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

阶跃星辰开源Step 3.7 Flash:主打生产级Agent的多模态MoE大模型

阶跃星辰发布新一代开源大模型Step 3.7 Flash,采用稀疏MoE架构总参数量198B,激活参数仅11B,在ClawEval等多项Agent基准测试中取得领先成绩。

References

阶跃星辰发布并开源Step 3.7 Flash:面向生产级Agent的多模态MoE大模型

5月29日,国内AI初创公司阶跃星辰正式发布并开源新一代Flash大模型——Step 3.7 Flash。这是继今年2月发布Step 3.5 Flash之后,阶跃星辰在Agent(智能体)领域再次推出的重磅开源模型。

技术架构:稀疏MoE设计,兼顾性能与效率

Step 3.7 Flash采用稀疏MoE(混合专家)架构,由**196B语言主干与1.8B视觉Transformer(ViT)**组成,总参数量达198B,但每次推理仅激活11B参数。这种设计使得模型在保持强大能力的同时,显著降低了计算成本和推理延迟。

该模型支持256K上下文长度,最高生成速度可达400 Tokens/s,适合高频、多轮、低等待的Agent应用场景。模型采用Apache 2.0协议开源,开发者可自由下载使用。

基准测试表现亮眼

作为面向生产级Agent打造的大模型,Step 3.7 Flash在多项权威评测中展现出强劲实力:

  • ClawEval-1.1:以67.1%的成绩位居榜首
  • SWE-Bench Pro:56.3%,位列全球第二
  • SimpleVQA Search:79.2%
  • V Python*:95.3%
  • Toolathlon:49.5%
  • GDPval(44种职业):45.8%
  • τ²-bench通信测试:98%以上通过率

相比前代Step 3.5 Flash,Step 3.7 Flash在SWE-Bench Pro上提升5%,Terminal-Bench 2.1上提升6.1%。

Agent能力与生态兼容

Step 3.7 Flash具备原生多模态理解与执行能力,可自主框选、裁剪并重读UI界面或图表,在信息不确定时能主动检索验证。该模型已深度兼容Claude Code、OpenClaw、KiloCode、RooCode、Hermes Agent等主流Agent开发框架,并支持MCP协议

在硬件适配方面,模型针对Mac Studio M4 Max、DGX Spark、AMD AI Max + 395等本地设备进行了优化,同时兼容华为昇腾、沐曦、壁仞、燧原等多家国产芯片。

开源生态与部署

目前Step 3.7 Flash已在Hugging Face、ModelScope开放下载,并提供端侧GGUF版本。同时支持OpenRouter、ZenMux、Fireworks AI等云端平台接入。

阶跃星辰表示,后续将围绕Step 3.7 Flash推出生态共建计划,与开发者共同探索Agent应用的工程实践与生产化路径。