MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Thinking Machines新模型横空出世:音频对话评测战平GPT-Realtime-2

由前OpenAI CTO Mira Murati创立的Thinking Machines Lab发布TML-Interaction-Small模型,在Scale Labs最新Audio MC S2S音频榜单中与OpenAI GPT-Realtime-2并列第一。

References

Thinking Machines新模型横空出世:音频对话评测战平GPT-Realtime-2

AI行业又迎来一位重量级挑战者。

由前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab,于2026年5月11日发布了旗下首款交互模型——TML-Interaction-Small。该模型在权威基准测试平台Scale Labs最新公布的Audio MC S2S榜单中,以43.4%的APR得分与OpenAI的GPT-Realtime-2(xHigh版本)并列登顶音频榜单,引发行业广泛关注。

评测数据一览

Scale Labs的评测结果显示,GPT-Realtime-2(xHigh)以48.45分占据绝对分数榜首,TML-Interaction-Small以43.36分紧随其后。由于两者分差在统计误差范围内,官方将其评定为并列第一

排位第二梯队依次为:

  • 标准版GPT-Realtime-2(37.61分)
  • 开启思考模式的Gemini 3.1 Flash Live(36.06分)
  • 老款GPT-Realtime-1.5

技术亮点:全双工+长上下文

TML-Interaction-Small是一款基于2760亿参数MoE(混合专家)架构的多模态模型,其中活跃参数约为120亿。据Thinking Machines Lab官方介绍,该模型能够并行处理音频、视频和文本,平均对话响应延迟仅为0.40秒,接近人类自然对话速度。

Scale Labs评价指出,该模型在保持快速响应的同时,展现出现有全双工(Full Duplex)模型中少见的长上下文感知能力,这也是其能够在高难度音频对话任务中与GPT-Realtime-2正面抗衡的关键因素。

Mira Murati的新战场

Thinking Machines Lab由Mira Murati在离开OpenAI后创立,本次发布的交互模型系列被视为其挑战OpenAI在实时语音交互领域霸主地位的重要动作。此前,OpenAI通过GPT-Realtime API在实时语音对话市场占据主导,而TML-Interaction-Small的崛起意味着这一格局正在受到有力冲击。

该模型目前已以研究预览(Research Preview)形式开放,随着后续迭代和更广泛测试的展开,其市场表现值得持续关注。