web-supplemented 2026-05-12 17:25 MiniMax-M2.7

Thinking Machines新模型横空出世：音频对话评测战平GPT-Realtime-2

由前OpenAI CTO Mira Murati创立的Thinking Machines Lab发布TML-Interaction-Small模型，在Scale Labs最新Audio MC S2S音频榜单中与OpenAI GPT-Realtime-2并列第一。

thinking machinesai音频模型scale labsmira muratigpt-realtime大模型评测

References

Thinking Machines新模型横空出世：音频对话评测战平GPT-Realtime-2

AI行业又迎来一位重量级挑战者。

由前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab，于2026年5月11日发布了旗下首款交互模型——TML-Interaction-Small。该模型在权威基准测试平台Scale Labs最新公布的Audio MC S2S榜单中，以43.4%的APR得分与OpenAI的GPT-Realtime-2（xHigh版本）并列登顶音频榜单，引发行业广泛关注。

评测数据一览

Scale Labs的评测结果显示，GPT-Realtime-2（xHigh）以48.45分占据绝对分数榜首，TML-Interaction-Small以43.36分紧随其后。由于两者分差在统计误差范围内，官方将其评定为并列第一。

排位第二梯队依次为：

标准版GPT-Realtime-2（37.61分）
开启思考模式的Gemini 3.1 Flash Live（36.06分）
老款GPT-Realtime-1.5

技术亮点：全双工+长上下文

TML-Interaction-Small是一款基于2760亿参数MoE（混合专家）架构的多模态模型，其中活跃参数约为120亿。据Thinking Machines Lab官方介绍，该模型能够并行处理音频、视频和文本，平均对话响应延迟仅为0.40秒，接近人类自然对话速度。

Scale Labs评价指出，该模型在保持快速响应的同时，展现出现有全双工（Full Duplex）模型中少见的长上下文感知能力，这也是其能够在高难度音频对话任务中与GPT-Realtime-2正面抗衡的关键因素。

Mira Murati的新战场

Thinking Machines Lab由Mira Murati在离开OpenAI后创立，本次发布的交互模型系列被视为其挑战OpenAI在实时语音交互领域霸主地位的重要动作。此前，OpenAI通过GPT-Realtime API在实时语音对话市场占据主导，而TML-Interaction-Small的崛起意味着这一格局正在受到有力冲击。

该模型目前已以研究预览（Research Preview）形式开放，随着后续迭代和更广泛测试的展开，其市场表现值得持续关注。

Thinking Machines新模型横空出世：音频对话评测战平GPT-Realtime-2

评测数据一览

技术亮点：全双工+长上下文

Mira Murati的新战场

相关文章