Thinking Machines新模型横空出世:音频对话评测战平GPT-Realtime-2
AI行业又迎来一位重量级挑战者。
由前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab,于2026年5月11日发布了旗下首款交互模型——TML-Interaction-Small。该模型在权威基准测试平台Scale Labs最新公布的Audio MC S2S榜单中,以43.4%的APR得分与OpenAI的GPT-Realtime-2(xHigh版本)并列登顶音频榜单,引发行业广泛关注。
评测数据一览
Scale Labs的评测结果显示,GPT-Realtime-2(xHigh)以48.45分占据绝对分数榜首,TML-Interaction-Small以43.36分紧随其后。由于两者分差在统计误差范围内,官方将其评定为并列第一。
排位第二梯队依次为:
- 标准版GPT-Realtime-2(37.61分)
- 开启思考模式的Gemini 3.1 Flash Live(36.06分)
- 老款GPT-Realtime-1.5
技术亮点:全双工+长上下文
TML-Interaction-Small是一款基于2760亿参数MoE(混合专家)架构的多模态模型,其中活跃参数约为120亿。据Thinking Machines Lab官方介绍,该模型能够并行处理音频、视频和文本,平均对话响应延迟仅为0.40秒,接近人类自然对话速度。
Scale Labs评价指出,该模型在保持快速响应的同时,展现出现有全双工(Full Duplex)模型中少见的长上下文感知能力,这也是其能够在高难度音频对话任务中与GPT-Realtime-2正面抗衡的关键因素。
Mira Murati的新战场
Thinking Machines Lab由Mira Murati在离开OpenAI后创立,本次发布的交互模型系列被视为其挑战OpenAI在实时语音交互领域霸主地位的重要动作。此前,OpenAI通过GPT-Realtime API在实时语音对话市场占据主导,而TML-Interaction-Small的崛起意味着这一格局正在受到有力冲击。
该模型目前已以研究预览(Research Preview)形式开放,随着后续迭代和更广泛测试的展开,其市场表现值得持续关注。