今日,科技媒体testingcatalog报道,OpenAI公司正在筹备推出GPT-Bidi-1模型,这将是ChatGPT语音模式的一次大规模升级。据报道,OpenAI自2026年年初开始研发“双向”(BiDi)架构,该架构能够同时进行听和说,吸收用户的打断,并在对话中途实时调整。目前,OpenAI的文本模型已快速进化至GPT-5.5,而语音功能仍停留在较旧的音频技术栈上,导致口语对话能力落后于文字表现。GPT-Bidi-1模型的推出有望弥合这一差距。
GPT-Bidi-1模型上线后,ChatGPT用户将能够根据需求在双向模式和现有的高级语音模式之间切换。该模型还将支持High、Medium以及Instant三种智能等级,方便用户根据任务调整速度和深度。这一升级将使得ChatGPT在口语对话方面的表现得到显著提升,更好地满足用户需求。

