中文搜索引擎指南网

标题: 豆包实时语音模型3.0 API 上线 [打印本页]

作者: sowang    时间: 6 天前
标题: 豆包实时语音模型3.0 API 上线
豆包实时语音 3.0(Seeduplex)是火山引擎2026-06-18 正式邀测上线的端到端全双工实时语音大模型 RealtimeAPI,原生 Speech2Speech 一体化架构,不再拆分 ASR+LLM+TTS 串联,支持边听、边说、边工具调用,解决传统语音交互机械对讲、判停慢、嘈杂识别差问题。

核心三大能力

强抗干扰:区分人声 / 广播 / 多人杂音,降低误打断、误回复

动态语义判停:停顿判断融合语义,判停延迟缩短 250ms,抢话率下降 40%;用户打断响应提速 300ms

对话内工具调用:语音对话流中直接执行查资料、日程、文档总结等自定义函数

适用场景

智能座舱、硬件语音助手、实时语音客服、直播实时互动、智能穿戴设备


豆包实时语音模型3.0 API 演示视频1
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow

豆包实时语音模型3.0 API 演示视频2
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow

豆包实时语音模型3.0 API 演示视频3
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow




欢迎光临 中文搜索引擎指南网 (http://www.sowang.com/bbs/) Powered by Discuz! X3.2