中文搜索引擎指南网
标题:
豆包实时语音模型3.0 API 上线
[打印本页]
作者:
sowang
时间:
6 天前
标题:
豆包实时语音模型3.0 API 上线
豆包实时语音 3.0(Seeduplex)是火山引擎2026-06-18 正式邀测上线的端到端全双工实时语音大模型 RealtimeAPI,原生 Speech2Speech 一体化架构,不再拆分 ASR+LLM+TTS 串联,支持边听、边说、边工具调用,解决传统语音交互机械对讲、判停慢、嘈杂识别差问题。
核心三大能力
强抗干扰:区分人声 / 广播 / 多人杂音,降低误打断、误回复
动态语义判停:停顿判断融合语义,判停延迟缩短 250ms,抢话率下降 40%;用户打断响应提速 300ms
对话内工具调用:语音对话流中直接执行查资料、日程、文档总结等自定义函数
适用场景
智能座舱、硬件语音助手、实时语音客服、直播实时互动、智能穿戴设备
豆包实时语音模型3.0 API 演示视频1
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow
豆包实时语音模型3.0 API 演示视频2
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow
豆包实时语音模型3.0 API 演示视频3
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow
欢迎光临 中文搜索引擎指南网 (http://www.sowang.com/bbs/)
Powered by Discuz! X3.2