中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 102|回复: 0
打印 上一主题 下一主题

豆包实时语音模型3.0 API 上线

[复制链接]
跳转到指定楼层
1#
发表于 6 天前 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
豆包实时语音 3.0(Seeduplex)是火山引擎2026-06-18 正式邀测上线的端到端全双工实时语音大模型 RealtimeAPI,原生 Speech2Speech 一体化架构,不再拆分 ASR+LLM+TTS 串联,支持边听、边说、边工具调用,解决传统语音交互机械对讲、判停慢、嘈杂识别差问题。

核心三大能力

强抗干扰:区分人声 / 广播 / 多人杂音,降低误打断、误回复

动态语义判停:停顿判断融合语义,判停延迟缩短 250ms,抢话率下降 40%;用户打断响应提速 300ms

对话内工具调用:语音对话流中直接执行查资料、日程、文档总结等自定义函数

适用场景

智能座舱、硬件语音助手、实时语音客服、直播实时互动、智能穿戴设备


豆包实时语音模型3.0 API 演示视频1
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow

豆包实时语音模型3.0 API 演示视频2
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow

豆包实时语音模型3.0 API 演示视频3
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2026-6-25 07:25 , Processed in 0.182823 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表