线上活动丨主动式语音 AI:全双工、对话轮次管理、VAD 技术交流会丨RTE Meetup

在这里插入图片描述

一同探索语音驱动的下一代人机交互界面,voice agent builder 的小规模深度交流会。

当用户走在街上时,AI 可以主动提醒他们注意未察觉的来车或骑行者,甚至推荐附近不为人知的特色咖啡馆。

同样,如果系统检测到用户持续表达消极情绪,并沉溺于负面想法中,它可以主动介入,推荐一项专门定制的、有助于平静心绪的活动,而非被动等待用户寻求帮助。

……这种能力使 AI 超越了被动工具的定位,转变为值得信赖的伙伴和队友,能够无缝融入我们的日常生活。

——摘自 Viola 技术报告,Viola 是一款开源端到端全双工语音模型

新一期 RTE Meetup 来了!在本周六 28 日上午 10:00,线上举办!

魔鬼藏在细节里,而让 Voice Agent 像人一样自然对话的秘密,就藏在 AI 是否能主动沉默、打断或发起对话的细节里。

本期 meetup 我们邀请到 来自 Soul、Voila、TEN VAD 和 TEN Turn Detection 等项目的 开发者和专家。主题覆盖全双工、情境感知、轮次检测和管理、语音 VAD 等话题。

同时,来自 Voice Agent Camp 的创业者,也会分享这些技术在不同语音对话场景里的 具体需求、遇到的问题和解决方案。

我们也鼓励你 带上自己的项目或 idea 报名参与,并特别设置了快闪 demo 环节,邀请大家展示和交流。

这是一场轻松的开发者聚会,既可以交流技术也可以交朋友。期待你的报名!

本活动采用滚动录取的方式。现开放报名,感兴趣的朋友请通过下方表格申请,审核通过后会有小助手通过微信联系,并告知具体线上活动地址。

在这里插入图片描述

扫码前往社区网站报名活动

注:扫码后,建议在浏览器中打开页面注册报名(微信内置浏览器不支持 Google 登录)

Web 端也可直接访问网页报名:https://www.rtecommunity.dev/t/t_uXNEywfHWzqcrn

活动议程

6 月 28 日,10:00am~12:00pm,线上举办

主题分享(10:00~10:40)

The World of Real-time Interaction AI

史业民,实时互动 AI 创业者,前智源研究院研究员

Low-Latency Lightweight and High-Performance Streaming VAD

Rambo,TEN VAD Creator&Founder,TEN VAD 是一款低延迟,低功耗,高准确率语音活动检测 AI 模型

圆桌讨论(10:40~11:30)

圆桌话题:恭喜你,都会抢答了——主动式语音 AI 的技术和场景应用

对谈嘉宾和主持人:

  • 尹顺顺,Soul AI 技术负责人,正在开发端到端全双工语音通话,让 AI 自主决定说话时机

  • Rambo,TEN VAD Creator&Founder

  • 史业民,Viola 作者,实时互动 AI 创业者,前智源研究院研究员

  • Darcula(主持人),TEN Turn Detection 作者,TEN Turn Detection
    是一款支持情境感知的智能对话轮次管理模型

此外,所有参与者都有发言机会,人人提问,人人发言~

Lightning Demo(11:30~12:00)

本次活动设置了快闪 demo 环节,邀请大家用 3 分钟时间展示自己的项目 demo。

注:本次活动是小型闭门活动,不接受直接空降。

关于 RTE Meetup

Real-Time&Real Connection,RTE Meetup 是 RTE 开发者社区发起的小型开发者聚会,邀请开发者分享技术和产品的同时,也重视每个与会者的深度参与和交流体验。

成为 RTE Meetup 参与者

Meetup 每个月都有,想 demo 分享或者交流的,都可以找我们报名。新一期均开放给往期参与者参与。

成为 RTE Meetup 组织者

欢迎联系我们申请成为 RTE Meetup 组织者,用你感兴趣的话题聚集同类人,分享新技术、新理念和新场景,一同探索实时互动新可能。有意者请联系我们(微信: creators2022)。

关于 Voice Agent Camp

你是否也曾反复揣摩《Her》中的语音交互,并梦想着复刻甚至超越那份智能与情感?在 Voice Agent Camp,遇见与你怀着同样热忱与梦想的伙伴。

Voice Agent Camp 正在寻找重塑人机实时互动体验的语音智能体初创团队!多模态 AI、语音合成、multi-agent 等技术日臻成熟,场景应用即将爆发。入选团队共同围绕「Voice First」理念,打造 AI 陪伴、个人助理、企业客服、AI 语音智能硬件等下一代产品。

「超音速计划 2025·Voice Agent Camp」 已于 6 月初开营,并将在 8 月底的 Demo Day 结营。通过 peer learning 朋辈互助的方式,分享交流语音技术和产品、开源策略和商业模式、全球化拓展和增长等话题。同时提供丰富的免费技术资源、投融资对接、展会展位和媒体访谈等创业加速支持。

❤️ 感谢以下伙伴的支持

陪跑音符

五源资本、线性资本、纪源资本、星连资本、真格基金、MiniMax、商汤科技、原力资本

Real-Time AI DevKit丨实时多模态 AI 资源包

声网对话式 AI 引擎/RTC/RTM、讯飞创业投资孵化语音资源包、商汤SenseNova V6 Omni、MiniMax、智谱、微软、PPIO派欧云

社区支持

S 创、AI 启蒙小伙伴、TEN Framework

往期 RTE Meetup 回顾

级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨RTE Meetup 回顾

对话式 AI 硬件开发者都关心什么?低延迟语音、视觉理解、Always-on、端侧智能、低功耗……丨 RTE Meetup 回顾

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……丨 RTE Meetup 回顾

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86579.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86579.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何用内网穿透远程访问Everything?实现随时随地快速检索文件

Everything 是一款高效的文件搜索工具,但默认仅支持局域网内使用。使用 花生壳(内网穿透),我们可以实现远程访问Everything,在外网也能快速检索和管理本地文件。 本教程将详细介绍如何配置花生壳映射,并设…

Docker 入门教程(六):联合文件系统(UnionFS)

文章目录 🐳 Docker 入门教程(六):联合文件系统(UnionFS)一、联合文件系统(UnionFS)二、Docker 镜像的层级结构三、写层(Copy-on-Write)四、镜像构建缓存机制…

SQL在一个表中所有列查询某个值

使用场景:知道表名,同时知道这个表中含有某个字符串,但是不知道这个字符串是在表的哪些列,在列比较多的情况下,查询很麻烦,通过以下语句或者封装的存储可以查出字符串在哪些列出现。结果集里 ContainsValue…

【Outline】纯Docker部署指南

本文介绍了使用Docker部署Outline知识管理系统的完整流程。 主要内容包括: 部署PostgreSQL 12数据库并创建用户;安装Redis 6缓存服务;配置Minio对象存储服务替代AWS S3;搭建SSO单点登录服务器;准备Outline容器镜像和环…

终止分区表变更操作时误删数据字典缓存导致MySQL崩溃分析

终止分区表变更操作时误删数据字典缓存导致MySQL崩溃分析 1. 问题简述 在 MySQL 中,当终止一个处于 committing alter table to storage engine 阶段的分区表操作时,InnoDB 会尝试进行回滚并清理数据字典缓存。不幸的是,过程中发生了误删表…

进程关系与守护进程全解析

进程关系和守护进程 进程组 每一个进程除了有一个进程ID(PID)之外还属于一个进程组。进程组是一个或者多个进程的集合, 一个进程组可以包含多个进程,每一个进程组也有一个唯一的进程组ID(PGID), 并且这个PGID 类似于进程ID, 同样…

PyAutoGUI 测试框架

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】

Git安装避坑指南

Git高速下载 程序员面试资料大全|各种技术书籍等资料-1000G 一、安装前准备:避免环境冲突 1. 检查系统残留(Windows) # 检查旧版Git残留 where git where git.exe# 检查环境变量 $env:PATH -split ; | Select-String git# 清理…

MATLAB中的并行加速技术与工具

文章目录 MATLAB中的并行加速技术与工具1. 多线程计算(隐式并行)2. Parallel Computing Toolbox (并行计算工具箱)2.1 parfor (并行for循环)2.2 spmd (单程序多数据)2.3 parfeval (异步并行执行) 3. GPU计算4. 分布式计算 (MATLAB Parallel Server)5. 批…

GR00T N1.5 技术报告 -- Nvidia -- 2025.6.11 -- 开源

0. 前言 GR00T N1 的详细介绍 Isaac-GR00T 在6.11 进行了全面升级,从 N1 进化为 N1.5,但基本还是基于之前的架构,官方发布了一个技术报告,并更新了github库,之前的N1也做了独立版本 N1 N 1.5 github 技术报告 model…

SRS WebRTC 入门

什么是 SRS WebRTC? SRS (Simple Realtime Server) 是一个支持 WebRTC 流媒体的开源媒体服务器。它允许你建立基于 WebRTC 的低延迟直播和实时通信应用。 快速开始 1. 安装 SRS bash # 使用 Docker 快速安装 docker run --rm -it -p 1935:1935 -p 1985:1985 -p 8080:8080…

从手机随拍到标准扫描件:AI如何智能校正证件照片(Python+OpenCV)

目录 一、概述二、解决方案2.1 核心挑战:AI眼中的“三座大山”2.2 设计思路:给AI一个“智能提示”2.3 实现流程:四步搞定 三、代码实现3.1 依赖库3.2 代码 四、结语 一、概述 在当今的线上业务中,要求用户上传身份证、驾驶证等证…

基于OpenCV图像分割与PyTorch的增强图像分类方案

在图像分类任务中,背景噪声和复杂场景常常会对分类准确率产生负面影响。为了应对这一挑战,本文介绍了一种结合OpenCV图像分割与PyTorch深度学习框架的增强图像分类方案。通过先对图像进行分割提取感兴趣区域(Region of Interest,R…

华为云对象存储OBS 支持安卓/iOS/鸿蒙UTS组件

华为云对象存储OBS 支持安卓/iOS/鸿蒙UTS组件 介绍使用前须知vue代码调用示例权限说明API调用说明初始化配置(openClient)创建桶(createBucket)列举桶(listBuckets)删除桶(deleteBucket&#xf…

Buildroot 2025.05 中文手册【AI高质量翻译】

译文在 Github 仓库 和 Gitee 仓库 保持最新,其它平台发的文档可能不会与之同步。 希望能够共同维护这个 仓库的 Buildroot 手册 中文译文,帮助更多人真正深入学习理解,更好的工作、生活和创造。 关于 AI 提示词 以及 更多工具 的收集&#…

采用ArcGIS10.8.2 进行插值图绘制

一、最终成果图展示 二、软件下载 链接: 百度网盘 请输入提取码 密码:azay 三、软件安装 1、在安装之前需要关闭电脑的防火墙及杀毒软件 设置-隐私和安全性-Windows安全中心-防火墙和网络保护 2、软件解压 (1)【ArcGIS_Desktop_1082_180......】“以管理员身份运行”…

Python网安-zip文件暴力破解(仅供学习)

目录 源码在这里 需要的模块 准备一个密码本和需要破解的ZIP文件 一行一行地从密码文件中读取每个密码。 核心部分 注意,需要修改上段代码注释里的这段具有编码问题的代码: 源码在这里 https://github.com/Wist-fully/Attack/tree/cracker 需要的…

如何让ChatGPT模仿人类写作,降低AIGC率?

在AI技术日益普及的当下,ChatGPT 等大语言模型已成为许多学术与写作任务中的得力助手。然而,学境思源,随着各类“AI检测系统”的出现,一键生成论文初稿!我们也遇到一个新的问题:如何让AI写作看起来不像AI写…

科大讯飞2025AI开发者大赛-用户新增赛道时间规则解析

根据训练集中的时间规则,对测试集中的数据推断用户标签(新用户或老用户)。 时间规则如下: 针对训练集和测试集中都存在的did: 找到在训练集中标记为新用户最晚的时间点,则测试集中对应did的数据在此时间点前全部为新用…

.NET C# async/定时任务的异步线程池调度方案最大线程数‌ = 处理器核心数 × 250

关于.NET中Threading.Timer的线程机制,结合线程池特性和异步协作原理分析如下: 一、线程复用机制 ‌共享进程级线程池‌ Threading.Timer的回调任务‌不会每次新建线程‌,而是提交到.NET进程全局线程池统一调度,该线程池与async/…