AI in Game,大模型能力与实时音视频技术融合,交出AI应用新答卷

随着AI的技术进步和工具普及,尤其是在这两年的跃进之后,AI在游戏行业内的应用已经逐步由理念设想推向落地实践。从蔡浩宇披露的AI新游《Whispers From The Star》到GDC上各大厂家呈现的游戏+AI新亮点,我们看到了更多AI与游戏的结合方式,不仅是制作端AIGC能力的融入,连游戏内互动体验也正因AI的崛起而卷入这场革命。

AI交互进化,打破传统边界

从“工具”到“伙伴”,重塑互动体验

游戏行业很早便已经开始使用“AI”一词,然而,这类所谓的AI从本质上来说还是“提线木偶”——它们的行为被预设脚本牢牢束缚,在庞大的行为库中排列组合,构建出与玩家的互动。而大语言模型和AI实时语音对话技术在游戏中的应用,彻底打破了传统互动模式的边界。角色能够从话语中思考理解玩家的意图并实时给出个性化反馈,不再只能根据明确的指令导向固定的行为,这为游戏中的虚拟角色赋予了高度拟人化的交互能力。

无论是游戏内的NPC、你的队友亦或是你的游戏小助手,都将成为有温度、有智慧、有个性的 “数字生命”,为玩家以及社区带来全新的情感化、智能化交互体验,提供独有的情绪价值。

|AI NPC:从“工具人”到“游戏原住民”,打破传统叙事边界

传统NPC的“机械感”始终是打破沉浸体验的顽疾——玩家早已厌倦了预设脚本和复读机般重复台词的角色,这同时也大大降低了游戏的重玩价值。而AI技术的介入,尤其是AI实时对话能力的加持正在颠覆这种单向交互模式,让NPC真正成为游戏世界的“原住民”,能够与玩家一同构建出丰富且个性化的剧情体验。

通过AI技术加持,《Whispers from the Star》支持玩家实时使用自然语言发送指令,而游戏的主角Stella也会随着玩家的指令作出或愤怒或欣喜的个性化反馈。这款以AI语音交互为核心玩法的太空生存游戏展现出了与传统游戏截然不同的创新性,尤其是AI实时对话对剧情走向的深度影响,为游戏互动性带来了新的维度。跳脱传统游戏的叙事边界,玩家不必拘泥于游戏提供的选项,而是可以真正与Stella自由交流,通过对话帮助她完成逃离。每一次对话,都可能将游戏引入未知的方向,并激发全新的故事。

在社交推理游戏《太空杀》中,AI NPC的融入也为游戏带来了全新玩法和更多变数。独特的“内鬼挑战”玩法由两位真人玩家共同对抗8名AI NPC。游戏中,AI NPC能够独立思考,结合实时且自然的语音对话,他们会像真人一样,充分表达自己的观点和推理,并根据局势变化临场伪装、结盟、指控,与玩家一同动态演绎故事。复杂的互动、真实的交流与推理,AI NPC为《太空杀》玩家带来了打破剧本瓶颈的持续新鲜体验。

图片

|AI 助手:从“说明书”到“外置大脑”,懂游戏也懂你

随着游戏技术和基础设施的不断迭代,游戏本身的复杂性也在不断增长,这为教学系统,尤其是新手引导带来了持续的挑战。以《王者荣耀》为例,游戏内已有近百位技能各异的英雄搭配百件功能各异的装备,玩家需要较长时间去熟悉。而游戏内的各种英雄介绍就像“说明书”,内容生硬,很难在实战中应用。如今,结合AI实时对话能力,AI成了玩家的“外置大脑”,彻底改变了新手玩家进游学习期的体验模式。

《王者荣耀》的AI Coaching可在训练对决中结合玩家及对局数据精准给出当前所使用英雄的技能与装备教学,并会进行实时对线指导,在逆风局、带线局等各种不同情况下给出不同的游戏策略,甚至预测局势走向,为玩家提供大局观指导,真正做到边玩边学。同时,AI还能够复刻各个英雄的音色,带来更沉浸的教学体验,强大的多语言能力可支持中、英、西、葡、阿、土等多语种,助力游戏全球化运营。

图片

除了《王者荣耀》,另一款国民级手游《和平精英》的数字代言人吉莉经过升级迭代,也将以语音对话的形式加入到玩家的实时对局中。玩家不仅能在游戏大厅与吉莉交流,在游戏中也能通过自由麦语音与吉莉实时对话,像是提问如何调节灵敏度、突击步枪与冲锋枪哪个秒伤更高等等,在游戏中遇到的任何问题,都能通过语音向吉莉发问并得到合理解答。吉莉还能够通过玩家语言中的语气词强度(如 "艹!这都能输")以及上下文语义特征(如反复提及 "队友太坑"),实时判断玩家的情绪状态,并针对不同情绪类型,调用差异化的响应策略,比如对沮丧玩家给予鼓励,为兴奋玩家打call……情绪价值拉满,与用户主动建立具有深度共鸣的互动关系。

图片

|AI 队友:从“人机操作”到“开黑大腿”,自然沟通并肩作战

多人竞技游戏中,队友的质量往往决定了游戏的成败和体验的优劣。但当玩家不想社交时,游戏匹配的人机队友却很难填补真人玩家的空缺。“人机操作”已经成了很多游戏中离谱操作的代名词。而AI驱动的智能队友,正在重新定义这一社交生态。

以往FPS玩家只能通过快捷键和指令轮盘,向AI队友下达"攻击"或"跟随"等简单命令。但这些命令缺乏目标和细节,很难实现玩家与人机队友之间的战术配合。而在《暗区突围》中,玩家可以用自然语言与自己的AI队友交流,AI队友可以观察实时的战斗环境,真正理解玩家的战术意图,进而灵活应对战场变化。“我清一楼你清二楼”、“正面牵制等我绕后”这些复杂的长序列战术指令AI 队友F.A.C.U.L.都可以听懂执行并推测玩家意图进行实时语音反馈。

图片

在《和平精英》的海岛地图中,玩家也可以与AI队友匹配共同战斗,而且有三个不同性格的队友可选。玩家可以尽情与AI交流或指挥,如果问他们能否给自己一些子弹,AI队友还会迅速跑过来响应玩家需求。对于不熟悉玩法的新人而言,AI队友的存在还具有优秀的引导能力,帮助玩家度过新手阶段。例如缩圈的时候他们会提醒玩家跑进安全区,附近如果有敌人的脚步声出现也会提醒玩家防守警戒。这种 AI 驱动的队友,不仅降低了玩家的社交门槛,还为那些不擅长团队协作的玩家提供了一个包容和支持的环境。它让玩家在游戏中感受到的不再是孤独,而是一种被陪伴、被支持的温暖。

图片

轻松实现全开麦实时语音交互

腾讯云 GME AI 实时对话解决方案

作为行业领先的RTC厂商,腾讯云实时音视频(TRTC)此前已依托腾讯海量游戏开发运营经验,基于真实游戏场景专门优化推出了一站式游戏语音解决方案——游戏多媒体引擎(GME)。随着AI能力的快速突破,以及腾讯内部在游戏AI方向上的超前探索,腾讯云TRTC进一步将GME与AI实时通话能力整合,为游戏行业用户搭建出性能最优、延时最低的对接通道,在内嵌腾讯云ASR的同时,整合业内领先的LLM/TTS方案进行深度优化,将AI对话总延迟低至1000ms,媲美人类对话反应速度,并融入声纹识别、语义断句、背景音、承接语等创新能力,使对话效果更自然、拟真。

图片

在实现音视频数据高效采集、处理、传输的基础上,GME AI实时对话解决方案叠加了智能降噪、智能打断、上下文管理等游戏场景所需的核心能力,只需少量开发就可快速实现全开麦的AI实时语音交互,方便游戏行业开发者快速将AI NPC、AI 游戏助手、AI 队友等AI新能力应用到自己的游戏中,为用户带来游戏交互新体验。

图片

RTC协议,全链路深度优化

全球AI对话总延迟低至1000ms以内

GME AI实时对话解决方案针对社交、游戏等场景的音视频编解码器进行深度优化,码率、延时、系统资源消耗等关键技术指标均为业界领先,通过流式分片传输、连接池等机制,全球端到端音视频传输延时可控制在300ms内,AI对话全链路总延迟低于1000ms。六大洲服务可用,全球3200+加速节点,且具备多服务容灾能力,保障业务全球高质量稳定运行。

基于真实游戏场景优化

全开麦自由交流,AI对话媲美真人

利用回声消除、噪声抑制等专利算法,强力抑制键盘声、鼠标声等游戏场景常见噪音。引入全新降噪引擎,输入端音视频实时AI降噪,提升ASR识别准确度。针对口语化表达、游戏专有名词识别困难等挑战,方案基于真实游戏场景音频数据进行标注与模型微调,并可针对不同游戏客户定制专属热词词库,实现包括英语、西班牙语、日语、韩语、中文以及23种方言和130种国际语言的ASR精准识别

方案内置双讲打断、上下文管理等AI实时对话核心能力。玩家可以用全开麦的方式与AI自由沟通。不需要玩家定义一句话是否说完,AI也能很清晰地识别玩家想表达的意思,在AI发言过程中,玩家也能随时打断AI,开启新话题或下达新指令,真正实现媲美真人的沟通交互体验。

3D空间音频等独有技术

带来更多有趣的游戏AI语音玩法

GME AI实时对话解决方案提供独有的3D语音技术,通过范围音频、人声模糊、空气衰减模拟等效果,完整还原声音的方位细节,玩家可根据队友语音“听声辩位”,带来沉浸式语音体验。方案还与Wwise音频引擎深度融合,独创性地解决了语音开麦时游戏背景音效丢失的问题,并可结合游戏音效实现更丰富玩法。同时,GME AI实时对话解决方案还支持音色克隆功能,提供复刻音色,支持自定义音量、语速等参数,为游戏角色赋予个性化的语音。

多端兼容,低成本接入

一次接入满足多样化语音需求

GME AI实时对话解决方案整合并优化了AI对话全链路所需的各项能力,一站式解决方案帮助开发者快速将AI对话功能无缝集成到各类游戏应用中,无需深入处理复杂的技术细节,显著缩短产品开发周期

GME AI实时对话解决方案适配主流主机平台;深度适配 UE、Unity、Cocos 等主流游戏引擎,支持包括iOS、Android、Windows、macOS、Web、Flutter在内的多个平台,兼容超过20000种设备模型。方案高度开放,支持企业自定义大模型(LLM)和语音合成(TTS),配置LLM和TTS服务的账户凭证即可将第三方LLM和TTS无缝集成到服务后台。

您可通过我们提供的无代码快速跑通AI实时对话功能(https://console.cloud.tencent.com/trtc/conversational-ai),全程零门槛无代码,快速配置、便捷测试AI实时对话能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/84979.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android Studio 2022.2.1.20 汉化教程

查看Android Studio 版本 Android Studio Flamingo | 2022.2.1 Patch 2 下载:https://plugins.jetbrains.com/plugin/13710-chinese-simplified-language-pack----/versions/stable

常见的分词算法

常见的分词方法分类如下: 类型名称说明优缺点1️⃣ 基于空格/标点Word-level以空格或标点划分,如 "Hello, world!" → ["Hello", ",", "world", "!"]✅简单,❌无法处理新词,词…

湖北理元理律师事务所观察:债务优化如何成为民生安全网

据央行2023年报告,中国家庭债务收入比达137.8%。面对债务高压,湖北理元理律师事务所的实践揭示:专业债务规划的价值不仅是减负数字,更是构建社会稳定的微观防线。 一、从“催收恐惧”到“主动管理”的转变 该所服务数据显示&…

服务器密码安全运维解决新思路:凭据管理SMS+双因素SLA认证结合的方案

引言:云服务器安全成本困局 在云计算渗透率突破60%的今天,中小企业正面临严峻的安全悖论:某权威机构数据显示,72%的云上数据泄露事件源于凭据管理不当,而传统安全解决方案的采购成本往往超过中小企业年利润的8%。这种…

Vision Transformer网络结构

0.前言 参考CSDN大佬(太阳花的小绿豆)的代码,梳理了一下vit的网络结构,代码地址如下: deep-learning-for-image-processing/pytorch_classification/vision_transformer at master WZMIAOMIAO/deep-learning-for-image-processing GitHub …

C++ 图像处理库 CxImage 简介 (迁移至OpenCV)

文章目录 核心功能特点局限性与替代方案常用方法构造函数从数组创建图像访问属性访问像素点Windows平台支持 常用方法迁移至OpenCV CxImage 是一款功能强大的图像处理类库,主要用于 Windows 平台的图像处理任务。它支持多种图像格式的加载、保存、编辑及特效处理&am…

【博客系统】博客系统第十一弹:从零开始在 Linux 系统上搭建 Java 部署环境并部署 Web 项目

搭建 Java 部署环境 JDK 1. 更新软件包 apt 命令详细介绍 sudo apt-get update2. 安装 OpenJDK 查找 JDK 包 apt list | grep "jdk"安装 JDK sudo apt install openjdk-17-jdk注意: 此处安装的是 OpenJDK,OpenJDK 是一个开源版本的 JDK&am…

智能外呼系统中 NLP 意图理解的工作原理与技术实现

智能外呼系统通过整合语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)等技术,实现了自动化的电话交互。其中,NLP 意图理解是核心模块,负责解析用户话语中的语义和意图&…

Sigma-Aldrich胰蛋白酶细胞解离方案速览

Sigma-Aldrich_胰蛋白酶用于细胞培养 细胞解离是细胞传代过程中的一个步骤,即细胞从预处理表面分离,形成悬浮液。这些悬浮液对于传代培养重新接种、细胞计数分析和细胞增殖非常重要。有多种蛋白水解酶可用来从粘附基质上脱离细胞,胰蛋白酶就…

宝塔安装WordPress程序

宝塔安装WordPress程序 一、提前准备1,下载WordPress2,在宝塔创建站点 二、部署项目1,上传下载的wordpress压缩包至创建的项目根目录下并解压 三、wordpress安装1,在浏览器打开创建的网站2,开始按照流程安装配置数据库…

【LangChain】框架解析

目录 🌟 前言🏗️ 技术背景与价值🩹 当前技术痛点🛠️ 解决方案概述👥 目标读者说明 🧠 一、技术原理剖析📊 核心架构图解💡 核心作用讲解🔧 关键技术模块说明⚖️ 技术选…

百度之星2024 初赛第一场 补给

百度之星2024 初赛第一场 补给 题干描述问题分析:C代码Java代码:Python代码补充说明: 题干描述 参考自马蹄集OJ,原文链接1 可怕的战争发生了,小度作为后勤保障工作人员,也要为了保卫国家而努力。 现在有 …

JavaScripts console.log和console.dir区别

console.log 和 console.dir 都是 JavaScript 中用于在浏览器控制台打印信息的方法 ,二者主要有以下区别: 输出内容和格式 console.log:主要用于输出简单的日志信息,直接打印数据的字符串表示 。对于对象、数组等引用类型&#…

uniapp 开发企业微信小程序时,如何在当前页面真正销毁前或者关闭小程序前调用一个api接口

在 UniApp 开发企业微信小程序时,若需在页面销毁或小程序关闭前调用 API 接口,需结合页面生命周期和应用生命周期实现。以下是具体实现方案及注意事项: 一、在页面销毁前调用 API(页面级) 通过页面生命周期钩子 onUnl…

聊聊 Metasploit 免杀

各位小伙伴们,晚上好! 咱们今天打开宵夜“安全食材箱”,聊聊渗透测试绕过杀毒(免杀)的那些门道。你可以把免杀理解为——深夜做宵夜时,家里有人睡觉,但你非得去厨房整点美食,还不能…

Android高级开发第二篇 - JNI 参数传递与 Java → C → Java 双向调用

文章目录 Android高级开发第二篇 - JNI 参数传递与 Java → C → Java 双向调用引言JNI基础回顾JNI中的参数传递基本数据类型传递字符串传递数组传递对象传递 Java → C → Java 双向调用从C/C调用Java方法实现一个完整的回调机制 内存管理与注意事项性能优化提示结论参考资源 …

2025-05-28 Python深度学习8——优化器

文章目录 1 工作原理2 常见优化器2.1 SGD2.2 Adam 3 优化器参数4 学习率5 使用最佳实践 本文环境: Pycharm 2025.1Python 3.12.9Pytorch 2.6.0cu124 ​ 优化器 (Optimizer) 是深度学习中的核心组件,负责根据损失函数的梯度来更新模型的参数,使…

Web攻防-SQL注入增删改查HTTP头UAXFFRefererCookie无回显报错

知识点: 1、Web攻防-SQL注入-操作方法&增删改查 2、Web攻防-SQL注入-HTTP头&UA&Cookie 3、Web攻防-SQL注入-HTTP头&XFF&Referer 案例说明: 在应用中,存在增删改查数据的操作,其中SQL语句结构不一导致注入语句…

Windows MongoDB C++驱动安装

MongoDB驱动下载 MongoDB 官网MongoDB C驱动程序入门MongoDB C驱动程序入门 安装环境 安装CMAKE安装Visual Studio 编译MongoDB C驱动 C驱动依赖C驱动,需要先编译C驱动 下载MongoDB C驱动源码 打开CMAKE(cmake-gui) 选择源码及输出路径,然后点击configure …