腾讯投资航空科技公司飞翔互联
06-17
游戏NPC成为AI应用落地的重点。
自 2006 年《Irrational Games》解散以来,系列制作人肯·莱文 (Ken Levine) 就从公众视野中消失了。
后来,他开设了一个新的游戏工作室,并开始致力于一个名为“叙事乐高”的神秘项目。
在他看来,游戏剧情可以像乐高积木一样被分解成小组件,并不断重新排列,探索不同的剧情方向。
也就是说,叙事乐高模式中的游戏对于每个玩家来说都是完全独特的,或者每次玩时都不同。
不过,这位知名游戏制作人后来并未通过“叙事乐高”模式打造新游戏,其团队也一度被报道遭遇“容量地狱”。
这个想法不可行吗? 在 CES 上,NVIDIA 展示了其利用 Avatar Cloud Engine(ACE)技术的最新成果。
游戏中的角色栩栩如生,与其他角色甚至真实玩家交谈和交流,并根据对话内容采取行动。
玩家每次进入游戏时,NPC(Non-Player Character,非玩家角色)都会谈论不同的内容,摆脱了剧本的束缚。
其他巨头也没有闲着。
年底,微软Xbox宣布与Inworld AI合作,将利用AI技术为游戏中的NPC注入更多互动和活力,从而增强游戏的沉浸感和体验。
在微软刚刚发布的第二财季(即自然年第四季度)财报中,游戏业务贡献的营收超过了Windows。
在中国,当AI应用成为主题时,腾讯、网易、*世界、百川智能、昆仑万维等一些AI初创公司都将目光投向了游戏领域,不约而同地关注了NPC。
肯·莱文十年前的愿景正在成为现实。
纽约大学副教授 Julian Togelius 曾表示:“游戏是 AI 的过去、现在和未来。
”游戏一直是培育人工智能的沃土。
它们就像实验田,见证了人工智能领域的各种发展。
尝试并突破。
也正是游戏的需求催生了高性能显卡,为当今大型机型的繁荣发展提供了“敲门砖”。
为什么游戏NPC会成为AI应用落地的重点? 1、多重冲突与需求结合的NPC NPC几乎存在于所有游戏中,但玩家已经不再满足于现有NPC的表现。
微软Xbox援引Inworld AI的一项调查称,84%的玩家认为NPC在游戏中很重要,79%的玩家会与NPC互动。
然而,52% 的玩家抱怨游戏中的 NPC 现在“只会重复对话”。
这与驾驶NPC的经典技术——“状态机”或“行为树”有关。
在游戏AI的“深度学习”阶段,会更加关注对现实世界生物行为的模拟,从而产生行为的背后是规则,规则越完整、越详细,游戏中的NPC就显得越“聪明”,同样,它们也有明显的弱点,比如在有限状态机的AI模式中。
一旦玩家摸清了游戏设计者的“套路”,就可以根据其逻辑总结出有针对性的策略,虽然这可以带来意想不到的有趣玩法,但也会让玩家抓住漏洞,开发出违反原设计的“偷懒”方法。
以大家熟知的游戏《只狼:影逝二度》为例,玩家只要找到特定位置,就可以基本无伤害地击杀Boss(角色型boss)。
玩家为Boss“修脚”。
在《荒野大镖客:救赎 2》《巫师3:狂猎》《赛博朋克》这样广受好评的游戏中,NPC的整体表现虽然让玩家满意,但仍然依赖于丰富的游戏设计,相应的开发成本也极高。
例如,《荒野大镖客:救赎 2》中有超过10个NPC角色,分布在6个章节的多个任务中。
每个 NPC 都有自己的歌手、美术作家和配音演员。
这些NPC的制作耗时近8年,开发成本接近5亿美元。
尽管肯·莱文是一名资深游戏制作人,但当他准备通过“叙事乐高”模式打造一款新游戏时,他也不得不面对开发团队“从头开始构建”和“漫长的开发周期”的需要。
在游戏行业,“跳票”是一种普遍现象。
为了创造出更好的游戏,开发团队会在争吵、妥协和焦虑中努力推进进度,但谁也不能保证游戏能够一些从业者甚至认为,加班和延期是游戏开发的“必要之恶”,也是打造优质游戏的必经之路。
体现在游戏NPC上,从供给端来看,第三波AI有两条明显的研究主线——决策AI和生成AI。
如果说决策AI和生成AI是实现通用人工智能(AGI)的必由之路,那么游戏NPC就是它们的重要应用对象。
“随着底层模型的不断进步,AI生成的内容越来越丰富。
这将进一步增强AI的两大能力,即智能决策和驾驶能力,以及跨模态理解和生成能力。
”腾讯AI实验室相关负责人表示。
这两种能力,一方面可以直观地体现在游戏NPC上,另一方面也是各大AI公司(团队)在应用过程中需要证明和表现的。
与晦涩难懂的论文和不同评选标准的榜单相比,游戏NPC在一定程度上更能体现一个AI公司(团队)的应用能力。
2019年1月9日,百川智能发布大角色模型百川-NPC,对“角色知识”和“对话能力”进行深度优化,推出“角色创建平台+搜索增强知识库”的定制解决方案。
值得注意的是,这也是百川智能发布的首个大型垂直应用模型。
为什么大型模型公司优先入驻游戏行业?百川智能科技联创Richard告诉《甲子光年》:“游戏是很多新技术的唯一起点,此外,游戏也是更好的变现方式。
” 《年中国游戏产业报告》显示,国内游戏市场实际年销售收入为6400万。
元,同比增长13.95%,首次突破亿元大关;用户数6.68亿,同比增长0.61%,创历史新高。
“如果能够在游戏领域取得成功,这些技术应用于其他行业时可能会产生降维影响。
”理查德说。
巨人网络前CEO吴猛创办的新公司MiAO也在研究游戏NPC。
其AI组负责人告诉《甲子光年》,当具有强大世界知识和具有记忆能力和任务规划能力的通用智能的大型模型在实体概念出现后,“可以生成游戏内容的AIGC”和“能够理解游戏世界的智能NPC”就是可以直接想到的实现场景。
腾讯AI实验室认为,游戏在AI发展中发挥着重要作用,主要得益于游戏环境的三大特点:一是游戏有明确的胜负和核心指标,有利于AI性能的测试和迭代;其次,在虚拟世界中更方便地获取AI训练所需的数据,成本更低,迭代效率更高,推动了监督学习和强化学习技术的发展;第三,丰富的游戏类型为AI研究提供了大量的测试环境。
推动智能代理游戏、协作等前沿研发。
2.如何让NPC变得更加人形?如何让NPC更加人性化?这个问题有最新答案。
NVIDIA 在 CES 上展示的玩家与 NPC 自然交流的成果来自 NVIDIA 开发者平台合作伙伴 Convai。
Convai使用了ACE平台中的Audio2Face和Riva两大功能。
在这个场景中,玩家的语音输入被发送到Audio2Face的自动语音识别模型,该模型将语音转换为文本并将其放入大模型中以生成角色的实时响应。
随后,使用文本转语音模型(Riva)生成响应,生成动画模型以创建逼真的唇形同步,最后渲染动态角色并将其传回游戏场景。
与微软合作的Avatar Cloud Engine和Inworld AI的细分功能,让文本、声音和图像成为相互训练的数据,并基于GPT-3为核心大模型,集成了多个大模型、音频模型等使用30多个机器学习模型创建了多模态开发引擎——“角色引擎”,专注于构建模拟人脑的复杂系统。
为了让用户和开发者能够在游戏或应用中快速构建和部署AI角色,Inworld打造了AI虚拟角色生成平台——Inworld Studio。
开发者无需任何编码,只需输入自然语言即可快速创建NPC。
ChatGPT刚发布时,就有玩家尝试将其连接到一些游戏中,希望能与游戏NPC实现“自然交流”。
然而,为了让NPC更像人类一样表达自己,模型的基本能力和角色扮演一致性非常重要。
模型的基础能力不仅包括模型的一般智能水平,还包括人物知识、对话能力、情节演绎、逻辑推理四种专业能力。
增强这些能力的唯一途径是在预训练阶段通过高质量的数据集进行有针对性的训练。
角色扮演一致性问题是指在角色“演绎”过程中,通用语言模型很容易跳出“角色设定”,回到“智能助手”或者做出符合自己预期的言行。
不符合人物性格,也就是业内所说的OOC问题(人物的言行偏离原著设定,比如古代人物谈论现代事物)。
为了解决这两个问题,百川智能人物大模型百川-NPC通过高质量的数据集进行针对性训练,并将思维链对齐技术引入到人物模型对齐中,采用数据构建方法并带思维链。
有一种思维链对齐的增强对齐方法。
双管齐下,使得模型的思维过程以及思考后的动作表现更加接近人类,大大提高了人物一致性。
国内初创公司MiAO最近提出了一个开放世界游戏角色扮演代理框架,名为LARP(Language Agent for Role Play)。
LARP 的重点是将开放世界游戏与语言代理集成起来,使用模块化方法进行内存处理、决策和从交互中持续学习。
MiAO 的架构由一组较小的语言模型组成,每个模型都针对不同领域进行了微调,以分别处理各种任务。
这种设计为开发开放世界角色扮演游戏的语言代理提供了新的经验和视角。
妙奥AI团队负责人告诉《甲子光年》:“建立NPC的人格,模拟思维、情感和认知过程,让先验知识强的语言模型进行心理活动推演,然后利用复杂的代理的任务规划和复杂任务规划的执行能力让NPC能够在开放世界模拟环境中从事社交活动,为玩家分配独特的任务,建立社交联系,并影响数值结算,这是我们的研究之一。
“但是,如何平衡NPC的性格和性格。
游戏的一般规则是怎样的? MiAO的解决方案是——插件数据库和集体意识。
世界观、游戏规则等常识性内容将通过插件数据库平等地共享给每个NPC,而运行时NPC个性化生成的一些内容将通过集体意识传递,类似于墨水在水中的渲染方式。
。
NPC独特的个性是由不同的指令和属性决定的。
NPC的性格与游戏的一般规则存在着相互影响但又相对独立的关系。
“如果人工智能能够在复杂的策略游戏中学习类似于人类的长期战略规划和协作能力,它就可以代表多智能体决策的最高水平。
”腾讯AI实验室相关负责人表示。
3.目标:开放世界虽然AI NPC的前景被看好,但将大型模型和相关技术融入到成熟的游戏开发中仍然充满挑战。
游戏开发通常涉及各种非文本标准化资产。
如果游戏开发者想要使用语言模型或代理来生成游戏内容,那么将游戏资产和运行信息合理地转换为语义表达将成为实现过程中的关键部分。
问题。
面对无限扩展的开放世界,AI NPC必须能够灵活适应各种复杂的环境。
如果游戏运行了很长时间,AI NPC就积累了一定的长期记忆。
开发者如何让AI NPC在这种长期的情况下不断成长、不断进化,也是一大技术难题。
同时,现阶段语言模型的长上下文理解能力还有很大的提升空间。
此外,优质AI工具和平台API调用费用带来的经济门槛也制约了一些中小游戏开发商的使用。
妙傲AI团队负责人告诉《甲子光年》:“目前业界解决的还是Prompt Engineering、Fine-Tune等模型层面的问题,系统设计的整体解决方案很少。
”搞AI的人和搞游戏的这两类人很难理解彼此的需求和陷阱,从我个人的角度来看,这个行业缺少的不是强大的模型,而是解决方案。
”。
有些问题可以通过构建数据集进行模型训练来解决,有些问题需要通过设计系统来解决,有些问题则必须由市场来解决。
MiAO AI团队的负责人也提出了一个观点: “不是不够拟人化,而是NPC设计得太拟人化了就不合适了。
游戏追求的是好玩,而不是你的NPC有多拟人化。
”而决定游戏是否“好玩”的,除了NPC的拟人化程度之外,游戏的世界观和剧情线索的设定也很关键因素。
继文森特影业、文森特视频、文森特3D之后,文森特开放世界(text-to-openworld)也受到了业界的青睐。
专注于。
在去年12月举行的百度云智能大会暨智能计算大会上,AI游戏引擎初创公司RPGGO展示了其开发的生成式AI游戏引擎——Zagii Engine。
通过简单的文字输入,玩家就可以利用AI工具打造出完整的多人动态角色扮演剧本杀游戏。
长期关注“AI+游戏”领域的Monolith Capital投资人表示,看好利用大型模型实现玩家与NPC的高质量互动,以及AI在游戏领域的应用。
游戏领域。
“AI的价值在于,它会扩展未来的Gameplay(游戏)。
如果这一点能够实现,游戏的供给将从完全的PGC转变为PUGC,甚至UGC,这将引起游戏行业的巨大变化。
”AI NPC已经成为目前AI在游戏中的应用。
但从长远来看,“开放世界”才是AI与游戏结合的最终目标。
在生成式AI的趋势下,“开放世界”的概念在游戏领域再次被激活。
《甲子光年》近日与几位从事“AI+游戏”的公司负责人进行了交谈,话题最终转向“开放世界”。
不过,“开放世界”并不局限于现在的“开放世界游戏”,而是类似于《头号玩家》《三体》的另一个平行世界。
“创造、健康、快乐”是百川智能创始人兼CEO王小川根据马斯洛需求层次理论提出的三个实施方向。
其中,创造对应生产力工具,健康对应医疗,幸福对应与现实世界平行的“开放世界”。
“大型模型让我们有可能创造人类。
”理查德告诉《甲子光年》。
RPGGO也致力于打造一个“开放世界”。

RPGGO联合创始人李佳莹毕业于斯坦福大学,是一位热爱玩游戏的“95后”。
去年,她毅然辞去大工厂的工作,创立了RPGGO,主打基于生成式AI的“文本到开放世界”。
李佳莹表示,RPGGO想要打造一个开放世界,打造一个“把一句话变成一本世界书”的AI开放世界引擎,让游戏开发者和普通内容创作者、游戏玩家都可以使用这个引擎。
把自己的想法变成世界观,搭建一个平台,让每个人都可以拥有自己的网页,就是自己的AI游戏。
“也许每个人的最终目标都不是游戏,游戏只是一个过程和立足点。
我真正想做的不是游戏,而是一个开放的世界,但我需要在新的领域立足。
”李嘉莹坦言。
《甲子光年》近日获悉,昆仑万维Play for Fun游戏工作室自主研发的*AI游戏《Club Koala》目前正在高强度开发和测试中。
首个Beta版本测试预计将于今年3月开始。
该游戏将引入“有自我意识”的AI NPC。
《Club Koala》还有开放世界元素。
游戏的一个核心组件就是游戏编辑器——Koala Editor。
考拉编辑器针对的是没有开发知识和经验的普通玩家,编辑过程完全实现零代码。
Koala Editor还配备了完整的功能组件、素材盒等辅助工具,提供创意资源,帮助玩家快速构建游戏。
游戏行业对开放世界的追求,与全球AI公司目前追求的AGI*梦想可以说是同一个目标。
开放世界的真正实现,几乎意味着人工智能可以像人类一样,在需要想象力的时候无限发散思维;需要精准解决问题时,汇聚思维、突破;当需要独立行动时,自发地寻找信息、寻找工具解决问题;当需要团队合作时,组建自发的社会组织。
这不正是AGI在虚拟世界中的投射吗? 未来是光明的,但道路是曲折的。
Richard对于AI未来的发展趋势有着自己的理解。
他把AI分为四个层次:L1,即模型,即AI具有一定的泛化能力,能够初步解决一些通用问题; L2,即代理。
现阶段,AI具有三大标志性能力:使用工具、规划和长期记忆。
例如,金融从业者每天要根据股价波动实时调整投资策略。
如果股价大幅上涨,他们会感觉好一些,但如果股价上涨,他们就会感觉很沮丧。
但如果在虚拟世界中,金融从业者不具备自发地从外界获取信息的能力,他们就不是活生生的人。
L3,人形特工。
AI将像人类一样具有实时状态(stateful),并且可以对不同情况下的不同事件和角色做出不同的反应。
从技术角度来看,开发者可能会在现阶段向AI中注入能量值、财富值、情绪值等不同参数。
“玩家每次找到这个NPC,都能看到该NPC的不同状态。
” L4,社会类人机器人。
在这个阶段,人工智能可以像人类一样与其他人工智能建立不同的关系。
不同的AI会在整个社交网络中承担不同的角色,并相互合作形成社团等各种组织。
“大多数公司还处于模型阶段,模型还没有准备好,”理查德分享道。
目前基础模型的能力仍然限制了游戏中世界观的自由度和大量NPC。
模型能力的提升依然带来无限的想象空间。
OpenAI 创始人兼首席执行官 Sam Altman 近日在达沃斯论坛上透露:“如果 GPT-4 目前只能完成 10% 的人类任务,那么 GPT-5 预计能够处理 15% 到 10% 的人类任务。
20%的使命。
”同时,他相信AGI将会在“不太遥远的未来”出现。
很多时候,技术的进步只是变革的开始,还有很多技术以外的事情需要弄清楚。
人类需要选择的道路还有很多,但路的尽头有一个明确的目的地,李嘉莹的答案是:“用科技让魔法变得最好。
” 【本文经投资界合作伙伴微信公众号授权发布:甲子光年,本平台仅提供信息存储服务】如有疑问,请联系投资界()。
)。
#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。
趋势和行业变化,以及对未来技术趋势的洞察。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-17
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态