总规模达1亿 浙江江山设立“两山”转型领域产业基金
06-18
在AI的世界里,最先崭露头角并击败围棋顶尖人类棋手《星际争霸 2》的AlphaGo已经宣布退役。
如今,高手依然崭露头角。
MOBA游戏被“攻陷”之后,AI又将触角伸向了MMORPG品类。
我们今天故事中的主角就是腾讯AI LAB和天涯明月刀团队联合开发的“绝智”。
随着技术的发展,“AI玩游戏不如人类”的认知一次又一次被颠覆。
《天涯明月刀》中的绝智人工智能就是其中之一。
当主播在与特鲁姆普的1v1对决(游戏中称为“刀剑之争”)中以流畅轻松的写意动作轻松击败时,他都“戴上了痛苦的面具”:“我为什么输了?”发生了什么?我无法接受……”▲被绝智“轻松”击败后,主播感到“痛苦到模糊”人类真的能战胜AI吗?APPSO联系了《天涯明月刀手游》的研发团队和腾讯AI LAB 采访了他们,希望能得到这个问题的答案:“无论如何,这并不是人类第一次输给 AI。
这次只是换了一个游戏。
”相信很多人都会有这样的想法。
难道只是换个游戏那么简单吗?联合团队的研究人员给我们分享了训练绝智AI的心路历程。
如果你想让绝智成为《天涯明月刀》中的无敌英雄,第一步就是为他搭建训练场,与人类玩家使用手机应用程序或电脑软件玩游戏不同,AI以程序的形式“生活”在服务器中。
为了解决AI与游戏、以及移动应用与计算机软件之间的“语言障碍”问题,联合团队首先使用了微软的.Net Core作为解决方案,这使得绝智可以跨越多种语言,而无需重写大量内容平台“遇见”玩家 为了让特鲁姆普真正“看见”玩家,联合团队也下了很大的心思。
包括角色属性、技能伤害等游戏内各种参数的基础数据库,让绝智AI以最小的负担正常运行。
其次,在线进行《天涯明月刀》1v1战斗,实际上可以让两个不同服务器的玩家进入“跨服服务器”进行战斗。
由于这个过程可能会跨越六七台服务器,有时还需要中转,所以整个过程对服务器要求很高,消耗大量资源。
为了提高训练效率,联合团队采用了一个巧妙的方法,就是训练过程中只保留跨服服务器。
让绝智AI直接“活”在跨服服务器上,将原本需要的资源减少到一半以下,让战斗顺利进行。
但即便如此,联合团队仍然消耗了数百台服务器,以保证数十万个AI同时持续训练和强化。
最后,战场自然重要,但观赛和回顾比赛同样不可或缺。
为了及时发现培训过程中的问题,确保整体效果。
团队使用一套工具来实时监控和调整AI战斗,甚至可以用来随时观看任何AI战斗过程。
在解决了跨服战斗和手游移植问题后,绝智AI正式进入天道武林,完成了成为武林高手的第一步。
那么绝智AI是如何成为站在天剑论巅峰的英雄的呢?这是故事的其余部分。
从初出茅庐到所向披靡,这就是绝智的修炼之路。
就像观看魔术一样,我们想知道其背后的秘密。
看完AI战胜主播,玩家们一定也想知道AI为什么这么强以及它是如何运作的。
打败人类。
在介绍开始之前,我们先来看看绝智用了什么样的操作让主播表示“无法接受”。
▲ 特鲁姆普的连击操作,连接组合技能,将伤害最大化。
▲ 主播施展特定技能的瞬间进行格挡,避免陷入崩溃并快速反击的状态。
每个游戏AI都是一样的“无敌”,但是根据游戏类型的不同,他们的训练方法也完全不同。
绝智AI自然有着与MMORPG游戏中其他AI完全不同的成长体验《天涯明月刀》。
谈绝智AI,首先要谈一下《天涯明月刀》之间的区别。
当玩家在《天涯明月刀》中设定角色时,从不同职业带来的技能差异,到玩家成长过程中的不同个性化选择,再到玩家的操作水平和对游戏的理解,《天剑》中的每一个角色都是各不相同,有千种面孔。
剑战场上,每一次都会发生针锋相对的对抗,每时每刻都需要玩家做出不断的决策和选择。
如果想要进行不同职业之间的对决,就需要对其他职业有足够的了解才能够游刃有余。
▲ 天道手游中,每个门派都有多种主动和被动技能,而端游则更为复杂。
这不仅对玩家如此,对绝智AI来说也是一个挑战。
绝智AI要想迅速成为《天涯明月刀》中的武术高手,一个可以让它随时与之较量的对手(强化学习训练框架)是必不可少的。
联合团队依托自主研发的大规模强化学习平台,通过数千次战斗,在确保AI在训练过程中逐步完善行为策略的同时,寻求对各种战斗情况的最佳应对。
。
如上所述,丰富的职业、技能、装备赋予了剑斗无限的可能,每一步操作都有巨大的探索空间。
为了让绝智AI迈出剑斗的第一步,在训练初期引入了一些课程学习策略,比如随机设置AI在地图中的出生位置、初始化不同的状态值等.、加快探索。
的目标。
同时,在整个战斗过程中,为了减少AI进行空中旋转、释放技能等无意义的操作,还使用了动作遮罩来限制技能的使用条件,以保证AI在无法击中目标或冷却之前不会释放它们。
技能,从而缩小其探索空间,使其能够更有效地进行战斗。
▲ 如果没有正确的指导,AI 会在学会高效战斗之前浪费大量时间探索技能的释放。
那么,如何让AI知道什么时候该做某事呢? AI LAB项目负责人表示,很重要的一点是奖励设计。
简单来说,就是为各种目标设定一个奖励点。
例如,如果AI用技能击中对手,就会给出正分。
如果AI徒劳地使用某项技能,就会给出负分。
AI的最终目标是顺利进行。
想要赢得这场对决,分数越高越好。
好的奖励设计可以快速引导AI学习,但奖励的设计和验证成本非常高。
一方面,AI可能会找到捷径并使用特殊方法来获得高分。
另一方面,奖励的设置在一定程度上也会限制AI的表现。
根据《天涯明月刀》的游戏特点,AI LAB与天道联合团队根据角色生命状况设置了“零和血量”奖励,强调自身生命值损失小于对手;而影响战斗的“压制”和“漂浮时间”奖励可以引导AI学习如何通过技能组合和漂浮连击长时间压制对手,从而提高战斗效率——不仅是获胜,还要高效、漂亮地获胜。
▲ 经过引导和强化学习,AI对漂浮连击技能的运用已经异常熟练。
对于玩家来说,“无敌”是他的终极目标,但对于AI来说,这只是它的第一阶段:特浪普AI还有更重要的任务:满足不同玩家的游戏需求——失败也是另一种成功。
如上所述,除了复杂的技能树和多个职业带来的巨大探索空间之外,《天涯明月刀》还有一个非常重要的差异点:那就是玩家的差异。
在天道的游戏世界中,装备、经脉、心技等成长因素都会影响玩家的技能——技能是玩家战斗力等级的评价值,受到游戏中各个维度属性的影响——在不断成长的过程中,每个玩家的进步都是不同的。
即使技能相似,玩家的操作水平也不同。
构成玩家等级的是角色本身的技能差异和每个玩家的操作水平。
那么,绝智 AI 如何接触到所有玩家呢?其实这是两个问题:“如何覆盖所有技能”和“如何覆盖所有操作层面”。
▲ 与大多数竞技游戏类似,在《天刃》中玩家可以通过胜利不断提升自己的等级,证明自己的同时获得奖励。
针对不同的技能,绝智采用了大规模泛化的技能模板,覆盖所有技能。
玩家。
“所向无敌”的绝智对于刀剑上的《天涯明月刀》有着非常明确的策略。
经过大规模泛化后,基本可以覆盖各个能力的玩家。
针对不同操作等级的玩家,采用能力分级技术,降低绝智AI的能力。
通过这两种方式,不同段位的玩家可以匹配到不同实力的王牌AI,从而满足不同技能和操作能力的玩家的需求——并不是王牌变弱了,而是它可以适应你的能力积分就够了。
▲ 从最低到最高,横跨24个等级,玩家也呈现正态分布。
说起来很简单,但绝智的成长之路远没有这么简单。
《天涯明月刀》的战斗策划elsli告诉我们,原来版本的特鲁姆普别说连击,连攻击玩家都做不到。
它只会站在原地在空中使用技能,或者不断撞墙。
其操作性即使对于游戏新手来说也是无法比拟的。
并且经过数百万小时的实战训练和数万次的剑对决,奖励设计逻辑不断优化。
只能原地释放技能的AI,就像是一个想要在武林中扬名立万的初出茅庐的人。
年轻的英雄逐渐学会了战斗、格挡和连击。
终于有一天,天道的作战策划者突然意识到:我似乎无法战胜它。
如今的绝智,作战策划者已经无法通过对抗来判断新模型是否有所进步——反正是打不过的,也完全无法判断AI有多强。
特鲁姆普来到手游之后,很多新玩法、新套路都被规划好了。
看完绝智AI的操作,玩家恍然大悟:原来还可以这么玩。

▲经过刻苦训练,AI可以轻松“搞定”大多数对手,甚至是“教它的老师傅”。
既能百战百胜,也能切中要害。
它可以陪伴你战斗,也可以教你套路,尤其是绝智在规划的道路上不断前行,一路上不断给我们带来惊喜。
无敌果断,绝智的英雄气概到底有多强? 《天涯明月刀》的作战计划给了我们答案:超出预期。
作为伴侣AI,特鲁姆普的目的是为玩家提供更好的游戏体验。
对于玩家来说,无论是端游还是手游,玩家对AI只有以下三个期待:看到超级强悍的游戏选手主播、职业选手被AI击败;观看AI相互较量,用绝对理性和强大的运用运算来决出武林中最强的门派。
最后但并非最不重要的一点是:玩家希望有人可以随时与之对抗。
▲ 每一个“战斗型”选手都需要一个最了解自己、水平相当的陪练,哪怕是“单打独斗”的顶尖选手。
《天涯明月刀》团队对绝智 AI的期望是它可以与具有不同技能和能力的不同玩家竞争。
操作技巧好的玩家在剑斗中可以保持40%的胜率。
但自我成长能力超出规划预期的绝智AI在击败人类方面是无与伦比的。
在此前与主播的比赛中,更是取得了13连胜。
什么,设计目标是胜率40%? “虽然这个计划非常有效,但这确实不是我们的目的。
” - 《天刀》的策划者在采访中略带歉意,但同时也能感受到对绝智的自豪。
采访结束时,《天涯明月刀》团队给出了8分的评分:绝智足够强大,但强大并不是《天涯明月刀》团队所追求的,这样绝智才能在刀剑辩论中保住自己的分数。
性能,并将其应用于更多的游戏场景,让玩家有更好的游戏体验,利用AI技术创造新的玩法是绝智的发展目标。
如今的绝智已经完成了稳定的训练框架。
从接入游戏职业到GameCore职业实现、AI训练以及实时稳定的训练建模,已经可以在极短的时间内在手游端进行训练。
最强AI。
即使有版本迭代、职业调整,也能快速完成培训。
绝智可以成为最强AI,一人一剑所向无敌,但任何级别的玩家都可以在剑论或其他游戏场景中找到适合自己技术水平和装备技能的AI。
战斗三百回合后获得成长。
那种一波三折、灯光忽明忽暗的游戏才是最符合玩家期待的。
陪伴玩家修炼成长的“最强AI”。
在这条道路上,特鲁姆普不断探索、前行,为玩家创造新的道路。
游戏玩法。
绝智的成长尚未结束。
在主播与AI的对战中,除了特鲁姆普的拦截和反击让玩家们感到不可思议并引发一阵阵赞叹等流畅操作之外,还有一个场景也充斥着直播间。
这就营造了一种欢乐的气氛:当主播即将失去仅存的生命值时,绝智并没有来结束战斗,而是不断翻滚,看似在“嘲讽”主播。
我原本以为这是绝智新奇的设定,但AI LAB研究人员坚定地告诉我们:虽然玩家反馈非常好,但我们不得不承认这只是一个bug。
▲“嘲讽”主播的绝智AI“秦11”被观众嘲笑为“主播一生的敌人”。
强大的人工智能击败真正的玩家。
这是玩家希望看到的,但玩家更希望看到的是,我们意识到,AI不只是简单的强大,而且更加人性化和温暖。
那时候的AI,比单纯的战斗力强大还要让人印象深刻。
不过,虽然理论上来说,AI的零滞后反应速度、记住所有技能冷却时间、判断范围的记忆能力是大多数玩家无法比拟的,但对于反应速度比普通玩家更快的顶级职业来说,对于玩家来说,当前的绝智人工智能并非无敌。
这是人类战略的胜利。
博弈策略的演变也是绝智未来想要拓展的方向之一。
那么,绝智的未来会是什么样子呢?当我们问及未来的计划时,已经打造出《十剑》“最强AI”的开发者们变得谦虚起来:“脚踏实地,一步一个脚印。
”而策划者所说的“一步到位”,已经在《天涯明月刀》的故事中酝酿了。
“科技”和“武术”看似是两个根本无法联系的概念,但在《天涯明月刀》里,它们却出奇的和谐。
从聚焦世界的“孔雀羽毛”主题,到聚焦世界的“大悲”主题,《天涯明月刀》即将开启聚焦宇宙的“血鹦鹉”主题。
绝智是这个新时代的关键。
▲ 或许未来,游戏中的NPC会被AI接管,变得更加栩栩如生。
现在我们一想到宇宙,就会想到浩瀚的星空,但宇宙作为一个古老的词,原本是指古今中外所有浩瀚的神灵,而“绝智”这个名字就来自于“ “绝智之家”,天刀世界中一个用脚步丈量九州、用手眼描绘风景、痴迷科技探索与发明的组织。
这样的设定,让绝智AI进入天道宇宙非常和谐。
《天刀》IP的世界观架构师表示,绝智系列AI将融入游戏本身。
闪耀古今的天道宇宙,将在绝智AI的加入下,开辟全新的“血鹦鹉”题材。
。
在PC游戏的实践中,研发团队发现很多AI都有忠实的粉丝,玩家会根据AI设定的特点赋予他们“胆小”、“心机”等角色。
在《天涯明月刀》的未来规划中,绝智AI确实会扩展其角色设计,以适应AI的个性,并在流星战(手游)和香战(端游)等主题战场上大显身手。
甚至会成为《绝智传奇》主题故事中的核心人物,让AI成为BOSS,为PVE玩法带来更多可能。
同时,智能AI的潜力不仅仅在于战斗AI,还在于整个游戏世界和新的虚拟生态系统的构建。
未来将会有一个“王牌系列傀儡”,不仅陪伴玩家战斗,在设定、性格上也陪伴玩家,成为与玩家共存、陪伴成长、周游世界的玩伴。
世界,让大家少侠的世界之旅不再孤单。
▲ MMORPG 的特点是一个由数千名玩家组成的生动世界。
绝智AI的出现将创造更多的纽带。
特鲁姆普可以是你的对手,可以是你的师父,也可以是职业选手最强的陪练伙伴,也可以是赛场上的明星选手。
我们相信,在未来天道团队与AI LAB“脚踏实地”的合作中,随着技术上细节的坚持、巩固和把控,一个更强大、更人性化、更多元化的绝智AI很快就会再次刷新。
我们的理解并改变我们的经历。
这位“剑光出鞘,所向披靡”的神秘剑客,将凭借不断的科技进步,为世人续写更多的神话。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-17
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态