腾讯提出共享AI，率先布局游戏和多媒体AI，推出同声传译

发布于：2024-10-24 编辑：匿名来源：网络

简介：感谢您阅读腾讯AI Lab微信号第12篇文章。在昨天举行的腾讯全球合作伙伴大会上，腾讯AI Lab披露了AI发展布局的最新进展。

本文整理了腾讯AI的发展路线图、游戏AI研究的挑战与应对、多媒体AI从图片到视频的演变、惊艳的同声传译产品等四大演讲的实用内容，供读者欣赏。。

完整的文章可以在官方网站上阅读。 1. 腾讯AI路线图：共享AI是大势所趋《共享AI：让AI无处不在》演讲嘉宾：腾讯AI实验室主任张彤博士张彤博士的演讲勾画了AI产业未来发展的路线图：共享AI的三大关键要素共享AI：企业共享研究应用成果、行业共享开发平台、学术界共享新思想的“共享AI时代”。

“在将AI Lab的愿景定为企业级人工智能实验室时，我们希望代表腾讯打造世界一流的人工智能能力，让技术以创新的方式解决人类面临的困难和挑战，让人工智能无处不在。不是（让人工智能无处不在）。

”张波表示，腾讯的AI发展路线将围绕企业、产业、学术界的人工智能共享与合作，一是企业内外共享研究和应用成果，缩短技术迭代时间，小步打造核心技术竞争力。在研究方面，腾讯AI实验室成立一年来就以“学术影响力、产业输出”为发展目标，在计算机视觉领域的CVPR、自然领域的ACL等方面取得了成果。

语言处理、机器学习领域的ICML、NIPS论文被多个顶级AI学术会议收录，机构研究能力位居国内前列。检测MegaFace Challenge2和前沿的图像描述生成数据集Microsoft MS COCO在应用方面，除了已经在微信、QQ、音乐、视频平台上落地的技术外，我们还围绕核心进行了针对性的技术突破。

游戏、内容、社交等业务，通过技术提升用户游戏体验，内容AI中文文字、图像和视频。理解、生成和推荐，以及社交AI中的终端硬件和新型交互方式等。

二是共享产业大生态，赋能中小从业者和传统产业。一方面，面向中小从业者和合作伙伴共享人工智能基础能力。

例如，通过腾讯开放平台，开放算法、数据、模型等人工智能基础能力，为从业者提供方便易用的API和SDK。人工智能服务解决方案。

另一方面，针对传统行业，腾讯通过“行业AI+X”计划以及AI创业者的支持，开放AI能力，推动AI在更多垂直领域的落地。例如，腾讯发布的首款AI医学影像产品“腾讯觅影”，利用AI Lab技术检测早期食管癌，准确率高达90%；而本次论坛发布的“AI生态计划”将以场景、技术、人才为基础。

从资本与资本四个方面全面支持AI创业者，与合作伙伴共建共享AI产业生态圈。三是学术界共享新理念，反向将行业资源和经验输入AI人才“造血库”。

我们宣布启动全球博士奖学金计划。前者将为入选的博士生提供丰厚的奖学金，并有机会在AI实验室进行实地研究，接触真实的需求和数据，与学术界共同培养AI领域的顶尖人才。

此外，每年一度的学术论坛也被打造成为吸引国外顶尖学者来华进行学术研究交流的顶级平台。 2. 游戏AI：赋能现实世界，研究的意义远超游戏《游戏AI：虚拟世界对物理世界的赋能》演讲者：腾讯AI实验室机器学习中心负责人刘瀚博士我们最想强调的是游戏AI的意义研究——它远远超出了游戏本身。

这是一个具有挑战性且令人兴奋的研究课题。研究中积累的经验、方法和结论可以在更广泛、更深远的范围内运用。

一是打通虚拟与现实世界的壁垒，为物理世界赋能，如无人驾驶汽车、机器人的发展；其次，游戏中对话智能的研究可能成为强人工智能的重要路径；第三，研究游戏中人、智能体和环境之间的交互可以使智慧城市等复杂且影响深远的项目受益。游戏人工智能是人工智能和博弈论的交叉点。

从小的角度来说，游戏AI研究如何利用人工智能技术来改善人类玩游戏的体验。从大的角度来看，游戏人工智能研究人、代理和环境之间的复杂交互。

游戏AI驱动人工智能的发展，击败从国际象棋到围棋的人类顶尖棋手，目前挑战的游戏也从桌游转向《星际争霸》即时战略（RTS）和《DOTA 2》多人在线对战（ MOBA）等游戏。游戏AI涉及三大核心能力：外部环境的感知、基于状态的决策以及人与智能体的对话。

例如，在围棋的游戏场景中，你可以通过感知棋盘的全局表情状态来决定将棋子放在哪里。现实中，无人驾驶汽车还可以通过视觉和激光雷达感知来做出方向盘、制动等动作的决策。

了解游戏AI的三大核心能力。接下来我会解释一下研究中的三个核心挑战以及腾讯的解决方案。

第一个挑战是游戏的状态空间太大。例如，许多策略游戏的状态空间是无限维的，比围棋空间大得多。

腾讯提出了一种集模型、算法和计算架构为一体的解决方案，称为腾讯机器大脑。整个系统的核心是利用深度神经网络对超大规模状态空间进行建模。

第二个挑战是许多复杂的多人游戏需要多个智能体的协调运作，而目前这方面缺乏理论。为了设计一个完整的多智能体人工智能，一个核心问题是将强化学习的价值网络与描述宏观策略的行为树进行互操作和集成。

第三个挑战是，大多数游戏人工智能是在理想化的虚拟世界中使用模拟器开发的。如何连接虚拟和现实是另一个核心挑战。

我们的解决方案结合了逆强化学习和动态探索机制，对游戏人工智能中的参数进行贝叶斯升级。由此产生的系统可以以最低的成本成功部署在现实世界中。

这套感知、对话和决策模块组成了一个通用系统，未来有望应用于现实中更多场景。这就是我们所说的虚拟赋能现实。

多媒体AI：从图片到视频的深度内容探索《多媒体AI：睁开机器之眼》演讲嘉宾：腾讯AI Lab计算机视觉中心负责人刘伟博士我们正在进入“多媒体内容消费”时代，每个中国人都在消费每天都有大量的内容多媒体内容也提供了大量的多媒体数据。在人工智能领域，多媒体人工智能将赋予计算机处理、识别和理解内容的综合能力。

从图像到多媒体，数据维度得到了极大的提升。我们希望走自主创新的道路，所以我们发展了人工智能的三大基础能力：处理、识别、理解。

我们的目标是通过建立覆盖生成、处理、识别、理解、分发等多种人工智能基础能力的有效技术矩阵，打造最好的多媒体人工智能技术。该应用涵盖了从视频制作到视频推荐的完整视频。

产业链。数字内容是腾讯的战略之一。

内容AI是腾讯AI Lab的四大应用方向之一，多媒体AI首当其冲。我们的愿景是成为全球范围内内容人工智能的领导者、实践者和贡献者。

我们也取得了一些科研成果。例如，它在OCR（Optical Character Recognition，翻译为光学字符识别）任务中取得了六个第一，其中三个针对在线图像文本，另外三个针对聚焦场景文本。

我们把算法识别准确率提高到了90%以上，这是一个巨大的提升。二是视频人脸检测与识别。

需要克服视频中人脸的低分辨率、姿势、遮挡、表情、化妆、光照等挑战。我们在这方面也取得了比较好的成绩。

还有图像描述生成技术。我们对整个深度学习架构（包括卷积神经网络、长短期记忆网络、多阶段注意力）进行端到端训练，实现从图像到文本的有机过渡，获得良好的模型。

该技术目前在最权威的MS COCO数据集上排名第一。基于这项技术，人们上传到QQ空间后，机器就能知道图片在说什么；进行图像搜索、图像推荐以及图文对话；帮助视障人士看到图像世界。

AI翻译：AI同声传译惊艳全场《翻译AI：重建巴别塔》演讲者：腾讯AI实验室机器翻译平台负责人杨跃奎。准确、自然、流畅的同声传译产品让现场观众惊叹不已。

如今，翻译已成为亿万富翁的市场规模巨大。一方面，人工翻译价格昂贵且供不应求，而机器翻译的水平日益提高，带来更低的成本和更高的效率；另一方面，机器翻译的研究涉及自然语言的分析、转换和生成，可以作为自然语言处理的重要研发平台和人工智能的里程碑目标。

2006年，随着神经网络机器翻译（NMT）的出现，错误率大幅下降，各互联网巨头也推出了自己的机器翻译平台。不幸的是，NMT 并没有提供完美的解决方案，并且面临着许多挑战。

首先是翻译保真度的问题，因为翻译有可能丢失或跑掉。其次，低频词训练难度较大，有些实体词可能无法翻译；最后，对训练数据规模提出了更高的要求。

针对NMT面临的这些挑战，我们也做了相应的一些优化工作。为了提高翻译的保真度，我们使用交互式Attention模型来增强Attention机制，使用重构模型来加强翻译完整性的学习，并使用Rerank模型来选择更好的翻译；为了加强低频词的训练，我们引入了分词模型；为了提高训练效率，我们采用并行训练框架，支持多机多卡并行训练。

此外，我们还加入了深度网络、残差网络、模型融合等技术。目前我们支持中文、英语、粤语、日语、韩语、法语、德语、西班牙语、越南语等语言。

有了这样的机器翻译技术，我们也在积极寻求公司内外的应用，包括同声传译结合语音识别技术、拍照翻译结合图像识别技术、辅助翻译结合人机交互能力等。一方面一方面用于公司内部的微信、QQ手机、微云等产品。

另一方面，开放能力，赋能更多合作伙伴。我们已经在腾讯开放平台（AI.QQ.COM）上线了这些能力，期待在出境游、商务会议、跨境交流等场景中得到更广泛的应用。

站长声明

标签：

上一篇：腾讯云高扩展性区块链平台原理解析

下一篇：Elasticsearch DSL 基本语法

70% 的学生在开学时需要改变的事情，盘点明星同款非苹果电脑

从本周开始，各大学校都开始重新开放。虽然炎热的夏天还没有过去，但轻松的暑假已经结束了。对于商家来说，生死存亡的夏季促销结束后，就该为繁忙的返校季促销做准备了。据社交网站对弗拉基米尔大学生（男生出生、女生出生）的一项调查显示，数字产品已经成为大学生开学时

06-18
AI+教育装备厂商“锡鼎智智能”完成近亿元融资，由中业资本

投资圈领投（ID：pedaily）8月26日，AI+教育装备厂商“锡鼎智智能”宣布完成总融资A、A+轮近亿元融资，由中业资本领投，普金、浙商创投、鑫智投资跟投。据介绍，本轮资金将主要用于产品创新和市场拓展。锡鼎智智能开发了自己的AI智能评分实验教学与考核系统，利用摄像头无传

06-18
清华赵明国：AI芯片+机器人，突破算法瓶颈 - CCF-GAIR 2020

8月7日，全球人工智能与机器人峰会（CCF-GAIR）在深圳前海华侨城JW万豪酒店拉开帷幕。本次会议由中国计算机学会（CCF）主办，香港中文大学（深圳）、雷锋网（公众号：雷锋网）协办，鹏程实验室、深圳研究院协办人工智能和机器人技术。从2018年学术界与工业界的融合，到2016

06-18
实体清单影响下竞争力扩大，中芯国际第四季度利润突破12亿元

中芯国际第四季度实现营业总收入66.71亿元，同比增长10.3%；实现归属于上市公司股东的净利润12.52亿元，同比增长93.5%。

06-18
IDC：2018年第三季度中国可穿戴设备同比增长12.5%

12月25日，IDC发布《中国可穿戴设备市场季度跟踪报告》。报告显示，2018年第三季度中国可穿戴设备市场出货量为1万台，同比增长12.5%。基础可穿戴设备（不支持第三方应用的可穿戴设备）同比增长2.2%，智能可穿戴设备同比增长74.1%。其中，小米、华为、步步高、五洲无线位列

06-06
下一代 Switch 或在明年推出，开发套件已交付

下一代Switch可能会在明年推出，开发套件已经交付。 2019年3月3日，任天堂Switch正式发售。不到一天的时间，各个发售国家或地区的网上预购就被抢购一空，无数游戏玩家沉迷于这款设备带来的快乐。时隔六年，来自知名游戏媒体 VGC 的新传闻表明，任天堂计划在 2020 年发布下一

06-21
奇医医疗完成数千万元天使轮融资，经纬中国独家投资

2月23日，奇医医疗宣布完成数千万元天使轮融资。本轮融资由经纬中国独家投资。本轮融资所得资金将支持奇医医疗加快呼吸疾病全流程管理平台建设，深化公司在慢性呼吸疾病领域的领先布局。奇医医疗成立于今年4月，专注于慢性呼吸疾病领域，专注于全病程疾病管理系统和数字化

06-18
长电绍兴300mm集成电路中道先进封装生产线项目一期开建

长电绍兴300毫米集成电路中岛先进封装生产线项目一期开工建设。 2020年6月3日，长电集成电路（绍兴）有限公司毫米集成电路中道先进封装生产线项目一期厂房开工仪式在绍兴举行。握住。此次仪式标志着长电集成电路绍兴项目一期厂房工程正式启动。项目总用地面积亩，总投资80

06-06
重的！微软发布ChatGPT版搜索引擎，采用比ChatGPT更强大的技术

ChatGPT强大吗？ 2个月内超过1亿用户发现它非常强大，因此他们继续与它交谈。但 OpenAI 认为类似的大型语言模型可以更强大。于是他们与微软合作，将这种更强的语言模型放入搜索引擎Bing中，让它以对话的方式回答用户的搜索问题。该模型加入搜索后，提供的答案会更加相关，

06-21
亏损的三线便利店加盟商：转让难，关门就赔钱

01投资后悔的加盟商今年4月赶紧开店，如今7个月，王强加盟山东青岛某日本便利店品牌或决定“退出”。 “当时我无法做出决定，我以为坚持下去，生意会好起来。但是，当店附近开了几家折扣零食店后，我就不再有信心坚持下去了。 ”王强感叹到《灵兽》。 “今年的市场一片混乱

06-18
Eeeban易班完成数百万美元融资

投资界11月16日消息，据亿欧报道，在线教育SAAS平台Eeeban易班宣布完成数百万元融资，Eeeban易班班将推出“0元” ”计划，一家在线教育SAAS服务商，为创业者和中小型机构提供完全免费的平台。据悉，EeeBan易班在线教育SAAS平台是成都亿格可思（EagleX）数据有限公司（以下简

06-18
年轻人开始逛菜市场

01 年轻人为什么开始逛菜市场？ 2001年出生的王云开始喜欢逛菜市场。主要原因之一是它们很便宜。 “我平时很喜欢吃九九芽，但如果经常吃的话，长期下来会花很多钱。偶尔去小区附近的菜市场，发现也有来自武汉的红烧菜”九九鸭和品牌店相比，味道没那么好，主要区别是价格便

06-17