70% 的学生在开学时需要改变的事情,盘点明星同款非苹果电脑
06-18
简介:感谢您阅读腾讯AI Lab微信号第12篇文章。在昨天举行的腾讯全球合作伙伴大会上,腾讯AI Lab披露了AI发展布局的最新进展。
本文整理了腾讯AI的发展路线图、游戏AI研究的挑战与应对、多媒体AI从图片到视频的演变、惊艳的同声传译产品等四大演讲的实用内容,供读者欣赏。 。
完整的文章可以在官方网站上阅读。 1. 腾讯AI路线图:共享AI是大势所趋《共享AI:让AI无处不在》演讲嘉宾:腾讯AI实验室主任张彤博士 张彤博士的演讲勾画了AI产业未来发展的路线图:共享AI的三大关键要素共享AI:企业共享研究应用成果、行业共享开发平台、学术界共享新思想的“共享AI时代”。
“在将AI Lab的愿景定为企业级人工智能实验室时,我们希望代表腾讯打造世界一流的人工智能能力,让技术以创新的方式解决人类面临的困难和挑战,让人工智能无处不在。不是(让人工智能无处不在)。
”张波表示,腾讯的AI发展路线将围绕企业、产业、学术界的人工智能共享与合作,一是企业内外共享研究和应用成果,缩短技术迭代时间,小步打造核心技术竞争力。在研究方面,腾讯AI实验室成立一年来就以“学术影响力、产业输出”为发展目标,在计算机视觉领域的CVPR、自然领域的ACL等方面取得了成果。
语言处理、机器学习领域的ICML、NIPS论文被多个顶级AI学术会议收录,机构研究能力位居国内前列。检测MegaFace Challenge2和前沿的图像描述生成数据集Microsoft MS COCO在应用方面,除了已经在微信、QQ、音乐、视频平台上落地的技术外,我们还围绕核心进行了针对性的技术突破。
游戏、内容、社交等业务,通过技术提升用户游戏体验,内容AI中文文字、图像和视频。理解、生成和推荐,以及社交AI中的终端硬件和新型交互方式等。
二是共享产业大生态,赋能中小从业者和传统产业。一方面,面向中小从业者和合作伙伴共享人工智能基础能力。
例如,通过腾讯开放平台,开放算法、数据、模型等人工智能基础能力,为从业者提供方便易用的API和SDK。人工智能服务解决方案。
另一方面,针对传统行业,腾讯通过“行业AI+X”计划以及AI创业者的支持,开放AI能力,推动AI在更多垂直领域的落地。例如,腾讯发布的首款AI医学影像产品“腾讯觅影”,利用AI Lab技术检测早期食管癌,准确率高达90%;而本次论坛发布的“AI生态计划”将以场景、技术、人才为基础。
从资本与资本四个方面全面支持AI创业者,与合作伙伴共建共享AI产业生态圈。三是学术界共享新理念,反向将行业资源和经验输入AI人才“造血库”。
我们宣布启动全球博士奖学金计划。前者将为入选的博士生提供丰厚的奖学金,并有机会在AI实验室进行实地研究,接触真实的需求和数据,与学术界共同培养AI领域的顶尖人才。
此外,每年一度的学术论坛也被打造成为吸引国外顶尖学者来华进行学术研究交流的顶级平台。 2. 游戏AI:赋能现实世界,研究的意义远超游戏《游戏AI:虚拟世界对物理世界的赋能》 演讲者:腾讯AI实验室机器学习中心负责人刘瀚博士我们最想强调的是游戏AI的意义研究——它远远超出了游戏本身。
这是一个具有挑战性且令人兴奋的研究课题。研究中积累的经验、方法和结论可以在更广泛、更深远的范围内运用。
一是打通虚拟与现实世界的壁垒,为物理世界赋能,如无人驾驶汽车、机器人的发展;其次,游戏中对话智能的研究可能成为强人工智能的重要路径;第三,研究游戏中人、智能体和环境之间的交互可以使智慧城市等复杂且影响深远的项目受益。游戏人工智能是人工智能和博弈论的交叉点。
从小的角度来说,游戏AI研究如何利用人工智能技术来改善人类玩游戏的体验。从大的角度来看,游戏人工智能研究人、代理和环境之间的复杂交互。
游戏AI驱动人工智能的发展,击败从国际象棋到围棋的人类顶尖棋手,目前挑战的游戏也从桌游转向《星际争霸》即时战略(RTS)和《DOTA 2》多人在线对战( MOBA)等游戏。游戏AI涉及三大核心能力:外部环境的感知、基于状态的决策以及人与智能体的对话。
例如,在围棋的游戏场景中,你可以通过感知棋盘的全局表情状态来决定将棋子放在哪里。现实中,无人驾驶汽车还可以通过视觉和激光雷达感知来做出方向盘、制动等动作的决策。
了解游戏AI的三大核心能力。接下来我会解释一下研究中的三个核心挑战以及腾讯的解决方案。
第一个挑战是游戏的状态空间太大。例如,许多策略游戏的状态空间是无限维的,比围棋空间大得多。
腾讯提出了一种集模型、算法和计算架构为一体的解决方案,称为腾讯机器大脑。整个系统的核心是利用深度神经网络对超大规模状态空间进行建模。
第二个挑战是许多复杂的多人游戏需要多个智能体的协调运作,而目前这方面缺乏理论。为了设计一个完整的多智能体人工智能,一个核心问题是将强化学习的价值网络与描述宏观策略的行为树进行互操作和集成。
第三个挑战是,大多数游戏人工智能是在理想化的虚拟世界中使用模拟器开发的。如何连接虚拟和现实是另一个核心挑战。
我们的解决方案结合了逆强化学习和动态探索机制,对游戏人工智能中的参数进行贝叶斯升级。由此产生的系统可以以最低的成本成功部署在现实世界中。
这套感知、对话和决策模块组成了一个通用系统,未来有望应用于现实中更多场景。这就是我们所说的虚拟赋能现实。
多媒体AI:从图片到视频的深度内容探索《多媒体AI:睁开机器之眼》演讲嘉宾:腾讯AI Lab计算机视觉中心负责人刘伟博士我们正在进入“多媒体内容消费”时代,每个中国人都在消费每天都有大量的内容 多媒体内容也提供了大量的多媒体数据。在人工智能领域,多媒体人工智能将赋予计算机处理、识别和理解内容的综合能力。
从图像到多媒体,数据维度得到了极大的提升。我们希望走自主创新的道路,所以我们发展了人工智能的三大基础能力:处理、识别、理解。
我们的目标是通过建立覆盖生成、处理、识别、理解、分发等多种人工智能基础能力的有效技术矩阵,打造最好的多媒体人工智能技术。该应用涵盖了从视频制作到视频推荐的完整视频。
产业链。数字内容是腾讯的战略之一。
内容AI是腾讯AI Lab的四大应用方向之一,多媒体AI首当其冲。我们的愿景是成为全球范围内内容人工智能的领导者、实践者和贡献者。
我们也取得了一些科研成果。例如,它在OCR(Optical Character Recognition,翻译为光学字符识别)任务中取得了六个第一,其中三个针对在线图像文本,另外三个针对聚焦场景文本。
我们把算法识别准确率提高到了90%以上,这是一个巨大的提升。二是视频人脸检测与识别。
需要克服视频中人脸的低分辨率、姿势、遮挡、表情、化妆、光照等挑战。我们在这方面也取得了比较好的成绩。
还有图像描述生成技术。我们对整个深度学习架构(包括卷积神经网络、长短期记忆网络、多阶段注意力)进行端到端训练,实现从图像到文本的有机过渡,获得良好的模型。
该技术目前在最权威的MS COCO数据集上排名第一。基于这项技术,人们上传到QQ空间后,机器就能知道图片在说什么;进行图像搜索、图像推荐以及图文对话;帮助视障人士看到图像世界。
AI翻译:AI同声传译惊艳全场《翻译AI:重建巴别塔》演讲者:腾讯AI实验室机器翻译平台负责人杨跃奎。准确、自然、流畅的同声传译产品让现场观众惊叹不已。
如今,翻译已成为亿万富翁的市场规模巨大。一方面,人工翻译价格昂贵且供不应求,而机器翻译的水平日益提高,带来更低的成本和更高的效率;另一方面,机器翻译的研究涉及自然语言的分析、转换和生成,可以作为自然语言处理的重要研发平台和人工智能的里程碑目标。
2006年,随着神经网络机器翻译(NMT)的出现,错误率大幅下降,各互联网巨头也推出了自己的机器翻译平台。不幸的是,NMT 并没有提供完美的解决方案,并且面临着许多挑战。
首先是翻译保真度的问题,因为翻译有可能丢失或跑掉。其次,低频词训练难度较大,有些实体词可能无法翻译;最后,对训练数据规模提出了更高的要求。
针对NMT面临的这些挑战,我们也做了相应的一些优化工作。为了提高翻译的保真度,我们使用交互式Attention模型来增强Attention机制,使用重构模型来加强翻译完整性的学习,并使用Rerank模型来选择更好的翻译;为了加强低频词的训练,我们引入了分词模型;为了提高训练效率,我们采用并行训练框架,支持多机多卡并行训练。
此外,我们还加入了深度网络、残差网络、模型融合等技术。目前我们支持中文、英语、粤语、日语、韩语、法语、德语、西班牙语、越南语等语言。
有了这样的机器翻译技术,我们也在积极寻求公司内外的应用,包括同声传译结合语音识别技术、拍照翻译结合图像识别技术、辅助翻译结合人机交互能力等。一方面一方面用于公司内部的微信、QQ手机、微云等产品。
另一方面,开放能力,赋能更多合作伙伴。我们已经在腾讯开放平台(AI.QQ.COM)上线了这些能力,期待在出境游、商务会议、跨境交流等场景中得到更广泛的应用。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-17
最新文章
【玩转GPU】ControlNet初学者生存指南
【实战】获取小程序中用户的城市信息(附源码)
包雪雪简单介绍Vue.js:开学
Go进阶:使用Gin框架简单实现服务端渲染
线程池介绍及实际案例分享
JMeter 注释 18 - JMeter 常用配置组件介绍
基于Sentry的大数据权限解决方案
【云+社区年度征文集】GPE监控介绍及使用