Facebook市值蒸发近500亿美元后,扎克伯格3月22日回应数据泄露
06-17
雷锋网记者:根据世界卫生组织今年3月发布的最新数据,全球超过5%的人口(约4.66亿人)患有残疾听力受损。
预计到今年这个数字将达到9亿。
同时,手语是听力障碍者常用的语言,但身体健全的人士能够正确理解手语的却很少。
5月16日,腾讯优图实验室联合深圳市信息无障碍研究会发布了“优图AI手语翻译机”。
据官方介绍,用户可以通过面对翻译机摄像头来表达手语,翻译机屏幕界面可以快速将手语转换为文本。
公开资料显示,腾讯优图实验室成立于2006年,是腾讯三大人工智能实验室之一。
去年,腾讯优图实验室升级为腾讯计算机视觉研发中心。
此外,还与国际期刊《科学》达成战略合作,共享计算机视觉领域的资源和信息。
手语识别技术已被隐藏多年。
任何技术的发展都不是一朝一夕就能实现的。
尤其是近年来,优图AI手语翻译机并不是第一个针对手语应用的产品。
在此之前,手语识别技术已经发展多年。
包括国内IT企业级科研机构都针对这项技术进行了研究,并推出了这样的成果和产品:今年7月,微软团队与中科院计算技术研究所合作,创建了通过Kinect For Windows进行手语识别软件,可以将手语动作跟踪和识别转换为正常人可以理解的内容; 2018年2月,中国科学技术大学发布手语识别论文被人工智能顶级学术会议AAAI收录;论文提出了一种新型连续手语识别框架LS-HAN,无需时间分割;根据 3 月份的一项新专利申请,Magic Leap 的头戴式设备可以识别手语和文本“感官眼镜”。
相关资料概述了利用头戴式设备检测和翻译手语的方法,并介绍了如何识别标牌和店面上的文字; 2020 年 7 月,软件开发者 Abhishek Singh 演示了一款可以理解手语手势的 MOD,让 Amazon Alexa 通过摄像头捕捉和深度学习来响应手语手势。
2020年12月,爱奇艺研发的AI手语主播在中国在线视听大会上首次亮相。
它可以识别用户的语音并将其转换为文本。
它还可以理解听力正常的人的自然语言,并将其智能地翻译成手语表达。
手语识别技术的困境与突破传统的手语识别方法通常针对特定的数据集设计合理的特征,然后利用这些特征对动作和手势进行分类。
受人工特征设计和数据量的限制,这些方法在适应性、泛化性和鲁棒性方面都非常有限。
近年来,得益于大数据和深度学习技术的不断进步,人工智能算法的发展也随之加大,特别是在计算机视觉、音频处理、自然语言处理等方面,促进了人工智能的应用算法在许多应用和场景中的应用。
实施后,研究人员开始尝试应用深度学习和数据驱动的算法来解决手语识别中的问题。
然而,与大多数计算机问题不同,手语独特的地域性、复杂性和多样性给人工智能算法带来了困难。
不仅增加了数据收集和清理的成本,也使得该技术的实施非常具有挑战性,难以在实践中应用。
目前,解决听障人士沟通问题的研究多集中在将文本转化为手语;反之,将听障人士的手语转化为文字则更加困难。
据公开资料,雷锋网获悉,腾讯优图实验室的手语识别数据集涵盖了近千个日常用语和10个常用词汇。
此外,优图AI手语翻译机可以实现整句话的识别和翻译。
用户表达时,无需设定特定的结束或开始动作,就可以连贯地表达整个句子,也无需刻意在句子中停顿或停顿。
速度慢。
优图AI手语识别技术的实现方法 据官方资料显示,优图AI手语翻译机的核心技术是与听障人士手语表达高度一致的数据集和手语识别算法。
关于AI手语翻译机的手语识别数据集、特征提取器等关键技术能力,雷锋网根据官方资料整理如下: 手语识别数据集 目前,AI手语翻译机的数据集??手语翻译涵盖近千种日常用语和常用词汇。
此外,收集的数据集还考虑了手语表达的地域性和多样性,包括不同的表达习惯和速度。
该特征提取器结合了普通2D卷积网络和3D卷积网络的优点。
它利用2D卷积网络提取手语中的手势、身体姿势等静态信息,同时利用3D卷积网络提取手语中细微的、共同的特征。
快速变换动作的动态信息,最后将两种信息结合起来生成最终的特征表达。
通过结合应用视频中的动态和静态信息,可以使用简单的RGB视频图像进行手语识别。
挖掘句子表达式中的词级信息。
该算法在视频帧和最终输出之间添加了词级信息提取单元。
词级信息提取单元利用长短期网络充分考虑特征提取器提取的信息,并结合视频中的相邻信息计算词级特征表达。
该单元使得算法能够更好地找到句子中单词表达的边界,提高总结各种区域表达的能力。
分割单个句子并充分考虑句子中上下文信息的算法会在提取词级信息的基础上充分考虑整个句子中的上下文信息,然后输出最终的识别结果。
同时,为了减少用户在使用过程中的限制,技术团队在手语识别之前添加了人脸检测和动作检测模块,通过人脸检测来确定手语表达者的位置,然后通过动作检测来判断是否是手语表达者。
用户正在表达手语。
。

目前,优图AI手语翻译机的AI手语识别技术虽然受限于计算机性能、语??料丰富度等因素,但随着人工智能和图像识别技术不断受到关注,目前包括旷世音响等国内独角兽公司而商汤科技,以及国内的BAT和国外的谷歌、微软、亚马逊,都投入了大量资金在这项技术的研究上。
智能语音技术带来智能音箱之后,AI视觉技术能否带来类似的热销硬件产品,此前大家更关注受众群体更大的智能摄像头。
腾讯优图此次发布的“优图”“AI手语翻译机”虽然难免有些“古怪”,但仍算得上是一次更加场景化的应用和尝试。
至于能否给特殊群体带来真正的便利,还需要通过真实应用场景中的用户反馈数据来呈现。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-17
最新文章
三只松鼠:门店扩张已全面暂停
Nvidia 已准备好“统治”AI
【创业24小时】2023年11月16日
【创业24小时】2022年10月20日
倒计时一天,浙江这座小镇要火了!
沃图网络获数千万A轮投资,加大投入海外网红营销SaaS平台建设
泰山天使基金部分退出拉手半年回报180倍
西格数据完成1000万元A+轮融资,国发创投领投