中关村集成电路设计园正式开园
06-06
现在,对于听障群体来说,可以触摸到听不见的声音。
通过“触摸”听不到的语言是由东京大学和索尼计算机科学实验室(CSL)联合开发的AI系统“Derma”实现的。
借助Derma系统,只要将传感器贴在周围喉咙的皮肤上,利用喉咙和下巴的皮肤振动,就可以将嘴型转换成言语。
可以“触摸”的语言 根据病情的严重程度,目前治疗听力障碍的主流方法包括: 药物治疗:通过静脉滴注或局部滴剂(如激素、抗生素、抗病毒药物等)消炎,以达到治疗听力障碍的目的。
尽快恢复听力;手术治疗:主要针对外耳、中耳畸形、各种咽鼓管压迫性疾病、耳外伤等;仪器辅助:如助听器(听力损失≤80dB)、人工耳蜗(听力损失>80dB)。
其中,人工耳蜗植入是目前使重度或极重度聋的患者恢复听力的唯一有效方法。
雷锋网获悉,早在2009年,科学家就在法国首次将电极植入完全失聪患者的耳蜗中,让患者感知到周围的环境声音。
直到20世纪90年代,人工耳蜗才进入临床应用阶段,为重度耳聋的患者带来了“新生命”。
事实上,人工耳蜗的发展与电子技术、计算机技术、语音学、电生理学、材料科学、耳显微外科等的发展密不可分。
在这些学科兴起和发展之前,科学家对听力受损的患者的反应是一种称为塔多马(Tadoma)的触诊唇读法。
顾名思义,这种疗法是指有听力障碍的患者通过用手指触摸说话者的嘴唇、下巴和颈部来读出说话者想要表达的意思。
上述日本团队开发AI系统Derma的灵感最初来自Tadoma。
通过机器学习实现 Tadoma 自动化 该团队的设计实际上是通过机器学习实现 Tadoma 治疗过程的自动化。
从其原理上来说,如下图所示,将加速度/角速度传感器贴在喉咙周围的皮肤上,获取静音时下颌和舌头肌肉运动引起的从下颌到喉咙的皮肤振动信息。
发声,并使用深度学习进行分析。
识别,最终实现无声语音交互(SSI),将无声语音转换为语音输入。
雷锋网指出,该传感器可获取12维皮肤运动信息,深度学习可分析识别35种发声类型。

实验表明,识别皮肤震颤信息的准确率超过94%。
值得一提的是,研究团队使用连接主义时间分类(CTC)来训练模型。
事实上,在训练语音识别器的过程中,由于说话者语速等因素,很难将输入和输出对齐。
为了解决这个问题,连接时间分类就派上用场了。
从外观上来看,与现有的一些无声语音交互设备相比,该设备体积小、重量轻、不显眼。
此外,该系统功耗低,不易受环境亮度等因素影响,不会影响佩戴者的正常生活。
可以说是非常实用了。
此外,研究团队表示,转换后的语音合成不仅可以输入到具有语音识别功能的数字设备(语音助手)中,还可以帮助有语言障碍的患者进行交流。
未来,团队的研究方向将是可穿戴电子设备和体内嵌入式计算集成。
基于AI的无声语音交互 近年来,无声语音交互领域方兴未艾。
目前业界和学术界在该领域主要有两种思路——通过感知气流(气流采集)识别单词和通过感知肌肉运动(EMG)识别单词。
信号采集)。
以下是该领域发展的大致时间表: 2010年,麻省理工学院感觉通讯小组开发出一种触觉设备,可以克服清晰唇读的障碍,且成本比人工耳蜗植入手术低几个数量级; 2010年,牛津大学人工智能实验室、谷歌DeepMind和加拿大高等研究院(CIFAR)联合开发了结合深度学习技术的唇读程序LipNet; 2017年,DeepMind经过10000小时的新闻视频训练,将AI唇读准确率提升至46.8%。
; 2019年,世界知识产权组织公布了微软申请的“无声语音输入”专利,丰富了“机器理解人类语音”的场景; 2017年3月,浙江工业大学与中科院计算技术研究所智能信息处理重点实验室和中科院大学联合提出在局部特征层引入互信息约束,全局序列层增强口形特征与语音内容之间的关系,将计算机唇读的准确率提高到84.41%。
事实上,无声语音识别不仅可以帮助听力和语言障碍人士,还适用于灾难场景、舱外探索、水下作业、工厂车间等场景。
不过,静音语音交互设备想要真正成为消费级产品,还需要打磨。
正如微软全球高级技术院士、微软云与人工智能事业部负责人黄学东博士曾表示:虽然公开测试和发表的学术文章不能完全脱离现实,但与消费产品和商业场景相比,仍然需要不同判断标准。
关于Sony CSL 如上所述,Derma 是由东京大学和Sony CSL 联合开发的。
在中国人民大学出版社2017年出版的《索尼研究所的经营哲学》一书中,索尼CSL董事长索振雄阐述了索尼CSL的经营理念和管理理念。
因此,麦猫写道,索尼CSL遵循“小即是美”的经营理念,坚持不扩大规模。
由此诞生了很多“偏差天才”,也支撑了人才的“流通”。
雷锋网了解到,索尼CSL成立于2006年,作为索尼的“创新工厂”,广泛关注计算机科学、生命科学、脑科学、经济学等多个领域。
目前索尼CSL的研究方向包括“全球议程”(涵盖从能源到食品和医疗保健的问题)、“人类增强”(包括探索人类创造力和人机交互/集成的研究)和“网络智能”(AI)。
2020年11月,索尼宣布成立索尼AI部门,以“利用AI激发人类想象力和创造力”为使命,旨在推动AI技术的基础研究和发展。
索尼 CSL 总裁兼首席执行官 Hiroaki Kitano 是索尼 AI 的全球负责人。
主要的。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-17
06-17
06-17
06-06
06-18
06-17
06-06
06-17
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态