首页 > 科技未来 > 内容

索尼“无声语音识别”方式:颈挂式传感器,AI转换皮肤振动信息

发布于:2024-06-18 编辑:匿名 来源:网络

现在,对于听障群体来说,可以触摸到听不见的声音。

通过“触摸”听不到的语言是由东京大学和索尼计算机科学实验室(CSL)联合开发的AI系统“Derma”实现的。

借助Derma系统,只要将传感器贴在周围喉咙的皮肤上,利用喉咙和下巴的皮肤振动,就可以将嘴型转换成言语。

可以“触摸”的语言 根据病情的严重程度,目前治疗听力障碍的主流方法包括: 药物治疗:通过静脉滴注或局部滴剂(如激素、抗生素、抗病毒药物等)消炎,以达到治疗听力障碍的目的。

尽快恢复听力;手术治疗:主要针对外耳、中耳畸形、各种咽鼓管压迫性疾病、耳外伤等;仪器辅助:如助听器(听力损失≤80dB)、人工耳蜗(听力损失>80dB)。

其中,人工耳蜗植入是目前使重度或极重度聋的患者恢复听力的唯一有效方法。

雷锋网获悉,早在2009年,科学家就在法国首次将电极植入完全失聪患者的耳蜗中,让患者感知到周围的环境声音。

直到20世纪90年代,人工耳蜗才进入临床应用阶段,为重度耳聋的患者带来了“新生命”。

事实上,人工耳蜗的发展与电子技术、计算机技术、语音学、电生理学、材料科学、耳显微外科等的发展密不可分。

在这些学科兴起和发展之前,科学家对听力受损的患者的反应是一种称为塔多马(Tadoma)的触诊唇读法。

顾名思义,这种疗法是指有听力障碍的患者通过用手指触摸说话者的嘴唇、下巴和颈部来读出说话者想要表达的意思。

上述日本团队开发AI系统Derma的灵感最初来自Tadoma。

通过机器学习实现 Tadoma 自动化 该团队的设计实际上是通过机器学习实现 Tadoma 治疗过程的自动化。

从其原理上来说,如下图所示,将加速度/角速度传感器贴在喉咙周围的皮肤上,获取静音时下颌和舌头肌肉运动引起的从下颌到喉咙的皮肤振动信息。

发声,并使用深度学习进行分析。

识别,最终实现无声语音交互(SSI),将无声语音转换为语音输入。

雷锋网指出,该传感器可获取12维皮肤运动信息,深度学习可分析识别35种发声类型。

索尼“无声语音识别”方式:颈挂式传感器,AI转换皮肤振动信息

实验表明,识别皮肤震颤信息的准确率超过94%。

值得一提的是,研究团队使用连接主义时间分类(CTC)来训练模型。

事实上,在训练语音识别器的过程中,由于说话者语速等因素,很难将输入和输出对齐。

为了解决这个问题,连接时间分类就派上用场了。

从外观上来看,与现有的一些无声语音交互设备相比,该设备体积小、重量轻、不显眼。

此外,该系统功耗低,不易受环境亮度等因素影响,不会影响佩戴者的正常生活。

可以说是非常实用了。

此外,研究团队表示,转换后的语音合成不仅可以输入到具有语音识别功能的数字设备(语音助手)中,还可以帮助有语言障碍的患者进行交流。

未来,团队的研究方向将是可穿戴电子设备和体内嵌入式计算集成。

基于AI的无声语音交互 近年来,无声语音交互领域方兴未艾。

目前业界和学术界在该领域主要有两种思路——通过感知气流(气流采集)识别单词和通过感知肌肉运动(EMG)识别单词。

信号采集)。

以下是该领域发展的大致时间表: 2010年,麻省理工学院感觉通讯小组开发出一种触觉设备,可以克服清晰唇读的障碍,且成本比人工耳蜗植入手术低几个数量级; 2010年,牛津大学人工智能实验室、谷歌DeepMind和加拿大高等研究院(CIFAR)联合开发了结合深度学习技术的唇读程序LipNet; 2017年,DeepMind经过10000小时的新闻视频训练,将AI唇读准确率提升至46.8%。

; 2019年,世界知识产权组织公布了微软申请的“无声语音输入”专利,丰富了“机器理解人类语音”的场景; 2017年3月,浙江工业大学与中科院计算技术研究所智能信息处理重点实验室和中科院大学联合提出在局部特征层引入互信息约束,全局序列层增强口形特征与语音内容之间的关系,将计算机唇读的准确率提高到84.41%。

事实上,无声语音识别不仅可以帮助听力和语言障碍人士,还适用于灾难场景、舱外探索、水下作业、工厂车间等场景。

不过,静音语音交互设备想要真正成为消费级产品,还需要打磨。

正如微软全球高级技术院士、微软云与人工智能事业部负责人黄学东博士曾表示:虽然公开测试和发表的学术文章不能完全脱离现实,但与消费产品和商业场景相比,仍然需要不同判断标准。

关于Sony CSL 如上所述,Derma 是由东京大学和Sony CSL 联合开发的。

在中国人民大学出版社2017年出版的《索尼研究所的经营哲学》一书中,索尼CSL董事长索振雄阐述了索尼CSL的经营理念和管理理念。

因此,麦猫写道,索尼CSL遵循“小即是美”的经营理念,坚持不扩大规模。

由此诞生了很多“偏差天才”,也支撑了人才的“流通”。

雷锋网了解到,索尼CSL成立于2006年,作为索尼的“创新工厂”,广泛关注计算机科学、生命科学、脑科学、经济学等多个领域。

目前索尼CSL的研究方向包括“全球议程”(涵盖从能源到食品和医疗保健的问题)、“人类增强”(包括探索人类创造力和人机交互/集成的研究)和“网络智能”(AI)。

2020年11月,索尼宣布成立索尼AI部门,以“利用AI激发人类想象力和创造力”为使命,旨在推动AI技术的基础研究和发展。

索尼 CSL 总裁兼首席执行官 Hiroaki Kitano 是索尼 AI 的全球负责人。

主要的。

索尼“无声语音识别”方式:颈挂式传感器,AI转换皮肤振动信息

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 中关村集成电路设计园正式开园

    中关村集成电路设计园正式开园

    中关村集成电路设计园正式开园。 第二届“芯动北京”中关村集成电路产业论坛成功举办。 11月16日,中关村集成电路设计园正式开园并举办第二届。 “芯动力北京”中关村集成电路产业论坛成功举办。 本次活动在中国半导体行业协会和北京市相关委局的指导下,在中国半导体协会集成

    06-06

  • “云海曙造宁波城”来了,一起去一场知识与实践的盛会

    “云海曙造宁波城”来了,一起去一场知识与实践的盛会

    在宁波海曙区,一座既简约又现代的商业大厦矗立在涌水大桥旁。 22层高楼的玻璃是如此清澈透亮,似乎照亮了周围的建筑和溪流。 它建于2001年,有一个响亮的名字——宁波国际大厦。 2019年5月29日,这座大厦的顶层四层迎来了一位大客人的落户——宁波阿里中心。 宁波已经具备发

    06-18

  • 金鱼嘴基金块以新姿态助力南京创新崛起

    金鱼嘴基金块以新姿态助力南京创新崛起

    2019年新型冠状病毒肺炎疫情的爆发,导致全球经济面临增长放缓和结构调整,中国城市经济排名也面临着下滑一波“洗牌”。 随着今年上半年我国GDP数据的陆续公布,十大城市排名也正式出炉,依次为:上海、北京、深圳、重庆、广州、苏州、成都、杭州、南京、和天津。 此次排名前

    06-17

  • 王小川再次发布大模,不过这次是闭源的

    王小川再次发布大模,不过这次是闭源的

    8月8日,立秋的北京终于短暂摆脱了持续近两个月的酷暑,气温舒适。 海淀塞尔大厦,身穿黑色T恤的王小川迟到了。 自百川智能正式宣布启动以来,已经过去了近四个月的时间。 在此期间,百川七号B、百川十三号B相继开源,每两个月一个版本,进展迅速。 而他们的第三款大车型百川

    06-17

  • 首次发布 -雷睿科技完成数千万A轮融资

    首次发布 -雷睿科技完成数千万A轮融资

    投资社区(ID:pedaily)2月23日消息,近日,雷睿科技宣布完成数千万A轮融资,由蓝驰创投领投。 镭科技成立于2011年,是一家模具3D打印应用解决方案提供商,致力于3D打印技术在模具行业的深度工业应用。 创始人和CEO张国良毕业于中国人民大学和复旦大学,拥有多年的制造经验。

    06-17

  • 瑞萨电子推出 R-Car 联盟活跃合作伙伴计划

    瑞萨电子推出 R-Car 联盟活跃合作伙伴计划

    瑞萨电子推出 R-Car 联盟活跃合作伙伴计划,加速汽车移动领域的创新 55 家合作伙伴公司联合发起该计划,构建强大的生态系统,帮助客户快速、轻松选择解决方案 2020 年 10 月 16 日,日本东京 - 全球领先的半导体解决方案供应商瑞萨电子株式会社(TSE:)今天宣布启动“R-Car

    06-06

  • 人人网今年将赴美IPO,计划融资5亿美元

    人人网今年将赴美IPO,计划融资5亿美元

    据外媒报道,人士周五透露,中国社交网站人人网目前正在准备今年赴美IPO,预计筹集约5亿美元。 美元资金。   新闻人士表示,投行摩根士丹利、德意志银行和瑞士信贷将担任人人网首次公开募股的联席证券承销商。 据人士透露,人人网将于今年6月前向美国证监会提交上市申请。

    06-18

  • 运动医学龙头企业万杰天源获亿联资本超亿元战略投资

    运动医学龙头企业万杰天源获亿联资本超亿元战略投资

    据投资界4月26日消息,近日,北京万杰天源医疗器械有限公司(以下简称“万杰天源”)国内领先的运动医学公司(简称“万界天元”)获得精英资本过亿元战略投资。 这是精英资本在中国运动医学领域的又一投资举措。 WinX Capital担任独家投资者。 万杰天源是一家专业从事运动医

    06-17

  • 欢牛蛋糕屋完成近千万美元A轮融资,顺为资本独家投资

    欢牛蛋糕屋完成近千万美元A轮融资,顺为资本独家投资

    投资圈(ID:pedaily)据2月17日消息,原创甜品烘焙连锁品牌欢牛蛋糕屋宣布完成近美国融资1000万美元A轮融资。 本轮融资,由顺为资本独家投资,指数资本担任独家财务顾问。 本轮融资将主要用于门店扩张、供应链建设、品牌推广和团队建设。 目前,国内烘焙市场已达到近亿规模,

    06-18

  • 英飞凌科技被选为全球最具可持续发展企业

    英飞凌科技被选为全球最具可持续发展企业

    英飞凌科技股份公司再次入选道琼斯可持续发展全球指数,跻身全球最具可持续发展企业之列。 英飞凌从半导体行业47家参评企业中脱颖而出,成为全球指数上榜的六家企业之一。 该榜单由专注于可持续发展投资的专业机构RobecoSAM发布。 英飞凌首席财务官斯文施耐德博士表示:“我们

    06-06

  • 视频网站土豆网纳斯达克上市融资1.74亿美元

    视频网站土豆网纳斯达克上市融资1.74亿美元

    据投资界8月18日消息,视频分享网站土豆网正式登陆纳斯达克。 北京时间22:40开始交易,开盘价25.11美元。 较发行价低13.4%。 随后股价有所反弹,但始终没有回到发行价之上。 盘中最高价27.75美元,收盘价25.7美元,较发行价下跌11.38%。 它筹集了1.74亿美元,市值超过7亿美元

    06-17

  • 为什么我看好“小程序”?

    为什么我看好“小程序”?

    Airbnb 再次筹集资金。 据BI报道,该公司已筹集5.55亿美元新融资,估值达1亿美元,由Google Capital和Technology Crossover Ventures领投。 这是其上个月 8.5 亿美元融资计划的一部分。 对于Airbnb员工来说,此次融资最重要的或许是他们可以在交易中出售部分股份。 Airbnb 是

    06-17