首页 > 科技未来 > 内容

智能语音,能听、能说、能改错,才是真正的智能

发布于:2024-06-18 编辑:匿名 来源:网络

先看一分钟视频【来源:东方卫视】:2018年,奥斯卡最佳原创剧本奖颁给了一部人工智能电影—— 《Her》,讲述男主角和他的电脑语音助手之间的浪漫故事。

在世界著名的科幻动画片《超能陆战队》中,萌萌的“大白”机器人沟通无障碍,既幽默又温暖。

近期,两部好莱坞科幻大片《超能查派》和《复仇者联盟2》相继上映。

核心人物角色是一种高科技人工智能生命体……随着科技的发展,曾经是科幻小说和影视作品中常见元素的人工智能,逐渐走进了我们的现实生活。

而当我们谈论“人工智能”时,就不能不谈论语音交互。

人与人之间的互动是自由的、任性的和传统的。

然而,人类的语言是如此多样,情感又如此丰富。

枯燥的“一串”语音交互识别已经不能满足自由人机交流的需求。

近日,在上海交通大学举办的中德双边研讨会上,SPEECH-上海交通大学智能语音实验室发布了认知人机对话系统技术,打破人与设备之间的沟通障碍。

该技术已进入应用开发阶段,预计年底将植入车载、家庭影院等领域。

突破技术瓶颈“自适应语音识别”打造更好的智能人机交互 智能语音实验室的负责人俞凯介绍,传统语音识别解决的是特定环境下的语音到文本的转换问题,它模拟了人的感知功能。

耳朵;更关键的是解决完整的口语人机交互问题,模拟人脑的全套认知功能。

认知智能语音技术是更高层次的人工智能,融合了自适应、理解纠错、智能反馈等认知技术。

这将使机器适应更多的环境和口音,并具有进化和调整的能力,从“能听能说”到“能听能做”:即能听懂所说的话,听什么,听不清楚。

能够提出问题,纠正错误,最终成功完成用户的任务。

SPEED——上海交通大学智能语音实验室研发的语音识别自适应技术,采用抗噪声技术、结构化深度学习技术、环境和说话人自动检测、软硬件结合的模型自适应调整技术。

它可以随时使用。

根据说话人口音和噪声环境的变化,自动选择最合适的模型进行识别,显着提高准确率。

人性化的语音交互告别单一语音识别时代。

正如人类在听不清的情况下也能听懂和说话一样,新型人性化智能语音交互技术包括“深度理解”和“自动纠错”技术。

“深度理解” 深度理解是结合机器的识别状况(如识别结果的可靠性、环境噪音的程度等)、用户的个人特征(如性别、方言地区、说话速度、等),并从大数据中提取说话情境(如对话的上下文领域、常识、之前对话的历史记录等)等因素,并根据这些“情境”重新计算识别结果”,大大提高了语义理解的准确性。

在存在歧义和错误的情况下,机器仍然可以通过多人人机对话进行通信。

让机器识别并理解人类自然语言中的关键意图和属性,然后对其进行处理。

前段时间,网上有一个视频很火,名叫《矫正哥》。

视频中,一名操着山东话的男子向安吉星说出了一长串电话号码。

可惜有一两处认错,他就频频打断,不断纠正。

给牛弹钢琴。

俞凯表示,“纠错哥”无法互动的核心难点在于谈话过程中的“打断”和“纠错”。

当汽车噪音较大时,偶尔出现一两位数字识别错误是正常的。

这种错误很难通过情境直接消除。

不过,通过逻辑联想和智能对话,或许可以帮助“正确哥”快速拨打电话。

真正的人机智能交互,是追求机器“听话”,成为真正具有进化和适应能力的“语音机器人”。

用得越多,它就越听话。

语音输入不再局限于刻板简单的句子限制,语音控制也不需要按照机器的设置来指挥。

在复杂环境和噪音的影响下,以及在自由发言的方式(如打断)下,仍能保证优异的性能。

仍能保证良好稳定的语音识别和语义分析精度。

未来的语音交互应该是面向用户的、人性化的智能交互,而不是过去的模块化交互。

智能语音,能听、能说、能改错,才是真正的智能

抛弃过去单一的语音交互,连接识别、语义理解和人机对话来帮助用户完成任务,将是一个全新的、划时代的变化。

学术与产业智能互动 SPEED-上海交通大学智能语音实验室成立于2006年,由上海理工信息技术有限公司与上海交通大学联合建立。

实验室里的负责人就是毕业于著名剑桥大学并获得博士学位的沃伦·俞凯。

在言语中。

他是上海市“东方学者”特聘教授,也是国内学术界“青年”中唯一一位来自智能语音技术行业的语音专家。

他构建的大词汇量连续语音识别系统在美国国家标准与技术研究院(NIST)和美国国防部的内部评估中多次获得冠军。

他也是全球最早从事端到端统计对话系统研究的研究者之一。

在真实工程系统上,上海交通大学与思必奇信息技术有限公司合作,率先发布了人性化的智能语音交互技术平台:对话工厂。

而在这个平台下,产学研融合,我们正在快速完成人性化智能语音交互技术从学术研究到商业运营的转变,进入民用市场,打造以用户为中心的“语音机器人”,引领人们。

机器口语与机器说话真正交互的“人工智能”趋势。

据悉,该系统将于下半年正式应用于智能汽车和家居领域。

智能语音,能听、能说、能改错,才是真正的智能

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 一家号称“真相帝”的公司,一个DEMO就能估值2亿

    一家号称“真相帝”的公司,一个DEMO就能估值2亿

    今天刀哥要说的公司,相当具有颠覆性。 他们做的商业调查大数据产品经常刷爆朋友圈。 很多企业在注册商标的时候,都想把能想到的名字都注册一遍。 比如,网友发现老干妈一次性注册了老干娘、神老马、老阿姨等商标……抢注各种商标也是如此。 毁三观,比如有一家历史上名字最长

    06-17

  • iPad mini将为谁“复活”?

    iPad mini将为谁“复活”?

    “即使只是换处理器,也不必要求全面屏。 ”作为多年iPad mini老用户的小志如实说道。 ▲ iPad mini 第五代(年份型号) 其实他用的是“最新”的 iPad mini 第五代(以下简称“iPad mini 5”),但为什么叫“老款”呢?仅仅因为iPad mini 5是2017年发布的,现在已经快三年了。

    06-21

  • MemVerge获1900万美元战略投资,推动数据中心“大内存计算”趋势

    MemVerge获1900万美元战略投资,推动数据中心“大内存计算”趋势

    雷锋网5月12日报道,MemVerge今日宣布完成英特尔等战略投资者1万美元融资、思科、NetApp 和 SK 海力士。 投资者方面,该公司此前的投资者高榕 Capital、Glory Ventures、Jerusalem Venture Partners、LDV、Lightspeed Venture Partners和Northern Light Venture Partners也参

    06-18

  • 全场景互动CEM服务商“小易数智”完成数千万元天使轮融资

    全场景互动CEM服务商“小易数智”完成数千万元天使轮融资

    据投资界(ID:pedaily)7月13日消息,近日,全场景互动CEM服务提供商“小医数智”宣布完成数千万元天使轮融资,由深创投领投,国宏嘉信资本跟投,青通资本跟投。 小蚁数智创始人&CEO宋博表示,本轮融资将主要用于SaaS产研团队的扩充、武汉产研基地的建设以及北京本地市场和

    06-18

  • 《知行合一》已完成近千万元天使轮融资

    《知行合一》已完成近千万元天使轮融资

    《知行合一》近日完成近千万元天使轮融资。 本轮融资由天使投资人黄建个人投资完成。 本次融资所筹资金将主要用于人才储备和补充流动资金。 智行合一成立于2019年10月,是一家总部位于广东珠海、专注于为失能、半失能老年人提供医养结合的服务型企业。 服务范围涵盖老年慢性

    06-17

  • 汽车智能科技公司“美嘉科技”完成超亿美元融资

    汽车智能科技公司“美嘉科技”完成超亿美元融资

    36氪独家获悉,汽车智能科技公司“美嘉科技”近期完成超亿美元融资,领投由超越资本。 湾区共同家园发展基金及南山资本、红点中国、山航资本等老股东也参与投资。 泰合之都充当专属财务顾问。 美嘉科技CEO庄莉透露,本轮融资发生得很快。 该项目于去年12月底启动,今年3月竣工

    06-18

  • 外资资管巨头蜂拥而至

    外资资管巨头蜂拥而至

    10月以来,上海迎来了包括负责人在内的多家知名外资金融机构的到访。 10月19日,上海市地方金融监管局局长周小全会见摩根士丹利投资管理亚洲区首席运营官、摩根士丹利基金管理(中国)有限公司首席运营官托德科尔特曼一行。 10月16日,周小全会见法国农业信贷银行(中国)有限

    06-17

  • 外媒:TikTok讨论不出售美国业务的解决方案

    外媒:TikTok讨论不出售美国业务的解决方案

    当地时间9月10日,据《华尔街日报》报道,TikTok母公司字节跳动正在与美国政府讨论可能的解决方案,以避免TikTok广受欢迎的应用程序短视频正在出售其全部美国业务。 自从中国政府采取措施加大TikTok向微软等美国科技公司巨头出售业务的难度以来,围绕TikTok不出售的讨论就变得

    06-18

  • 集成电路芯片开发商“中科瀚天下”获3000万元C轮融资

    集成电路芯片开发商“中科瀚天下”获3000万元C轮融资

    据投资界11月19日消息,集成电路芯片开发商“中科瀚天下”于今年8月完成万元C轮融资,同心企业、浑璞投资、南京科芯为新股东。 据了解,中科瀚天下成立于2007年,是一家集成电路芯片开发商。 主要从事射频/模拟集成电路和SoC系统集成电路的开发,以及应用解决方案的研究、开

    06-17

  • “易小象”完成Pre-A轮融资,南开大学创新基金注资

    “易小象”完成Pre-A轮融资,南开大学创新基金注资

    据6月10日消息,在线少儿象棋教育公司“易小象”近日完成Pre-A轮融资,获南开大学创新基金注资。 本轮融资之前,公司还获得了北塔资本的天使轮投资。 本轮资金将主要用于产品技术开发、人才引进和教学服务质量提升。 “玩小象”成立于2007年,专注于4-12岁儿童的象棋启蒙教育

    06-17

  • 20亿元专精特新(金华)母基金在金华启动

    20亿元专精特新(金华)母基金在金华启动

    据投资界(ID:pedaily)消息,3月28日下午,浙江省专精特新(金华)基金基金协议签字仪式在金华举行。 继浙江省科技创新专项基金(二期)之后,又一省级“四”专项资金落户金华。 浙江省专精特新(金华)母基金注册在金华市,总规模20亿元。 由浙江省产业基金、金华市产业基

    06-17

  • 天下无贼反信息诈骗联盟升维  大数据构筑新防御体系

    天下无贼反信息诈骗联盟升维 大数据构筑新防御体系

    天下无贼反信息诈骗联盟 升维大数据构筑新防御体系 2020年1月14日,全国首个反信息诈骗联盟——天下无贼反信息诈骗联盟召开新闻发布会,庆祝其成立深圳周年庆。 大会以“大数据天网,新系统防御”为主题,发布了《反信息诈骗大数据报告》(以下简称《报告》),首次对欺诈产业

    06-18