华培电力与江苏北人作为LP入股中科创兴
06-18
人工智能仍处于探索阶段,对话机器人开发者正从最基础的层面开始打造深度学习。
最终产品差异很大。
但最终,通用方法都属于同一类别。
一开始大家都用了最容易实现、最能想象到的方法:关键词匹配。
后来,基于词序结构判断用户语言内容的方法逐渐开始出现。
如今,深度学习正在席卷整个人工智能行业。
它已被用于对话机器人的训练。
加拿大皇家科学院院士最近提出了一种应用于其产品的相对创新的深度学习理论和架构。
通过这个架构,他们的产品“博言豆豆”可以自主学习并更新对话的响应内容。
李明院士表示,他和他的团队在人工智能基础理论方面下了很多功夫。
他认为,人工智能的进步将源于基础理论的进步,而不是工程上的进步(比如关键词匹配技巧)。
以下是李明院士在第三届机器人峰会上关于伯彦豆豆架构原理的演讲。
NLPCC今年10月组织了一次测试,设计了1000个问题向机器人提问。
这1000个问题考验了中国最先进的对话技术。
参加测试的对话机器人包括博彦豆豆和图灵机机器人出去提问。
还有小i机器人、微软小冰、百度度米等。
其中,出门问问最近融资7000万美元,微软小冰拥有4000万用户,百度度米曾与李克强总理对话并获得总理喜爱。
但这次第三方测试的结果是,只有豆豆通过了。
其他都失败了,豆豆就及格了,成绩在60出头。
第二个是图灵机器人。
当我提问时,百分之十以上的人,包括小我、小兵、小杜,都没有通过。
其他机器人可能比回答问题更擅长对话。
但我认为一个只说废话的聊天机器人肯定行不通。
知识就是力量。
想要做出一个好的聊天机器人,必须有大量的知识作为后盾。
人工智能的革命始于机器学习对话。
人类的智慧始于说话。
语言赋予人们组织和进一步思考的能力。
至于人工智能的革命,我们认为也是从学习语言开始的。
这就是我们现在正在做的事情。
我们发现这也非常鼓舞人心。
但机器人如何学习说话呢?每个人都听说过阿尔法戈。
当Alphago与欧洲围棋冠军对弈时,它的棋艺并不是很好。
但在接下来的四五个月里,他和自己下了三千万盘棋,期间其能力增长了不少。
和李世石下棋时,李世石几乎没有机会。
Alphago的3000万盘棋没有白下。
玩完之后就可以知道是输了还是赢了。
通过对输赢的反馈,他可以改善他的价值网络。
知道哪一步容易输,哪一步容易赢,这样训练它的神经网络。
但是说话呢?如何判断它说的是好还是坏?现在市场上有很多机器人告诉大家他们会学习,他们的机器人会通过用户的反馈来学习。
这个说法%不可靠。
首先,大家都听说过小冰。
就是说,如果用户教你一些不好的东西,你又无法过滤掉,那就很麻烦了。
第二,你有多少用户? AlphaGo已经与自己对弈了3000万盘棋,每盘棋可以走数百步。
如此大量的数据不可能来自于用户。
用户数据量并没有那么大。
如果你想让计算机学会说话,你必须训练计算机自言自语。
仅仅对自己说话是不够的。
你还得有一个方法去估计这个词是好是坏,所以这是一个特别困难的事情。
下围棋比Alphago困难得多。
这里我给大家介绍一下我们博彦是如何用我们的数学理论来解决这个问题的。
让豆豆自己来说吧。
比下围棋难多了。
这里我们就讲一个很小的方面。
让我介绍一个数学理论。
这个数学理论可以教你如何估计这句话是好是坏。
我举了一个很小的例子,他想学习类似的问题。
喜欢天气吗?如果我教你如何直接说话,我就会教你今天的天气怎么样。
当你学习之后,你也许可以回答今天天气怎么样,比如很热等等。
但是如果我换个方式问,我会问明天怎么样。
你必须编写一个新的模板,而对话的变化是无穷无尽的。
因此,不可能这样编写模板。
最好的方法是有一个理论来定义什么是语义相似性、什么是相似的、什么是不相似的。
这就是我们要解决的问题。
这也是人工智能50年来都没有解决的问题。
但我想提出一个替代解决方案来解决这个问题。
这是豆豆用来学习句子相似形式的LSTM算法,说起来比较复杂。
但这个东西最重要的是,如果我说这两个相似,那么到底相似还是不相似呢?你必须给我反馈,你必须有办法告诉我是否相似。
判断训练效果的关键:“语义距离”和“信息距离”。
如何反馈?这就需要设计一个最基本的理论概念和数学概念。
这就是所谓的“语义距离”。
这是一个非常重要的概念,但人工智能发展了50年,却没有人知道如何计算或定义它。
这就像大家都知道图灵机器人一样。
这个东西有一个概念,但无法定义它是什么。
它是不可计算的,而语义就是这样的东西。
语义是不可计算和不可定义的。
我们想知道今天的天气怎么样,并且想知道语义距离为0。
那么如何定义一个数学理论来解决这个问题呢?我希望我可以在这里给你一个更简单的解释。
让我先给你定义一些别的东西:例如,有两个句子。
我想定义这两个句子之间的距离,以及任意两个实体之间的距离。
只要有信息,就会有。
我们将其定义为“信息”。
然后我用信息距离来近似描述“语义距离”。
那我们怎么办呢?我们从一个特别漂亮的数学理论开始,我们的出发点是用物理学的公理来推导所有需要做的事情。
这就是我们和其他所有厂商不同的地方,这个理论是5个人共同发明的,我是其中的一个,我首先需要定义这个信息距离是一个非常复杂的东西,不能用传统的方法来定义。
,因为传统的定义肯定行不通,那我怎么办呢?比如我们有两个信息载体,X和Y。
现在我需要计算这两个信息载体之间的距离,那么我们的信息定义呢?距离是两条信息X和Y之间的距离,就是将它们转换所需的能量,也就是比特数,一个不可逆的数。
我们证明了一个定理,用这个公式可以表达最小的信息量。
,这个K是一个复杂度。
如果您有兴趣,可以阅读我们的书。
这本书是我写的。
我将X和Y转换所需的最小能量定义为X和Y之间的信息距离:D(X,Y)。
以上是信息距离。
前面我们提到的叫做语义距离。
我们使用信息距离来近似语义距离。
我可以证明的一件事是,如果你有任何可计算的距离,则可以模拟近似的语义距离。
那我的信息距离一定比你小!这意味着我的距离比你的好。
您根本不需要计算语义距离或近似值,只需距离就足够了。
我一定比你更好。
好吧,现在我们先从理论开始,不谈证明过程。
它从理论上解决了语义距离、不可逆性、不可定义性问题。
虽然这是不可计算的,但是信息距离的定义意味着我只需要对其进行压缩和编码即可。
所以基本上可以用在自然语言中。
所以我就这样给豆豆提供了一个理论。
我认为人工智能的进步首先必须基于理论的进步,而不是工程关键词或者模板匹配。
结论 李明院士坚信理论基础的建立是应用进步的基础,并坚持贯彻这一理念。
事实上,我们也同意这个观点。
这也是最近人们对图灵测试的质疑背后的想法:即使机器人能够匹配和搜索关键字完美回答你所有的问题,你甚至无法分辨它是人类还是机器人。
这并不意味着它有思考的能力。
只有人工智能理论不断发展,真正探索出一种能够创造智能的方法,才能赋予机器人真正的“智能”。
冯·诺依曼在一次演讲中说:只要你清楚地描述了被认为是计算机无法解决的问题,计算机总会找到解决的方法。
我们现在最需要的是对我们希望计算机解决的问题的精确定义。
由此看来,李明院士及其团队对语言意义和效果定义的“语义距离”和“信息距离”两个概念,或将成为人工智能领域未来进步的基石之一。
让我们期待这些睿智的学者和科学家创造出越来越多的人性化产品,同时也在人工智能理论领域取得更多突破。

题图来自xuite.net。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-08
06-21
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态