总规模达1亿 浙江江山设立“两山”转型领域产业基金
06-18
人工智能的两个研究分支:一是科学,二是应用。
在人工智能科学领域,人们一直有一个疑问:机器会思考吗?在过去的60年里,像专家这样的计算机一直在试图回答这个问题。
在人工智能应用方面,研究人员正在探索它如何影响和影响人类。
杨强提到,人工智能的成功有五个必要条件:清晰的商业模式、高质量的大数据、明确的问题定义以及了解人工智能两个领域、擅长应用和算法计算能力的跨界人才。
人工智能在机器学习和深度学习方面取得了很高的成就。
此外,另一种技术也开始应用:强化学习。
强化学习不仅可以学习人类行为,还可以更好地利用延迟反馈功能。
那么,人们能否发明一种新的学习方法,可以将大数据模型应用于小数据呢?所以杨强提到了迁移学习。
迁移学习是深度学习和强化学习的叠加。
三层结构算法系统 目前的人机交互对话系统包括聊天型和功能型。
从技术角度来看,这种对话系统分为两种类型。
第一种是最早出现的基于规则的系统。
这些就像在符号领域一样,它的优点是非常准确。
但问题是扩展困难,对数据不够敏感。
此外,它无法应对许多不同的突发事件,因此学术界正在关注机器学习算法。
至于机器学习算法,杨强认为深度学习之后的最新算法模型是一个三明治般的三层结构:第一层是递归深度学习,其上的第二层有强化学习学习器。
第三层是迁移学习,可以将现有模型迁移到新领域。
循环深度神经网络RNN(深度学习)强化学习RL迁移学习TL成熟的人机交互对话系统算法模型能否应用于其他领域?杨强现场演示了将对话系统集成到机器人响应中。
随后,他提到他的学生已经将这套系统应用在金融领域进行股市预测。
一旦人们掌握了某个领域,将其应用到其他领域就是迁移学习的作用。
个性化迁移深度学习离不开大数据。
强化学习注重反馈,但离不开大数据。
大数据离不开大公司。
当其他公司没有大数据时,他们该怎么办?杨强提出,一些为大数据设计的模型可以用在小数据上,其副产品就是个性化。
这就是迁移学习的目的。
有了这个系统,如果你切换到其他领域,就不需要收集大量的数据,直接应用模型就可以了。
就像一个人学会骑自行车一样,他或她几乎学会了骑摩托车。
迁移学习分为两种:样本迁移和特征迁移。
其应用场景如下: 基于模型的迁移:比如图像识别,几万张图片的训练胜过几千万张图片。

相似度越大,迁移的概率就越大。
社交网络之间的迁移:将千万人的大数据模型迁移到一个人身上。
最后,杨强指出,人工智能有很多领域,迄今为止最成功的领域是机器学习。
机器学习的一个基本概念是从数据中经常重复的现象中学习规则,从而解决现实中简单而繁琐的问题。
工作岗位被取代。
以下为杨强讲话实录。
今天早上我听到了一个非常激动人心的报告。
在这里我想跟大家分享一些我个人的想法,特别是今天。
大家都知道,人工智能已经取得了很多成就。
我们可以总结一下吗?一点点经验可以为我们后面的人所用。
首先,我们看到人工智能取得了很多成就,特别是在商业领域。
我们看到,在图像识别、语音识别,包括大规模的产品推荐,今天每个人都是这些服务的用户,我们都受益。
到它。
但我们有没有想过,这些人工智能成果是在什么条件下产生的,为什么这些成果在十年、二十年前还没有呢?那么下面我们就来问这些问题。
在提出这些问题之前,我们首先必须区分人工智能的两个研究分支。
一是人工智能科学。
人工智能科学必须追溯到其鼻祖图灵提出的最关键、最核心的问题:机器能思考吗?经过60多年的努力,人人都是计算机科学家,各行各业都在朝着这个方向努力。
我们建造更快的计算机,收集更多数据,研究更先进的算法。
我们都在努力回答这样的问题。
今天人工智能的成就只是为我们将其应用到生活中提供了机会,那么这就带来了一个新的问题,那就是我们如何预测一项人工智能技术是否能够产生它应有的结果?角色。
我们都说如果它有广泛的应用,那也是它成功的标志。
所以今天我想看一下人工智能的应用条件,驱动它产生它应该有的应用。
这里我想说人工智能已经取得了很大的成就,比如机器学习、深度学习,但是我们现在看到的一些线索已经让我们有一个非常兴奋的理由,这就是强化学习。
它不仅可以学习人类的行为,而且还可以特别好地利用这种延迟反馈,可以延迟一段时间。
明天我们能否发明一种可以应用于小数据的新学习方法?这就是我下面要讲的迁移学习。
所以我们也从这个角度来看,我们可以用哪些人工智能技术来让它达到预期的效果。
说到强化学习,Michael Wooldridge 刚刚提到了 Deepmind。
我也是 Deepmind 的粉丝。
这是Deepmind的一个过程。
我们观察这个过程之后,我们可以了解到,这是计算机内部的一种表达形式,适量,这个加入适量我们得到的反馈,可以帮助我们改进我们的策略。
这个策略是什么?就是我们平时所说的行为规划,我们的工作规划,游戏中的动作对应着一个策略。
该策略返回并生成一个新的界面。
当我们观察这个界面的时候,我们就可以回去学习了。
你看,这里的优点是这个反馈是连续给出的,只有到了最后才知道我们是赢家还是输家。
现实生活中我们是否有很多这样的例子不是使用深度学习选择的?例如,当我们学习一门课程时,我们只有在考试时才知道自己的成绩。
当我们投资一只股票时,要经过很长一段时间才能知道效果,所以这就是延迟反馈。
但这种学习有一个弱点,那就是如果我们人为地定义这个策略中的空间,称为状态空间,那么局限性是非常大的,因为我们人类永远无法确定,也永远无法提前预测出什么是状态。
世界会做的。
发生了什么?这就是Google Deegming的第二个目标,那就是端到端的深度学习。
正确的状态是在学习者内部表达的。
结果,我们形成了从输入端到输出端的端到端深度。
学习,经过几百轮的学习,我们学会了如何更好地玩一个游戏。
这就是当时的学习效果。
每张图片对应不同的游戏。
横轴显示,随着时间和游戏轮数的增加,我们看到它的效果越来越好。
这和我们人类的学习过程是一样的。
我们说这个人的学习效率大大提高了,他的学习效果大大提高了。
我们总结一下,这些成功来自于什么?我们首先可以看到它有一个非常明确的目标,什么是赢,什么是输,而且它在业务上也必须有强烈的目标。
其次,我们需要高质量的大数据。
我在这里想强调的是高质量。
该数据必须不断反馈。
不能收集一次就结束了。
只有不断到达,才能不断提高我们的学习。
同时要有反馈,反馈的方式和内容要与算法相匹配。
所以我们经常听到有人说我这个领域有几千万的样本数据,所以我绝对可以做人工智能。
我想用不同的方式告诉他们,因为首先,你的样本不一定是针对这个算法收集的,其次,你的算法不一定总能得到,你最后的反馈也可能不好。
第三,问题不能太宽泛、太模糊。
定义必须非常明确,就像下棋一样清晰。
我们知道何时达到边界。
二是我们需要既懂人工智能又懂商业领域的人才。
我们问哪里可以找到这样的人才。
从今天开始,每个人都应该关注身边善于学习的人,并重点培养他们。
只有这样的人才能将两者完全结合起来,连接不同垂直领域的人才必不可少。
我最后要提的是计算能力。
今天每个人都拥有强大的计算能力。
我们有云计算、有并行计算、有GPU,所以这个能力也是不可或缺的。
接下来我要讲的是另一个例子。
今天我就用例子来继续解释我刚才讲的五个条件。
这里我想说,我们现在知道对话系统是人工智能领域的一个热门话题,甚至有一些公司已经出来谈论对话了。
系统,这种人机交互对话系统,可能是下一个入口,下一个搜索引擎。
我们暂时忽略这些商业术语。
我们先来看看目前市面上的对话系统。
我们大致可以将它们分为两类。
首先我们看到很多都是聊天类。
我们可能很了解小冰。
他们很幽默,但并不局限于聊天。
另一类是功能类。
当我们致电酒店和航空公司,寻找特定的垂直服务时,您往往会从这样的功能性对话中受益。
我们知道,不久前,甚至很多公司都有这样的对话,但他们的方法是这项服务按1,该项服务按2。
我们感觉这次体验非常糟糕。
从技术上来说,这种对话系统也分为两种。
第一个是基于规则的。
很多人都像专家一样制定了这些规则。
这些就像在象征领域中一样。
它的好处很准确,但效果并不好。
问题是扩展困难、与数据无关、对数据不够敏感。
另外,还有很多不同的突发事件是无法处理的,所以现在大家都更加关注机器学习算法。
我们也在香港科技大学的实验室进行研究。
我们研究的主要目的之一就是说,如果我们进一步推动人工智能,在深度学习之后,还有哪些技术会成为下一个热点?我们关心的是明天的技术。
这里我想说的是,我们有一个三明治般的三层结构:第一层就是我们熟悉的深度学习,就是递归深度学习;第二层就是我们所熟悉的深度学习,也就是递归深度学习;除此之外,我们还有一个策略学习器,称为强化学习学习器。
这里我想强调的是,强化学习最难的地方在于,当人工智能机器人无法完全观察周围的世界时,它只能观察其中的一部分,所以这有一个很奇怪的名字,叫做马尔可夫决策-基于部分观察的制作过程。
简单来说,这是强化学习中非常困难的阶段。
第三个是迁移学习,它可以让我们把一个好的模型迁移到一个新的领域,所以我们希望这样的一个系统能够有如下的功能,比如聊天、推荐、引导、提醒、学习。
如果我们看到的这个人具有这些特征,那么它看起来就像一个真人。
如何实现这一目标?我们首先要有一个基本的对话功能,这就是深度学习的对话功能。
其次,我们必须有一个能够引导对话对象完成任务的策略。
最后,我们需要能够实现个性化。
我们最好是贴近用户,这样用户跟它对话之后,体验就会非常好,非常简洁明了。
我们怎样才能做到这一点?这些是我们的一些例子。
例如,我们目前正在与一家O2O公司合作,使用真实数据来训练系统。
绿色的是用户提出的问题,白色的是系统。
我们中文的名字叫“魔镜系统”,就是白雪公主里的魔镜。
当然是一面好魔镜。
刚才系统的演示中,我们把整个对话系统放到了一个机器人里面,让机器人通过语音来回答我们。
事实上,这个真实的系统可以通过手机与人进行交流。
这里我想把它和我们都熟悉的一些系统进行比较。
以小冰为例,用户提出的问题在左边,绿色,黄色。
以下是小冰的回答。
这是真实的截图。
我们看到虽然小冰很调侃,但我们也尝试用Siri来回答。
Siri 是基于搜索的,很多很抱歉没有找到匹配的内容。
我们之所以研究这样的系统,是因为我们对它背后的系统感兴趣,所以就有这样的应用领域。
刚才我们提到的几个条件,首先我们有非常明确的目标、良好的反馈、持续不断的数据,然后我们也有跨界的人才,我们在接触O2O公司。
另外,我们最后有一个很明确的问题,不一定有明确的边界条件,这使得我们把这个问题表达得就像是在下围棋一样。
所以,这里我们也可以考虑一下,当我们在谈论这个的时候,到底离我们的目标还有多远?这就像我们在国际象棋方面有一个国家网络。
我们对当前状态有一个估计。
同时,如果我们能够提出不同的问题,它就可以作为我们接下来要下的棋子,所以这和阿尔法狗的思维非常相似。
有一个很有趣的现象,就是这样的三层模型。
刚才讲的深度学习、强化学习和迁移学习。
这样的模型非常具有普适性,对话领域就是我们适用的地方。
该模型结合它还可以工作在完全不同的应用领域。
这是总体发展目标。
比如我们有的学生把它应用到了大家普遍认为比较难的领域,就是股市走势的预测。
这是A股市场的某只股票。
我们使用过去多年、十年的数据进行训练。
为了连接所有数据,我们首先生成不同的状态,以便这些状态可以相互迁移。
其次,国家之间的变化。
我们使用强化学习来模拟它。
最后我们发现深度学习隐藏层自动生成的上百种状态基本描绘了过去几年的经济状况。
这是一个非常完整的总结,所以它能够给出一个非常好的大势。
我们也做了一些测试。
这个例子当然是金融领域的一个小实验,所以我应该说这是我们有所保留的,但是我想说的是,一旦我们对一个领域有了足够的了解,一旦这个领域有了足够的数据,领域我们一旦掌握了,就可以应用人工智能以及刚才提到的明确有界的方法来解决它,从而达到通用人工智能的目的。
接下来我要讲的最后一个话题是如何实现个性化。
这里其实有两个话题:一是我个人有一个很强烈的感觉,深度学习离不开大数据,大数据离不开大公司,我们熟悉的一些大公司都是老板大数据。
我们有一些中小型企业没有大数据,没有能力获取大数据。
所以这里我说的是深度学习,它的红利来自于特征的选择。
特征的准确选择离不开大数据。
只有富人才能获得这些大数据。
强化学习关注的是另一个角度,那就是反馈,也就是世界对系统的反馈。
这个反馈可以延迟,但是它的训练也离不开大数据,而且也是有钱人的游戏。
如果我们希望世界上每个人都使用人工智能,我们就必须研究如何将大模型,即在大数据上训练的模型迁移到小数据范围,使其也能在小数据上工作。
它还带来了一个副产品,称为个性化。
也就是说,如果我们让一个产品有很强的用户感受和用户体验,那么我们就必须达到个性化的效果。
这就是我们进行迁移学习的原因。
的目标。
什么是迁移学习?也就是说,我们在一个数据领域已经有了一个非常好的模型,我们可以将它应用到另一个模型中。
这样不仅节省了资源,而且达到了时间和效果的效益。
因此,这种将现有模型迁移到未知领域的学习过程称为迁移学习。
所以我们人类会自动通过推理进行这种学习。
比如我们学会了骑自行车之后,我们又学会了骑摩托车,发现很简单。
我们打球、学语言、学物理、化学时这样的例子还有很多。
我们在迁移学习方面努力了近十年,积累了大量文献。
这里我总结一下,我们可以通过几种不同的方法来实现传输,每种方法都非常直观。
首先是我们在数据集中找到与目标字段相似的数据,并将数据放大多次。
这称为样本迁移,通过样本来达到迁移的目的。
其次,我们可以观察一些相似的特征,然后利用这些特征进行不同级别的自动迁移。
这称为特征迁移。
那么我们还可以做基于模型的迁移,就是这么一个工作。
用几千万张图片来训练一个图像识别系统,当我们遇到一个新的图像领域时,我们不再需要去找几千万张图片来训练。
我们会把原来的迁移到新的字段,所以新的字段只需要几万张图片就够了,也可以获得很高的结果。
这称为模型迁移。
模型迁移的一个好处是我们可以区分它,即它可以与深度学习相结合。
我们可以区分不同级别的可转移性。
那些具有较高相似性的水平更有可能被转移。
最后,我们还可以通过关系进行迁移,比如社交网络以及社交网络之间的迁移。
如果使用迁移学习,我刚才提到的一个副产品就是从多人的大数据迁移到一个人的小数据。
这样就可以达到一个效果。
例如,我们只使用一个用户的九次对话来训练这样的迁移。
学习效果从3万人得到的大模型转移到一个人得到的小模型。
这种效果在强化学习的基础上特别容易实现,因为强化学习可以让我们把迁移结果变成短路,就像电路中的短路一样,可以让我们向用户提出很多相同的问题,而无需麻烦。
是的,刚才提到的部分,系统实际上并没有专门询问答案。
它基本上只是问,和上次的答案一样吗?还是会送到你家?这样可以节省很多,所以就这样了。
最后我总结一下刚才讲的必要条件。
我刚才举了第一个Google Deepmind的例子,第二个是增强迁移学习,是一个三层结构。
同时,我谈到了普遍的、个性化的学习。
这里我想再次强调一下我们总结的几个条件:一是要有边界清晰的问题定义,要有持续的外部反馈,要有足够的计算资源,顶尖的数据科学家要有足够的大数据素质。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-17
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态