首页 > 科技未来 > 内容

AIR 008丨香港科技大学教授杨强：人工智能成功的几个必要条件

发布于：2024-06-17 编辑：匿名来源：网络

人工智能的两个研究分支：一是科学，二是应用。

在人工智能科学领域，人们一直有一个疑问：机器会思考吗？在过去的60年里，像专家这样的计算机一直在试图回答这个问题。

在人工智能应用方面，研究人员正在探索它如何影响和影响人类。

杨强提到，人工智能的成功有五个必要条件：清晰的商业模式、高质量的大数据、明确的问题定义以及了解人工智能两个领域、擅长应用和算法计算能力的跨界人才。

人工智能在机器学习和深度学习方面取得了很高的成就。

此外，另一种技术也开始应用：强化学习。

强化学习不仅可以学习人类行为，还可以更好地利用延迟反馈功能。

那么，人们能否发明一种新的学习方法，可以将大数据模型应用于小数据呢？所以杨强提到了迁移学习。

迁移学习是深度学习和强化学习的叠加。

三层结构算法系统目前的人机交互对话系统包括聊天型和功能型。

从技术角度来看，这种对话系统分为两种类型。

第一种是最早出现的基于规则的系统。

这些就像在符号领域一样，它的优点是非常准确。

但问题是扩展困难，对数据不够敏感。

此外，它无法应对许多不同的突发事件，因此学术界正在关注机器学习算法。

至于机器学习算法，杨强认为深度学习之后的最新算法模型是一个三明治般的三层结构：第一层是递归深度学习，其上的第二层有强化学习学习器。

第三层是迁移学习，可以将现有模型迁移到新领域。

循环深度神经网络RNN（深度学习）强化学习RL迁移学习TL成熟的人机交互对话系统算法模型能否应用于其他领域？杨强现场演示了将对话系统集成到机器人响应中。

随后，他提到他的学生已经将这套系统应用在金融领域进行股市预测。

一旦人们掌握了某个领域，将其应用到其他领域就是迁移学习的作用。

个性化迁移深度学习离不开大数据。

强化学习注重反馈，但离不开大数据。

大数据离不开大公司。

当其他公司没有大数据时，他们该怎么办？杨强提出，一些为大数据设计的模型可以用在小数据上，其副产品就是个性化。

这就是迁移学习的目的。

有了这个系统，如果你切换到其他领域，就不需要收集大量的数据，直接应用模型就可以了。

就像一个人学会骑自行车一样，他或她几乎学会了骑摩托车。

迁移学习分为两种：样本迁移和特征迁移。

其应用场景如下：基于模型的迁移：比如图像识别，几万张图片的训练胜过几千万张图片。

AIR 008丨香港科技大学教授杨强：人工智能成功的几个必要条件

相似度越大，迁移的概率就越大。

社交网络之间的迁移：将千万人的大数据模型迁移到一个人身上。

最后，杨强指出，人工智能有很多领域，迄今为止最成功的领域是机器学习。

机器学习的一个基本概念是从数据中经常重复的现象中学习规则，从而解决现实中简单而繁琐的问题。

工作岗位被取代。

以下为杨强讲话实录。

今天早上我听到了一个非常激动人心的报告。

在这里我想跟大家分享一些我个人的想法，特别是今天。

大家都知道，人工智能已经取得了很多成就。

我们可以总结一下吗？一点点经验可以为我们后面的人所用。

首先，我们看到人工智能取得了很多成就，特别是在商业领域。

我们看到，在图像识别、语音识别，包括大规模的产品推荐，今天每个人都是这些服务的用户，我们都受益。

到它。

但我们有没有想过，这些人工智能成果是在什么条件下产生的，为什么这些成果在十年、二十年前还没有呢？那么下面我们就来问这些问题。

在提出这些问题之前，我们首先必须区分人工智能的两个研究分支。

一是人工智能科学。

人工智能科学必须追溯到其鼻祖图灵提出的最关键、最核心的问题：机器能思考吗？经过60多年的努力，人人都是计算机科学家，各行各业都在朝着这个方向努力。

我们建造更快的计算机，收集更多数据，研究更先进的算法。

我们都在努力回答这样的问题。

今天人工智能的成就只是为我们将其应用到生活中提供了机会，那么这就带来了一个新的问题，那就是我们如何预测一项人工智能技术是否能够产生它应有的结果？角色。

我们都说如果它有广泛的应用，那也是它成功的标志。

所以今天我想看一下人工智能的应用条件，驱动它产生它应该有的应用。

这里我想说人工智能已经取得了很大的成就，比如机器学习、深度学习，但是我们现在看到的一些线索已经让我们有一个非常兴奋的理由，这就是强化学习。

它不仅可以学习人类的行为，而且还可以特别好地利用这种延迟反馈，可以延迟一段时间。

明天我们能否发明一种可以应用于小数据的新学习方法？这就是我下面要讲的迁移学习。

所以我们也从这个角度来看，我们可以用哪些人工智能技术来让它达到预期的效果。

说到强化学习，Michael Wooldridge 刚刚提到了 Deepmind。

我也是 Deepmind 的粉丝。

这是Deepmind的一个过程。

我们观察这个过程之后，我们可以了解到，这是计算机内部的一种表达形式，适量，这个加入适量我们得到的反馈，可以帮助我们改进我们的策略。

这个策略是什么？就是我们平时所说的行为规划，我们的工作规划，游戏中的动作对应着一个策略。

该策略返回并生成一个新的界面。

当我们观察这个界面的时候，我们就可以回去学习了。

你看，这里的优点是这个反馈是连续给出的，只有到了最后才知道我们是赢家还是输家。

现实生活中我们是否有很多这样的例子不是使用深度学习选择的？例如，当我们学习一门课程时，我们只有在考试时才知道自己的成绩。

当我们投资一只股票时，要经过很长一段时间才能知道效果，所以这就是延迟反馈。

但这种学习有一个弱点，那就是如果我们人为地定义这个策略中的空间，称为状态空间，那么局限性是非常大的，因为我们人类永远无法确定，也永远无法提前预测出什么是状态。

世界会做的。

发生了什么？这就是Google Deegming的第二个目标，那就是端到端的深度学习。

正确的状态是在学习者内部表达的。

结果，我们形成了从输入端到输出端的端到端深度。

学习，经过几百轮的学习，我们学会了如何更好地玩一个游戏。

这就是当时的学习效果。

每张图片对应不同的游戏。

横轴显示，随着时间和游戏轮数的增加，我们看到它的效果越来越好。

这和我们人类的学习过程是一样的。

我们说这个人的学习效率大大提高了，他的学习效果大大提高了。

我们总结一下，这些成功来自于什么？我们首先可以看到它有一个非常明确的目标，什么是赢，什么是输，而且它在业务上也必须有强烈的目标。

其次，我们需要高质量的大数据。

我在这里想强调的是高质量。

该数据必须不断反馈。

不能收集一次就结束了。

只有不断到达，才能不断提高我们的学习。

同时要有反馈，反馈的方式和内容要与算法相匹配。

所以我们经常听到有人说我这个领域有几千万的样本数据，所以我绝对可以做人工智能。

我想用不同的方式告诉他们，因为首先，你的样本不一定是针对这个算法收集的，其次，你的算法不一定总能得到，你最后的反馈也可能不好。

第三，问题不能太宽泛、太模糊。

定义必须非常明确，就像下棋一样清晰。

我们知道何时达到边界。

二是我们需要既懂人工智能又懂商业领域的人才。

我们问哪里可以找到这样的人才。

从今天开始，每个人都应该关注身边善于学习的人，并重点培养他们。

只有这样的人才能将两者完全结合起来，连接不同垂直领域的人才必不可少。

我最后要提的是计算能力。

今天每个人都拥有强大的计算能力。

我们有云计算、有并行计算、有GPU，所以这个能力也是不可或缺的。

接下来我要讲的是另一个例子。

今天我就用例子来继续解释我刚才讲的五个条件。

这里我想说，我们现在知道对话系统是人工智能领域的一个热门话题，甚至有一些公司已经出来谈论对话了。

系统，这种人机交互对话系统，可能是下一个入口，下一个搜索引擎。

我们暂时忽略这些商业术语。

我们先来看看目前市面上的对话系统。

我们大致可以将它们分为两类。

首先我们看到很多都是聊天类。

我们可能很了解小冰。

他们很幽默，但并不局限于聊天。

另一类是功能类。

当我们致电酒店和航空公司，寻找特定的垂直服务时，您往往会从这样的功能性对话中受益。

我们知道，不久前，甚至很多公司都有这样的对话，但他们的方法是这项服务按1，该项服务按2。

我们感觉这次体验非常糟糕。

从技术上来说，这种对话系统也分为两种。

第一个是基于规则的。

很多人都像专家一样制定了这些规则。

这些就像在象征领域中一样。

它的好处很准确，但效果并不好。

问题是扩展困难、与数据无关、对数据不够敏感。

另外，还有很多不同的突发事件是无法处理的，所以现在大家都更加关注机器学习算法。

我们也在香港科技大学的实验室进行研究。

我们研究的主要目的之一就是说，如果我们进一步推动人工智能，在深度学习之后，还有哪些技术会成为下一个热点？我们关心的是明天的技术。

这里我想说的是，我们有一个三明治般的三层结构：第一层就是我们熟悉的深度学习，就是递归深度学习；第二层就是我们所熟悉的深度学习，也就是递归深度学习；除此之外，我们还有一个策略学习器，称为强化学习学习器。

这里我想强调的是，强化学习最难的地方在于，当人工智能机器人无法完全观察周围的世界时，它只能观察其中的一部分，所以这有一个很奇怪的名字，叫做马尔可夫决策-基于部分观察的制作过程。

简单来说，这是强化学习中非常困难的阶段。

第三个是迁移学习，它可以让我们把一个好的模型迁移到一个新的领域，所以我们希望这样的一个系统能够有如下的功能，比如聊天、推荐、引导、提醒、学习。

如果我们看到的这个人具有这些特征，那么它看起来就像一个真人。

如何实现这一目标？我们首先要有一个基本的对话功能，这就是深度学习的对话功能。

其次，我们必须有一个能够引导对话对象完成任务的策略。

最后，我们需要能够实现个性化。

我们最好是贴近用户，这样用户跟它对话之后，体验就会非常好，非常简洁明了。

我们怎样才能做到这一点？这些是我们的一些例子。

例如，我们目前正在与一家O2O公司合作，使用真实数据来训练系统。

绿色的是用户提出的问题，白色的是系统。

我们中文的名字叫“魔镜系统”，就是白雪公主里的魔镜。

当然是一面好魔镜。

刚才系统的演示中，我们把整个对话系统放到了一个机器人里面，让机器人通过语音来回答我们。

事实上，这个真实的系统可以通过手机与人进行交流。

这里我想把它和我们都熟悉的一些系统进行比较。

以小冰为例，用户提出的问题在左边，绿色，黄色。

以下是小冰的回答。

这是真实的截图。

我们看到虽然小冰很调侃，但我们也尝试用Siri来回答。

Siri 是基于搜索的，很多很抱歉没有找到匹配的内容。

我们之所以研究这样的系统，是因为我们对它背后的系统感兴趣，所以就有这样的应用领域。

刚才我们提到的几个条件，首先我们有非常明确的目标、良好的反馈、持续不断的数据，然后我们也有跨界的人才，我们在接触O2O公司。

另外，我们最后有一个很明确的问题，不一定有明确的边界条件，这使得我们把这个问题表达得就像是在下围棋一样。

所以，这里我们也可以考虑一下，当我们在谈论这个的时候，到底离我们的目标还有多远？这就像我们在国际象棋方面有一个国家网络。

我们对当前状态有一个估计。

同时，如果我们能够提出不同的问题，它就可以作为我们接下来要下的棋子，所以这和阿尔法狗的思维非常相似。

有一个很有趣的现象，就是这样的三层模型。

刚才讲的深度学习、强化学习和迁移学习。

这样的模型非常具有普适性，对话领域就是我们适用的地方。

该模型结合它还可以工作在完全不同的应用领域。

这是总体发展目标。

比如我们有的学生把它应用到了大家普遍认为比较难的领域，就是股市走势的预测。

这是A股市场的某只股票。

我们使用过去多年、十年的数据进行训练。

为了连接所有数据，我们首先生成不同的状态，以便这些状态可以相互迁移。

其次，国家之间的变化。

我们使用强化学习来模拟它。

最后我们发现深度学习隐藏层自动生成的上百种状态基本描绘了过去几年的经济状况。

这是一个非常完整的总结，所以它能够给出一个非常好的大势。

我们也做了一些测试。

这个例子当然是金融领域的一个小实验，所以我应该说这是我们有所保留的，但是我想说的是，一旦我们对一个领域有了足够的了解，一旦这个领域有了足够的数据，领域我们一旦掌握了，就可以应用人工智能以及刚才提到的明确有界的方法来解决它，从而达到通用人工智能的目的。

接下来我要讲的最后一个话题是如何实现个性化。

这里其实有两个话题：一是我个人有一个很强烈的感觉，深度学习离不开大数据，大数据离不开大公司，我们熟悉的一些大公司都是老板大数据。

我们有一些中小型企业没有大数据，没有能力获取大数据。

所以这里我说的是深度学习，它的红利来自于特征的选择。

特征的准确选择离不开大数据。

只有富人才能获得这些大数据。

强化学习关注的是另一个角度，那就是反馈，也就是世界对系统的反馈。

这个反馈可以延迟，但是它的训练也离不开大数据，而且也是有钱人的游戏。

如果我们希望世界上每个人都使用人工智能，我们就必须研究如何将大模型，即在大数据上训练的模型迁移到小数据范围，使其也能在小数据上工作。

它还带来了一个副产品，称为个性化。

也就是说，如果我们让一个产品有很强的用户感受和用户体验，那么我们就必须达到个性化的效果。

这就是我们进行迁移学习的原因。

的目标。

什么是迁移学习？也就是说，我们在一个数据领域已经有了一个非常好的模型，我们可以将它应用到另一个模型中。

这样不仅节省了资源，而且达到了时间和效果的效益。

因此，这种将现有模型迁移到未知领域的学习过程称为迁移学习。

所以我们人类会自动通过推理进行这种学习。

比如我们学会了骑自行车之后，我们又学会了骑摩托车，发现很简单。

我们打球、学语言、学物理、化学时这样的例子还有很多。

我们在迁移学习方面努力了近十年，积累了大量文献。

这里我总结一下，我们可以通过几种不同的方法来实现传输，每种方法都非常直观。

首先是我们在数据集中找到与目标字段相似的数据，并将数据放大多次。

这称为样本迁移，通过样本来达到迁移的目的。

其次，我们可以观察一些相似的特征，然后利用这些特征进行不同级别的自动迁移。

这称为特征迁移。

那么我们还可以做基于模型的迁移，就是这么一个工作。

用几千万张图片来训练一个图像识别系统，当我们遇到一个新的图像领域时，我们不再需要去找几千万张图片来训练。

我们会把原来的迁移到新的字段，所以新的字段只需要几万张图片就够了，也可以获得很高的结果。

这称为模型迁移。

模型迁移的一个好处是我们可以区分它，即它可以与深度学习相结合。

我们可以区分不同级别的可转移性。

那些具有较高相似性的水平更有可能被转移。

最后，我们还可以通过关系进行迁移，比如社交网络以及社交网络之间的迁移。

如果使用迁移学习，我刚才提到的一个副产品就是从多人的大数据迁移到一个人的小数据。

这样就可以达到一个效果。

例如，我们只使用一个用户的九次对话来训练这样的迁移。

学习效果从3万人得到的大模型转移到一个人得到的小模型。

这种效果在强化学习的基础上特别容易实现，因为强化学习可以让我们把迁移结果变成短路，就像电路中的短路一样，可以让我们向用户提出很多相同的问题，而无需麻烦。

是的，刚才提到的部分，系统实际上并没有专门询问答案。

它基本上只是问，和上次的答案一样吗？还是会送到你家？这样可以节省很多，所以就这样了。

最后我总结一下刚才讲的必要条件。

我刚才举了第一个Google Deepmind的例子，第二个是增强迁移学习，是一个三层结构。

同时，我谈到了普遍的、个性化的学习。

这里我想再次强调一下我们总结的几个条件：一是要有边界清晰的问题定义，要有持续的外部反馈，要有足够的计算资源，顶尖的数据科学家要有足够的大数据素质。

站长声明

标签：

上一篇：柔宇科技：是否存在“三类股东”等情况还有待论证，科创板上市申请已暂停

下一篇：【全球财经24小时】2023年9月28日投融资事件汇总及详情

「信迪诊断」完成近6亿元B轮融资

「信迪诊断」宣布完成近6亿元B轮融资。本轮融资由中信证券投资、中信医疗基金领投，盈科资本、厚信医疗投资、金浦国条、创瑞投资、仁普医疗基金、宏城投资、金雨茂物和南京创新投资、老股东田洋跟投外汇资金持续支撑。耀明资本担任本次融资的独家保荐人。先声诊断致力于为

06-18
为什么蘑菇街是除了淘宝、豆快之外第一个孵化过亿主播的平台？

作者 |倪叔双11已经落下帷幕，各平台都争先恐后地秀肌肉。让倪叔印象深刻的是蘑菇街的直播记录：截至11月10日12点05分，蘑菇街一姐@小甜心_单场破亿，当日最终交易额为2.74亿元。全网身价过亿的主播有很多，但过去大多集中在淘宝、快手、抖音。流量不占优势的蘑菇街成为这

06-18
金鱼嘴机构日·新一代信息技术专场圆满落幕

3月29日，由南京市建邺区人民政府指导，建邺高新区管委会、南京金鱼嘴基金区块发展中心、南京金鱼嘴主办由路演文化发展有限公司、清科创新中心、华商资本主办的金鱼嘴机构日华商资本新一代信息技术专场活动成功举办。当前，世界正在进入以新一代信息产业为主导的新经济发展时

06-17
中国新冠疫苗启动临床试验；董明珠：格力二月没有收入；北京公交可刷银联卡 -雷锋晨报

我国重组新冠疫苗获批启动临床试验。近日，军事科学院军事医学科学院陈薇院士领导的科研团队研发的重组COVID-19疫苗已获批启动临床试验。自1月26日抵达武汉以来，陈薇院士团队联合当地优势企业，在埃博拉疫苗研发成功经验的基础上，与时间赛跑，开展重组新冠病毒疫苗的药学

06-17
AR公司亮亮视野获建银国际1亿元B+轮投资，兰驰、经纬持续跟投

据投资界6月5日消息，今日，AR商业化领军企业亮亮视野AR眼镜宣布完成1亿元B+轮融资。此轮融资由建银国际领投，蓝驰创投和经纬创投跟投。至此，亮亮视野成为国内首家完成B+轮融资的AR公司。　　亮亮视野创始人及CEO吴斐表示，本轮融资后，亮亮视野将进一步强化在安防、工业

06-17
金富子宣布完成C1轮1亿元融资，春晓领投，红杉资本、京基联合创投

据投资界3月25日消息，继去年完成C轮数亿融资后，国内领先的互联网财富管理平台金富子中国，斧头近期再次宣布完成C1轮1亿元融资，由春晓资本领投，红杉资本、京基资本共同投资。资金仍将主要用于继续扩大规模、提升财富管理服务质量。始终走在金融科技前沿的金斧头连续两年

06-18
首尔半导体在美国提起16项LED专利侵权诉讼

近日，首尔半导体宣布，已向美国德克萨斯州西区地方法院对全球零售商Ace Hardware提起LED专利侵权诉讼，指控其销售LED产品菲特电气生产的LED灯丝灯泡和其他LED产品。尽管收到多份侵权通知，Ace Hardware 仍继续销售 Feit Electric 相关产品，因此首尔半导体认为此次侵权行为

06-08
山东工友即将赴德国上市，计划融资400万欧元

山东工友集团股份有限公司（以下简称“山东工友”）在法兰克福证券交易所上市已进入倒计时。该公司是第一家在德国上市的大陆公司。得益于宽松的融资环境，越来越多的中国企业选择在欧洲上市。　　　　春节前后上市　　　　负责山东工友海外上市融资的陈经理表示：“山东工

06-18
香蕉游戏再获2亿元B轮融资，经纬创投与竞远资本联合领投

NewSeed（ID：pelink）据9月29日消息，王思聪创办的电竞内容公司香蕉游戏近日宣布完成2亿元人民币融资B轮融资，由经纬创投和竞远 Investments联合领投。据萌芽数据库显示，今年6月，香蕉游戏获得IDG资本、文子数字投资基金投资的1.5亿元A轮融资。 Banana Games属于Banana Pr

06-17
241家企业中有1-4获得融资，年均增长缓慢，然而“国家队”和资本却对这个行业情有独钟

当年，自从腾讯领投拿下互联网后，互联网三大巨头BAT相继步入“互联网+法律”领域打开了互联网法律服务创业的大门。那一年，法律机构不断探索“互联网+法律”之路，希望找到一条正确的道路。　　经过近两年的市场耕耘，2020年我们谈论“互联网+法律”不再茫然：有了充足的资

06-18
新密科技获过亿元A轮投资，由虎山资本、中芯聚源

投资界领投（ID：pedaily）据12月1日消息，国内领先的半导体全氟密封产品制造商新密科技宣布，完成超亿元A轮融资。本次投资由虎山资本、中芯聚源领投，青大海峡跟投，老股东中南创投追加投资。据悉，新密科技是一家专注于高端密封材料及产品解决方案的高新技术企业。集研发

06-18
毅镤科技完成Pre-A轮融资，戈壁创投独家投资

投资界（ID：pedaily）据9月5日消息，上海毅镤新能源科技有限公司（以下简称“毅镤科技”））宣布完成数千万元Pre-A轮融资，本轮融资由戈壁创投独家投资。普亭科技CEO罗坚表示，本轮募集资金将用于继续加大研发投入、完善和优化制氢控制系统等业务方面。毅镤科技成立于今年

06-17