性能拖累?科创板上市三天,生益电子股价显疲态
06-17
13日,李开复在清华大学演讲时对人工智能发表了一些非常中肯的言论。
还详细讲解了一般企业如何利用人工智能为企业建立竞争优势和技术壁垒。
每句话都信息丰富。
简单来说,人工智能产业的发展还非常有限——没有平台。
但正是因为这样的限制,此时设立的壁垒才会是最高的。
由于人工智能的诸多优势,我们认为企业应该考虑开始利用人工智能来辅助自己,并招募一些相关人才。
但我们不能只是谈论它。
如何克服困难和挑战,让人工智能助力你的工作和事业?让我们结合李开复讲话的内容来给大家解释一下。
现在,假设你是程序员,虽然你的兄弟也是媒体人,但你会毫不犹豫地黑掉自己的产业。
假设您现在是一家媒体 IT 部门的员工。
这个媒体每天做着最多、最重要的工作。
您只需从其他网站复制文章,然后添加一些自己的标记并将其上传到自己的网站即可。
虽然你是码农,但你心怀天下,想要拯救公司里苦苦挣扎的编辑们。
于是你决定写一个程序来帮助编辑者一键完成复制文章,甚至自动复制文章。
你该怎么办?当然,用人工智能来复制粘贴似乎有点大材小用,但这个工作看起来很机械,确实需要一定的适应能力。
例如,网站页面上除了正文之外,还有很多杂乱的广告链接。
只要网站设计得当,读者就不会太傻。
设计应该让人一眼就能看出哪部分是正文,哪部分是无关信息。
但是算法如何识别文本和广告/不相关链接之间的区别呢?算法如何找出网站上哪些内容值得复制? (叫“热点”)最重要的是,仔细想一想,需要注意的地方还蛮多的。
平时学的If else好像还不够。
您应该使用什么语言来完成您令人惊叹的算法?此时,我们面临李开复提到的当前深度学习的第一个挑战:没有平台。
深度学习的挑战之一:平台人工智能目前没有统一的平台。
就深度学习而言,现在的人懂了就是懂,不懂就是不懂。
这也是为什么谷歌最近斥巨资不断招募行业顶尖人才,为年轻人开出的年薪甚至超过1万美元。
这些人二十多岁,刚刚博士毕业。
它们怎么能这么值钱呢?为什么这么贵?李开复先生提到,这些人投入到各个领域的人工智能研究后,可能很快就会创造出数千万甚至数亿美元的价值。
但他可能没有表达的是,现在的AI发展真的很难,非常难。
之所以这么难,是因为没有平台。
平台是一个比较神秘的概念,因为人工智能的发展还处于摸着石头过河的状态,所以没有人能够预测所谓的“平台”的确切形态会是什么样。
这个话题展开我可以单独讲一篇文章,但简单来说,大概会是一种“统一标准”的状态。
比如,现在人们一提到神经网络算法,就会想到很多概念,比如CNN、RNN、DNN等,具体应用实现方法也千奇百怪。
所有基于人工智能的编程都是从头开始,一点一点构建算法。
但如果有一天有类似iOS或Android的东西,最好的算法被发现了(当然这只是一个比喻,可能没有最好的算法。
),并且它被集成到某种程序中。
如果后人想要开发神经网络,只需要调用它提供的API即可。
这可以大大简化深度学习开发的难度。
深度学习挑战二:数据收集和计算。
当然,作为一个胸怀世界野心的码农,这点小事肯定不会困扰你。
你应该赶紧找到合适的语言系统,比如Tensorflow,比如Scikit,我愉快地编译了程序。
但接下来你要面对的问题可能就没那么容易解决了:它们都是从两个方向决定你的算法训练的效果:训练数据量和训练速度。
李开复先生把这个问题分成了两个问题,但我们认为它们实际上是关于算法训练的,所以它们实际上可以归为同一个问题。
深度学习的网络太大,需要海量的数据。
因为数据太多,计算速度极慢,所以需要非常大的计算量。
如何确定网站正文的位置是一个比较容易解决的问题。
如果你决定只复制几大(十几家)主流媒体的文章,可以用if else来解决。
毕竟,虽然各个网站主体的规则不同,但是各个网站内部的文章基本都遵循相同的规则。
其实如果想做一个通用的算法,规则并不难找。
例如,主体文本的文本密度会突然增加,而html代码的密度会直线下降。
例如,整个文本的文本密度基本相同。
如果网站每天能更新四五百篇文章,那么需要十天左右的训练才能达到非常高的准确率。
难点在于“追热点”!互联网上的热点每天都在变化。
你的算法如何知道今天的热点是什么?如何知道算法扫描到的文章是否与热门话题相关以及写得有多好?为了让算法训练出对这些信息的判断能力,我们得扫描几千万篇文章进行训练,对吧?作为终极音响发烧友码农,你第一次感受到眼前电脑中的8核i7和GTX Titan是如此的无力。
哎,就写个爬虫先慢慢爬吧。
看看能不能利用公司的服务器在网络低峰期再偷偷运行一天。
深度学习算法要想进化到比较高的水平,李开复先生估计至少要有10亿级的数据。
如此庞大的数据收集起来相当困难。
而且,只有当这些数据是你自己的时候,它们才能在你手中发挥出真正的价值,而且由于数据量巨大,所需的计算量也相当大。
要展示你在深度学习领域的技能,最好拥有自己的计算设备,比如你自己的服务器场。
因此,我们看到人工智能领域早期取得成就的都是像微软、谷歌、Facebook这样的世界级公司。
他们不仅拥有更多的资金和更好的人才,最重要的是,他们拥有海量的数据。
深度学习挑战之三:没有反馈“这有点奇怪,但也在情理之中:机器无法用人类语言说出做事的动机和原因。
即使机器训练做得很好,深度学习、人脸识别和语音识别都还不够。
”很好,但是它不能像人类一样,虽然也有人在做这方面的研究,但今天,如果一个领域不断地需要告诉别人做什么,它就需要向别人解释。
别人为什么,那么这个领域对于深度学习来说还是比较难的,比如说Alpha Go战胜了李世石,如果你要问Alpha Go为什么会做出这样的举动,它就无法回答“深度学习只是一个算法”。
你最初的设计不断地改变自己,但没有有效的方法告诉你它如何改进自己以及改进后它如何做出每一个选择,所以很多时候你只能通过它最终的表现来猜测。
状态,然后盲猫通过改进原来的算法打败死老鼠。

而且你可能无法从算法的进展中获得帮助你提高的信息,比如李开复先生给出的AlphaGo例子。
当然,作为世界级的码农,你肯定会知道这一点,也一定能够根据算法最终的表现找到问题所在,因为毕竟这个问题在结果中是比较明显的。
在这个虚拟世界里,我们决定给所有辛勤工作的编辑们一个完美的结局:胸怀天下的码农成功研发出“全自动文章转载机”,这家媒体的编辑们终于可以自由了。
他们自己。
花点精力,写一些可以仔细打磨的文章。
所以你看,虽然我们不知道人工智能最终是否会毁灭我们,但似乎他们很快就能拯救很多人。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-17
06-18
06-18
06-18
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态