首页 > 科技未来 > 内容

谷歌和微软的图像识别能不能行得通，还得由斯坦福大学的李飞飞来决定

发布于：2024-06-18 编辑：匿名来源：网络

今年8月，雷锋网将在深圳举办史无前例的“全球人工智能与机器人峰会”，届时雷锋网易网将发布“人工智能&机器人25强创新企业”榜单，目前我们正在一一走访人工智能和机器人领域的相关企业，评选最终入围企业名单。

如果您也想加入我们的名单，请联系：@leiphone.com 每年，斯坦福大学都会举办一场名为 ImageNet 视觉识别挑战赛的比赛……这个比赛的参与者不是学生团队，而是全球科技巨头，比如 Google、微软、百度等如何比较呢？简单来说，ImageNet相当于一个算法考场，大公司可以利用其庞大的题库来进行考试，当然是冠军。

这个游戏的。

对了，去年6月，百度因涉嫌在测试过程中作弊而被ImageNet主办方封禁一年。

很多人万万想不到，ImageNet背后那个“让无数英雄静跪倒”的“终极考官”，竟然是一位绝色美女！她也是中国美女啊！她就是李飞飞，一个集才华与美貌于一体的女人。

虽然他可以靠名声谋生，但他的才华还是要拼的。

李飞飞出生于北京，16岁时随父母移居美国。

也许对科学的热爱是不分性别的。

李飞飞以最高荣誉获得普林斯顿大学物理学学士学位，并辅修工程物理学。

随后，她在加州理工学院攻读电气工程硕士和博士学位，并于2011年顺利毕业。

她的研究兴趣主要集中在视觉研究领域，包括计算机视觉和视觉心理学，例如物体识别、场景分类和事件分类。

2006年，李飞飞来到斯坦福大学。

仅仅三年时间，李飞飞就晋升为终身教授，并成为斯坦福大学人工智能实验室（SAIL）和斯坦福大学视觉实验室的主任。

李飞飞简历上，有95篇文章发表在Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS等顶级期刊和会议上；联合发表论文32篇。

你觉得你的纸太水了吗？幼稚的。

我们只列举李飞飞获得的几个奖项：微软学者新星奖和谷歌研究奖、美国国家科学基金会杰出青年奖、斯隆学者奖、雅虎实验室学者奖、IBM学者奖。

谷歌和微软的图像识别能不能行得通，还得由斯坦福大学的李飞飞来决定

不过，与那些只埋头工作的学者相比，李飞飞凭借着外表和才华参加了很多演讲。

在她19页的简历中，有四页是她参加过的各种演讲。

她一直与媒体关系良好，曾上过《纽约时报》和TED。

“明明可以靠脸谋生，但要靠才华去拼。

”李飞飞就是这句话的最佳代言人……而如今，她已经摇身一变成为谷歌、微软等多家科技公司图像识别的终极考官。

ImageNet，图像识别的考场。

作为世界计算机视觉领域的知名专家，李飞飞的主要贡献是参与建立了两个被人工智能研究人员广泛使用来教机器分类物体的数据库：Caltech和ImageNet，而后者已现已成为全球最大的图像识别数据库。

如果说李飞飞是图像识别的大考官，那么她创建的ImageNet就是科技公司在图像识别方面的考场。

为什么不从算法上优化机器的“眼睛”，而是从“大脑”入手？过去，计算机识别的逻辑是教计算机看到“物体”。

研究人员将训练图片抽象成一些模型，并用算法告诉计算机：“脸圆、身体胖、耳朵尖、尾巴长的东西是猫。

”然而，如果小猫看起来像这样的话，会是什么样的存在呢？（笑）虽然3岁的孩子很容易判断这也是一只猫，但计算机却被愚弄了：它不符合“猫”所代表的模型特征。

这导致了一个难题：即使是最常见的宠物也可能会发生变化。

仅使用归纳模型进行机器识别是不科学、不现实的。

因此，以ImageNet为代表的图像识别数据库提供了一种更接近人类识别物体过程的方式：没有人教婴儿如何看，但他们在3岁的时候就可以识别很多东西。

这是因为人们从真实的事物中学习。

从世界经验中学习。

“如果你把孩子的眼睛想象成生物相机，他们每毫秒就会拍一张照片。

这是一次眼球运动所需的平均时间。

因此，到 3 岁时，孩子已经看到了数十亿张真实世界的照片。

这个数字“训练照片”的数量非常大。

“利用互联网，ImageNet 提供了一个巨大的图像数据库，可以让计算机系统识别 10,000 张照片中的 0 个项目。

教计算机看只是第一步，我们还需要算法的力量！作为与大脑具有相似神经原理的卷积神经网络，使用ImageNet进行训练是再合适不过了。

卷积神经网络最初由 Kunihiko Fukushima、Geoff Hinton 和 Yann LeCun 在 20 世纪 70 年代和 80 年代首创。

就像神经的最小计算单元是神经元一样，神经网络的最小单元也是小节点。

通过连接不同的节点，节点可以输入输出信息，实现“思考”。

如果将一张图片按照不同的维度划分为各个级别，每个级别用来标识不同的内容，比如颜色、颜色、形状等。

想象一下，如果有30个不同的维度进行过滤和过滤……精度岂不是会有惊人的提升？在用于训练对象识别模型的典型神经网络中，有 10,000 个节点、1.4 亿个参数和 1 亿个连接。

借助 ImageNet 提供的海量数据支持，研究人员可以通过大量最先进的 CPU 和 GPU 来训练这些模型。

两者相辅相成，发展成为物体识别领域的成功系统。

通过让计算机读取谷歌街景，你实际上可以获得很多有趣的结果。

例如，道路上的汽车价格与家庭收入之间的关系，甚至犯罪率。

但现在计算机可以理解图片了，这一切就结束了吗？当然不是。

在大数据和机器学习算法的配合下，我们可以让计算机这个刚刚学会了一些东西的婴儿慢慢地组织语言并用完整的句子表达出来——就像一个真正的孩子一样。

虽然他们有时会开一些玩笑……虽然计算机还不能像人类在看到图片的那一刻就能理解他们想要表达的情感以及各种事物背后的信息……但是，它已经在努力了，不是吗？更何况，还有以“审查员”李飞飞为代表的众多研究人员一直在图像识别方面努力。

要么作为考生，努力收集不同的图片，以提高算法的准确性；或者作为考生，他们焦急地让电脑接受系统的“考验”；但无论是哪一方，他们都在朝着同一个方向前进，都在尽最大努力提高算法的准确性。

努力让计算机取得更好的“成绩”。

或许，终极考官李飞飞面临着这样的情况：一方面，她希望ImageNet考场的“试题”能难倒前来参加考试的计算机，因为这表明算法的突破点在这儿;另一方面，如果计算机成功回答了测试问题，则表明图像识别技术又向前迈进了一步。

即使克服了一个“难题”，正确描述了某张图片的内容，双方都会欢呼雀跃；而这样的甜蜜烦恼，考官李飞飞也很享受。

最重要的是，ImageNet——汇集全世界智慧和力量的数据库——是免费的。

这意味着全球所有致力于图像识别的公司都可以免费反复测试他们的算法。

这就像一个巨大的试题库。

只要愿意，任何企业总能受到考官的考验。

虽然由于各种资金限制，GAIR会议不能完全免费，但我们已经尽力为大家提供40%的折扣——人民币，截止日期为7月1日。

也许在8月12日的GAIR活动上，你就有机会与这位美丽的研究人员讨论图像识别的最新进展。

站长声明

标签：

上一篇：餐饮服务品牌“勺子课堂”完成3000万元A+轮融资，由青松基金领投

下一篇：游戏收入暴跌40%，但英伟达其实并没有那么糟糕

小鹏汽车宣布完成C+轮近5亿美元融资，高瓴、红杉等投资

耀铭汽车宣布完成近5亿美元C+轮融资，高瓴资本、红杉资本等公司投资。 7月20日，耀明汽车正式宣布完成近5亿美元C+轮融资。主要投资者为Aspex、Coatue、高瓴资本和红杉资本中国。据悉，耀明汽车于今年11月完成C轮融资，获得何小鹏和小米集团4亿美元融资。不久前，7月17日晚

06-17
金蝶云之家获A+轮融资，为大中型企业提供定制云服务

据投资界12月29日消息，金蝶云之家宣布获得耀明资本A+轮融资。今年6月，金蝶云之家获得新光集团数亿元A轮融资。当时，云家发布了创新的移动办公场景V9。 V9可以帮助企业赋能个体，激活组织，让所有云之家用户成为超级个体。　　本轮融资后，云智嘉将继续加强产品研发和渠

06-18
360 推广携手易车发布汽车行业报告，深度解读行业“潜规则”

2019年4月25日，推广携手易车共同发布《年Q1汽车行业搜索报告》。双方代表在车展现场直播中与广大车企分享了报告亮点，深入剖析了当前汽车行业发展现状，探讨了汽车行业营销推广的发展趋势和市场趋势。汽车行业背后的数据。中装与易车两大数据平台商易和易车指数在汽车垂

06-18
中国工业和信息化部：加快5G、工业互联网等新型信息基础设施建设和应用

中新网中国工业和信息化部部长金壮龙14日表示，要加快5G、工业互联网等新型信息基础设施建设和应用。、做强数字经济核心产业，推动集成电路和工业软件产业高质量发展。 3月14日，金壮龙主持召开会议，传达学习贯彻全国两会精神，研究部署落实措施。金壮龙要求加快实施“十

06-06
博克斯2020年实现收入1.17亿元，同比增长32.90%

博克斯（00.OC）近日披露了上一年的“成绩单”。公司年报显示，博克斯实现营业收入1.17亿元，同比增长32.90%；归属于上市公司股东的净利润4100元，同比增长0.97%。听，中小企业反馈平台。倾听用户的需求，倾听创业者的声音，解决中小企业的痛点。点击立即参与调查并获得礼

06-18
《IDC 中国游戏云市场跟踪研究，2022H2》系列文章二：游戏云整体市场状况

中国游戏云整体市场分析宏观行业判断：IDC对游戏云市场中短期的健康增长持积极态度。只要不出现重大舆论风险，“常态化版号发行”将促进下游游戏市场的增长，并带动游戏云服务的使用量和游戏云市场规模长期持续增长。学期。疫情恢复的影响：疫情后终端用户在娱乐和生活方

06-18
我国最大集装箱超算中心在武汉建成，规划设计算力200P

长江日报据长江日报报道，建成全国首个集人工智能和超算为一体的多元化云服务算力集群在武汉。据介绍，武汉超级计算中心从立项到竣工，历时6个月，现已投入使用。武汉超算中心是我国最大的集装箱超算中心，也是全国首个集人工智能和超算为一体的多元化云服务算力集群。武

06-06
投资世界24小时 -滴灌又火了：员工带100万上班？刚刚，联合创始人辞去了OpenAI的职务；香港科技大学结束VC生涯

时间：2020年5月15日星期三重要消息：颜宁荣获世界杰出女科学家奖。根据不确定性，联合国教科文组织和欧莱雅基金会于当地时间5月14日公布了2016年世界杰出女科学家奖的五位获奖者。中国科学家颜宁是获奖者之一。颁奖典礼将于5月28日举行。（中新网）OpenAI联合创始人和首

06-18
一张图告诉你全球首例自动驾驶致命车祸是如何发生的

背景介绍：美国公路交通安全委员会（NHTSA）发布公告称：5月7日，在佛罗里达州，一名车主在使用自动驾驶汽车时发生事故身亡。他的Model S上的自动驾驶模式。根据NHTSA的初步报告，当时在一个路口，特斯拉前面的一辆大型拖车在路口左转，但特斯拉的自动制动系统未能工作，可

06-18
该项核心技术落户临港新区，推动产业集群发展

该项核心技术近日，该项核心技术上海临港总部正式落户临港新区。上海临港总部作为该核心技术的研发总部和全球数据中心，集办公研发、数据中心、硬件仿真器于一体。可以支持全球团队在任何地方进行芯片设计或软件构建，保证各种IT服务的可用性。可靠稳定，同时通过集中管

06-06
北京：鼓励民营、外资企业、国有企业投资高精尖产业

创头条获悉，北京市人民政府近日发布的《北京市关于促进高精尖产业投资推进制造业高端智能绿色发展的若干措施》宣布《措施》鼓励民营、外资企业投资高精尖产业三资企业、国有企业等主体投资符合首都城市战略定位的高新技术产业。《措施》指出，要营造良好营商环境，鼓励高精

06-18
诚电科技获得玖羚智能1000万元战略投资，

据3月16日消息，诚电科技宣布获得玖羚智能1万元战略投资。据悉，投资资金将全部用于市场补贴。据了解，深圳市诚点科技有限公司是一家在酒店行业具有一定知名度的服务型、技术型公司。公司开展多模式合作，针对不同的客户群体有不同的合作方式。公司致力于用世界一流的技术

06-17