首页 > 科技未来 > 内容

谷歌和微软的图像识别能不能行得通,还得由斯坦福大学的李飞飞来决定

发布于:2024-06-18 编辑:匿名 来源:网络

今年8月,雷锋网将在深圳举办史无前例的“全球人工智能与机器人峰会”,届时雷锋网易网将发布“人工智能&机器人25强创新企业”榜单,目前我们正在一一走访人工智能和机器人领域的相关企业,评选最终入围企业名单。

如果您也想加入我们的名单,请联系:@leiphone.com 每年,斯坦福大学都会举办一场名为 ImageNet 视觉识别挑战赛 的比赛……这个比赛的参与者不是学生团队,而是全球科技巨头,比如 Google、微软、百度等如何比较呢?简单来说,ImageNet相当于一个算法考场,大公司可以利用其庞大的题库来进行考试,当然是冠军。

这个游戏的。

对了,去年6月,百度因涉嫌在测试过程中作弊而被ImageNet主办方封禁一年。

很多人万万想不到,ImageNet背后那个“让无数英雄静跪倒”的“终极考官”,竟然是一位绝色美女!她也是中国美女啊!她就是李飞飞,一个集才华与美貌于一体的女人。

虽然他可以靠名声谋生,但他的才华还是要拼的。

李飞飞出生于北京,16岁时随父母移居美国。

也许对科学的热爱是不分性别的。

李飞飞以最高荣誉获得普林斯顿大学物理学学士学位,并辅修工程物理学。

随后,她在加州理工学院攻读电气工程硕士和博士学位,并于2011年顺利毕业。

她的研究兴趣主要集中在视觉研究领域,包括计算机视觉和视觉心理学,例如物体识别、场景分类和事件分类。

2006年,李飞飞来到斯坦福大学。

仅仅三年时间,李飞飞就晋升为终身教授,并成为斯坦福大学人工智能实验室(SAIL)和斯坦福大学视觉实验室的主任。

李飞飞简历上,有95篇文章发表在Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS等顶级期刊和会议上;联合发表论文32篇。

你觉得你的纸太水了吗?幼稚的。

我们只列举李飞飞获得的几个奖项:微软学者新星奖和谷歌研究奖、美国国家科学基金会杰出青年奖、斯隆学者奖、雅虎实验室学者奖、IBM学者奖。

谷歌和微软的图像识别能不能行得通,还得由斯坦福大学的李飞飞来决定

不过,与那些只埋头工作的学者相比,李飞飞凭借着外表和才华参加了很多演讲。

在她19页的简历中,有四页是她参加过的各种演讲。

她一直与媒体关系良好,曾上过《纽约时报》和TED。

“明明可以靠脸谋生,但要靠才华去拼。

”李飞飞就是这句话的最佳代言人……而如今,她已经摇身一变成为谷歌、微软等多家科技公司图像识别的终极考官。

ImageNet,图像识别的考场。

作为世界计算机视觉领域的知名专家,李飞飞的主要贡献是参与建立了两个被人工智能研究人员广泛使用来教机器分类物体的数据库:Caltech和ImageNet,而后者已现已成为全球最大的图像识别数据库。

如果说李飞飞是图像识别的大考官,那么她创建的ImageNet就是科技公司在图像识别方面的考场。

为什么不从算法上优化机器的“眼睛”,而是从“大脑”入手?过去,计算机识别的逻辑是教计算机看到“物体”。

研究人员将训练图片抽象成一些模型,并用算法告诉计算机:“脸圆、身体胖、耳朵尖、尾巴长的东西是猫。

”然而,如果小猫看起来像这样的话,会是什么样的存在呢? (笑)虽然3岁的孩子很容易判断这也是一只猫,但计算机却被愚弄了:它不符合“猫”所代表的模型特征。

这导致了一个难题:即使是最常见的宠物也可能会发生变化。

仅使用归纳模型进行机器识别是不科学、不现实的。

因此,以ImageNet为代表的图像识别数据库提供了一种更接近人类识别物体过程的方式:没有人教婴儿如何看,但他们在3岁的时候就可以识别很多东西。

这是因为人们从真实的事物中学习。

从世界经验中学习。

“如果你把孩子的眼睛想象成生物相机,他们每毫秒就会拍一张照片。

这是一次眼球运动所需的平均时间。

因此,到 3 岁时,孩子已经看到了数十亿张真实世界的照片。

这个数字“训练照片”的数量非常大。

“利用互联网,ImageNet 提供了一个巨大的图像数据库,可以让计算机系统识别 10,000 张照片中的 0 个项目。

教计算机看只是第一步,我们还需要算法的力量!作为与大脑具有相似神经原理的卷积神经网络,使用ImageNet进行训练是再合适不过了。

卷积神经网络最初由 Kunihiko Fukushima、Geoff Hinton 和 Yann LeCun 在 20 世纪 70 年代和 80 年代首创。

就像神经的最小计算单元是神经元一样,神经网络的最小单元也是小节点。

通过连接不同的节点,节点可以输入输出信息,实现“思考”。

如果将一张图片按照不同的维度划分为各个级别,每个级别用来标识不同的内容,比如颜色、颜色、形状等。

想象一下,如果有30个不同的维度进行过滤和过滤……精度岂不是会有惊人的提升?在用于训练对象识别模型的典型神经网络中,有 10,000 个节点、1.4 亿个参数和 1 亿个连接。

借助 ImageNet 提供的海量数据支持,研究人员可以通过大量最先进的 CPU 和 GPU 来训练这些模型。

两者相辅相成,发展成为物体识别领域的成功系统。

通过让计算机读取谷歌街景,你实际上可以获得很多有趣的结果。

例如,道路上的汽车价格与家庭收入之间的关系,甚至犯罪率。

但现在计算机可以理解图片了,这一切就结束了吗?当然不是。

在大数据和机器学习算法的配合下,我们可以让计算机这个刚刚学会了一些东西的婴儿慢慢地组织语言并用完整的句子表达出来——就像一个真正的孩子一样。

虽然他们有时会开一些玩笑……虽然计算机还不能像人类在看到图片的那一刻就能理解他们想要表达的情感以及各种事物背后的信息……但是,它已经在努力了,不是吗?更何况,还有以“审查员”李飞飞为代表的众多研究人员一直在图像识别方面努力。

要么作为考生,努力收集不同的图片,以提高算法的准确性;或者作为考生,他们焦急地让电脑接受系统的“考验”;但无论是哪一方,他们都在朝着同一个方向前进,都在尽最大努力提高算法的准确性。

努力让计算机取得更好的“成绩”。

或许,终极考官李飞飞面临着这样的情况:一方面,她希望ImageNet考场的“试题”能难倒前来参加考试的计算机,因为这表明算法的突破点在这儿;另一方面,如果计算机成功回答了测试问题,则表明图像识别技术又向前迈进了一步。

即使克服了一个“难题”,正确描述了某张图片的内容,双方都会欢呼雀跃;而这样的甜蜜烦恼,考官李飞飞也很享受。

最重要的是,ImageNet——汇集全世界智慧和力量的数据库——是免费的。

这意味着全球所有致力于图像识别的公司都可以免费反复测试他们的算法。

这就像一个巨大的试题库。

只要愿意,任何企业总能受到考官的考验。

虽然由于各种资金限制,GAIR会议不能完全免费,但我们已经尽力为大家提供40%的折扣——人民币,截止日期为7月1日。

也许在8月12日的GAIR活动上,你就有机会与这位美丽的研究人员讨论图像识别的最新进展。

谷歌和微软的图像识别能不能行得通,还得由斯坦福大学的李飞飞来决定

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 约200家报纸联手起诉谷歌和Facebook操纵广告市场

    约200家报纸联手起诉谷歌和Facebook操纵广告市场

    过去十年,谷歌等科技公司靠广告赚了很多钱,美国当地报纸的资源和资金已经萎缩到一无所有。 后者目前正在为生存而战。 Axios 报道称,美国大约两家地方报纸已对谷歌和 Facebook 提起反垄断诉讼。 他们声称,这两家公司垄断了数字广告市场,获得了本可以用于当地新闻的收入,

    06-21

  • 莆田与普投投资成立产业基金赋能消费产业链

    莆田与普投投资成立产业基金赋能消费产业链

    据投资界9月28日消息,莆田市城厢区宣布将设立规模5亿元的产业投资基金与晟道投资。 投资方向 围绕鞋服制造升级、食品加工等优势产业以及5G、装备制造、新材料、现代化等战略性新兴产业,围绕早期、高成长期企业进行投资。 农业。 莆田位于福建省中部地区,是中国民营经济最

    06-17

  • 信达投资拟赴港IPO融资25亿美元

    信达投资拟赴港IPO融资25亿美元

    汤森路透旗下IFR周四报道称,中国四大不良贷款管理机构之一的中国信达投资管理公司计划在香港首次公开募股在香港公开亮相。 IPO 筹集 25 亿美元。   此次公开发行将为渴望阅读信达即将发布的IPO招股说明书以了解不良贷款回收率信息的投资者提供难得的一睹中国金融体系的机会

    06-17

  • 拼多多更新招股书:腾讯、红杉各拟增持2.5亿美元,上市后市值或超240亿美元

    拼多多更新招股书:腾讯、红杉各拟增持2.5亿美元,上市后市值或超240亿美元

    据投资界7月17日消息,新电商拼多多成立3年的电子商务平台计划进军美国 美国证券交易委员会(SEC)更新了此前提交的招股说明书。   相关文件显示,拼多多拟申请在纳斯达克全球精选板块上市,代码:PDD。 按高达19美元的超额发行计算,拼多多市值将突破1亿美元。 招股书还显

    06-18

  • 云鲸逍遥001扫拖机器人:我们来分解一下“清洁”这件事

    云鲸逍遥001扫拖机器人:我们来分解一下“清洁”这件事

    没有运用最省力的原则,是设计失败的一大原因。 未能应用最少努力原则是设计失败的主要原因。 设计领域的经典参考书《设计的普遍原则》指出,当设计过于复杂或需要用户过多的认知或行为投入时,用户往往会感到沮丧或困惑,导致他们放弃使用该产品或服务。 这个原理尤其适用于

    06-21

  • 电竞数据服务商“万家赛事”完成千万级融资,金信资本领投

    电竞数据服务商“万家赛事”完成千万级融资,金信资本领投

    据投资界3月15日消息,电竞数据服务商“万家赛事”近日完成融资新一轮融资1000万元,由金信资本领投,启迪之星跟投。 本轮资金将主要用于吸引万家赛事APP新用户、为俱乐部提供多维度的青训管理系统、为赛事主办方提供大数据解决方案。 万家会展此前已获得泽厚资本和丰源资本

    06-18

  • 我们也可以用iPad+Windows电脑在苹果电脑上体验“侧边导航”功能

    我们也可以用iPad+Windows电脑在苹果电脑上体验“侧边导航”功能

    随着平板电脑画质和全面屏设计的提升,以及优秀压感体验的推广,平板电脑被使用作为计算机。 第二屏幕和原笔迹输入设备的价值逐渐增加。 毕竟,谁不想最大限度地利用低成本购买的平板电脑的功能呢?早在 iPadOS 13 中,iPad 就已经具备了“sidecar”功能。 当在 macOS Catali

    06-21

  • 都2023年了,还有大公司想做社交?

    都2023年了,还有大公司想做社交?

    尽管微信用户数量已达13.27亿,几乎覆盖了中国全部人口,但仍有各大厂商不死心,希望在这条赛道上获得一席之地。 近日,蔡菜在使用支付宝支付滴滴打车订单时,发现“支付后,支付宝页面出现‘进团享优惠’的提示,加入滴滴支付宝福利群即可领取优惠券” ”。 另一端,在群聊功

    06-17

  • 查看新项目NO.17 -智能康复护理设备精准解决术后患者-残疾人日常护理问题

    查看新项目NO.17 -智能康复护理设备精准解决术后患者-残疾人日常护理问题

    一般来说,残疾人的生活质量和护理水平是衡量一个国家社会保障水平的重要标准。 随着我国社会人口结构“老龄化”不断加剧,“积极应对老龄化”已成为国家战略。 政府工作报告多次强调,相关政策频频出台。 照顾濒临残疾、半残疾的老人关系到每个家庭的幸福。 如何为残疾人或

    06-18

  • 在线观看世界科幻大会精彩内容,快手与组委会一起探索想象的边界

    在线观看世界科幻大会精彩内容,快手与组委会一起探索想象的边界

    10月18日,第十八届世界科幻大会在成都开幕。 这是世界科幻大会首次与中国“携手”。 这也是该赛事第二次在亚洲举办。 作为当今规格最高、历史最悠久、规模最大、最具影响力的科幻主题盛会,世界科幻大会将云集国内外顶尖科幻专家、行业代表、专家院士等,举办多场科幻沙龙。

    06-18

  • 阿里巴巴2020财年Q2财报:科技成果集中爆发,阿里云季度营收92.91亿

    阿里巴巴2020财年Q2财报:科技成果集中爆发,阿里云季度营收92.91亿

    北京时间11月1日晚,阿里巴巴集团公布了截至9月30日的财年季度业绩,而其云计算业务持续强劲,季度营收92.91亿,超出分析师预期。 阿里巴巴在核心技术领域的投入正在推动阿里云进入新的增长阶段。 财报显示,阿里云季度营收92.91亿元,较去年同期净增36.24亿元,增速达64%。

    06-17

  • “糖吉医疗”完成数千万元融资

    “糖吉医疗”完成数千万元融资

    “糖吉医疗”近日完成数千万元融资。 本轮融资由BV百度创投领投,朗麦创投、鼎芯资本等投资方跟投。 此次募集资金将为糖吉医疗正在进行的“胃绕道支架系统”临床研究和生产线建设提供有力支持。 糖吉医疗是一家专注于肥胖、糖尿病、脂肪肝等代谢性疾病治疗新方法研发的高新技

    06-17