英飞凌科技选择 LTIMindtree
06-06
6月19日至23日,人工智能领域全球顶级国际会议CVPR(计算机视觉与模式识别)智能与计算机视觉大会在美国新奥尔良举行,并同期在线举行。
商汤科技与联合实验室共有71篇论文入选今年CVPR,创下新高。
其中近四分之一以Oral(口头报告)形式被接受,涵盖了三维视觉、自动驾驶等诸多备受瞩目的前沿研究。
领域和方向,不断巩固在全球计算机视觉研究领域的领先势头。
自成立以来,商汤及联合实验室已在各类顶级学术会议上发表论文100余篇,在各类比赛中获得70多项世界冠军奖。
同时,商汤并没有以论文数量作为衡量公司技术发展的标准。
商汤科技研究院院长王晓刚博士表示:“我们希望通过提供良好的高效科研环境,鼓励和引导年轻科研人员从高水平的角度进行高质量的研究。
”在今年的CVPR上,商汤科技还参加了多项学术竞赛,也取得了骄人的成绩。
例如,商汤科技与中科院自动化所、上海人工智能实验室联合参加Embodied AI(Embodied Intelligence Challenge),并获得RxR-Habitat赛道的冠军。
作为全球具身人工智能研究领域的权威竞赛,该竞赛要求利用自然语言控制来解决室内机器人的导航问题。
商汤方法实现了90%以上的提升,导航精度从24.08%提高到45.82%,导航保真度从37.39%提高到55.43%。
与此同时,在推广基于深度学习的视觉编码技术而举办的CLIC(Challenge on Learned Image Compression)竞赛中,商汤技术团队提供的解决方案成功夺得图像编码赛道的冠军,不仅取得了最高分在所有三个测试代码点中,它在所有深度学习解决方案中拥有最好的主观评价分数和最快的解码速度。
推动科技赋能产业,以创新引领产业突破。
商汤科技一直鼓励研究团队关注行业需求和痛点,将研究工作与实际业务场景相结合。
近年来,依托SenseCore商汤AI设备等人工智能基础设施的建设,商汤在前沿研究领域有了更强的支持,进一步推动与行业合作的深化,以AI技术引领行业发展创新。
例如,在这篇论文《Bailando: 3D Dance Generation via Actor-Critic GPT with Choreographic Memory》中,研究人员提出了一种新的音乐转舞蹈框架Bailando,可以驱动3D角色跟随音乐做出舞蹈动作,不仅保证了动作的标准和美观,而且节省了时间。
与不同的音乐节奏保持一致。
当前,在人工智能、云计算等技术能力提升的背景下,数字人的应用范围日益丰富,在社交、游戏、直播、社交等领域逐渐融入我们的生活。
虚拟偶像。
这项研究无疑为未来数字人产业创造更加智能、个性化的角色以满足多样化需求提供了潜在的方向。
点云跟踪框架PTTR示意图。
近年来,随着自动驾驶和激光雷达技术的发展,基于点云的目标跟踪也受到更多关注。
针对点云数据的独特挑战和现有算法的缺点,商汤研究团队在论文《PTTR: Relational 3D Point Cloud Object Tracking with Transformer》中提出了一种新颖的点云跟踪框架PTTR,显着提高了多个数据集上目标跟踪的准确性。
,为自动驾驶的安全运行奠定基础。
商汤科技还联手北航刘祥龙教授团队,共同组织了针对复杂场景的鲁棒机器学习竞赛——面向开放世界分类的鲁棒模型。
大赛旨在推动安全可靠的人工智能模型研究,鼓励创造更安全可靠的人工智能,支持人工智能技术更加可持续发展。
此次比赛总共只吸引了队伍和参赛者。
6月19日,CVPRArt of Robustness Workshop正式公布了大赛获奖者名单。

加强基础设施和生态建设,助力见效。
商汤科技在学术研究和技术创新方面取得的突出成就,离不开领先的软硬件基础设施融合的强大算力基础和领先的算法能力,以及商汤的学术生态成果。
以及开源生态建设的长期积累。
商汤通过建设并不断完善以SenseCore商汤AI大设备为核心的基础设施,为技术研发和落地提供了重要的基础支撑。
研究人员可以高效地进行科学研究,快速实验和验证新想法,加速创新和迭代,促进高水平论文的产生,解决产业实施中的问题。
商汤非常重视学术生态的建设。
今年以来,商汤科技先后与上海交通大学、南洋理工大学、浙江大学建立联合研究院或实验室,与清华大学建立“感知计算”产学研深度融合专项计划,推动成立全球人工智能大学学术联盟。
通过与学术界的密切联系,促进各项学术成果的产生以及国际学术交流与合作。
今年6月11日,商汤科技联合全球大学人工智能学术联盟成功举办“研究无止境:商汤论文分享会”活动,汇聚了商汤科技与香港中文大学、浙江大学、南洋理工大学的专家。
大学、北大等高校研究学者嘉宾将在线解读3D视觉、姿态估计、低层视觉、表示学习、场景理解等领域的CVPR Oral论文,分享宝贵的学术经验。
此外,商汤不断巩固开源生态系统的建设。
OpenMMLab是一个基于视觉算法的开源项目,目前在GitHub上拥有超过5万个star,并已成功向研究人员和业界开源了数千个模型。
基于决策智能的OpenDILab于去年WAIC会议上发布,并向学术界和工业界开源。
在大模型方向,商汤联合上海人工智能实验室和高校,联合发布通用视觉技术系统INTERN,并开源OpenGVLab,助力通用人工智能基础研究和生态建设。
OpenMMLab还在CVPR期间举办了主题为《OpenMMLab:计算机视觉研究和生产基础平台》的研讨会,邀请学术界知名人士参与分享讨论,共同构建开源生态。
随着基础设施的完善以及学术和开源生态的培育,人工智能技术研究的基础将变得更加稳定和广阔。
商汤将以此为支撑,继续引领人工智能技术创新,加强人工智能产业深化落地,加速规模化应用,推动人工智能技术和产业发展不断突破。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-18
06-18
06-18
06-21
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态