首页 > 科技启迪 > 内容

AI管理个人视频，分享快乐更容易吗？

发布于：2024-06-17 编辑：匿名来源：网络

雷锋网注：【图片来源：Google 博客所有者：Sudheendra Vijayanarasimhan 和 David Ross】如今，人们可以通过录制视频与朋友和亲人分享美好时光。

这已经不是什么新鲜事了。

然而，任何拥有大量视频资料的人都会告诉你一个事实：翻遍所有原始视频资料，找到值得重温或适合与家人朋友分享的完美视频片段是一项非常耗时的工作。

由于 Google 图片会自动找到视频中令人难忘的时刻并创建动画，因此可以快速捕获诸如吹灭蜡烛的孩子或跳入游泳池的朋友之类的事情。

这样，就可以更轻松地与朋友和家人分享美好时刻。

经过反复研究用于时间动作定位的 R-CNN 架构（TAL），自动化方面的一些困难已经得到解决。

这些问题的棘手部分是从数千种不同的排列中识别或分类数据。

因此，我们打造了TALNet，它可以识别一定时间内的大量瞬态动作。

目前，与其他方法相比，TALNet以最短的时间完成了这项任务。

它还允许 Google 图片推荐您视频中的最佳帧，以便您可以与朋友和家人分享。

雷锋网注：【图片来源：谷歌博客博主：Sudheendra Vijayanarasimhan 和 David Ross】要识别视频中的精彩时刻，第一步是收集人们可能想要保留的动作时刻，比如吹灭生日蜡烛、猫然后，我们用特定动作对这些视频片段进行注释，以创建一个大型训练数据库。

之后，我们要求评估者找到并标记所有时刻。

最后，模型在这个带注释的数据集上进行训练，然后可以识别全新视频中所需的时刻。

识别这些动作属于计算机视觉领域，就像生活中常见的物体识别一样，属于视觉检测的范畴。

然而，TAL的目的是在一段未经剪辑的冗长视频中确定每个动作的开始和结束时间，并标记不同的动作（例如“吹灭蜡烛”）。

它更侧重于捕获包含一系列一维视频帧中的动作的时间段。

我们使用的 Yao 方法受到 R-CNN 2D 图像对象检测框架的启发。

因此，要了解TALNet，首先要了解R-CNN。

下图演示了如何使用R-CNN架构进行物体检测。

雷锋网注：【图片来源：Google 博客所有者：Sudheendra Vijayanarasimhan 和 David Ross】第一步是生成一组可以对图像中的对象进行分类的对象推荐。

在此之前，输入图像必须通过卷积神经网络（CNN）转换为二维特征图。

然后，对象推荐网络在候选对象周围生成边界框。

AI管理个人视频，分享快乐更容易吗？

这些框是在多个尺度上生成的，以应对自然图像中对象尺寸的不确定性。

确定对象后，使用深度神经网络（DNN）将边界框中的对象分类为特定对象，例如“人”、“自行车”等。

以类似于R的方式完成时间动作定位-CNN。

视频输入帧序列首先被转换为编码场景的一维特征图序列。

该映射被传递到视频片段推荐网络，该网络生成候选片段，每个候选片段由开始时间和结束时间定义。

然后，DNN 对视频剪辑中的动作进行分类，例如扣篮和传球。

雷锋网注：【图片来源：Google 博客所有者：Sudheendra Vijayanarasimhan 和 David Ross】虽然时间动作定位可以被视为对象检测的一维对应物，但在处理动作定位时有一些值得注意的问题。

为了将R-CNN方法应用到动作定位领域，我们特意解决了三个问题，并重新设计了架构来专门解决这些问题。

1. 行动的持续时间更加可变。

执行动作的时间范围变化很??大，可以从几秒到几分钟不等。

对于长动作来说，了解动作的每一帧并不重要。

相反，我们可以使用扩展时间卷积通过快速扫描视频来更好地处理此动作。

该方法允许 Yao 在视频中搜索动作，同时根据设定的膨胀率跳过交替帧。

根据锚点片段的长度自动选择不同码率的视频进行分析，可以有效识别大至整个视频或短至一秒的动作。

2、目标行动前后的内容非常重要。

目标动作前后的内容包含了定位和分类的关键信息。

我们这里说的是时间之前和之后，而不是空间之前和之后。

因此，我们在推荐生成和分类生成阶段，通过在时间前后按一定比例扩展目标片段来对时间内容进行编码。

3.目标动作需要多模态输入目标动作是由外观、运动轨迹、有时甚至是音频信息来定义的。

因此，为了获得最佳结果，考虑多种形式的特征非常重要。

我们对推荐生成网络和分类网络都使用后期融合方案，其中每种模式都有一个单独的推荐生成网络，并且这些网络的输出被组合以获得最终的推荐集。

这些建议使用单独的分类网络对每种模式进行分类，然后进行组合和平均以获得最终的预测。

由于这些改进，Yao 在 THUMOS 的 14 个检测基准上的动作推荐和动作定位方面表现最好，并在 ActivityNet 项目中展示了其竞争力。

现在，每当人们将视频保存到谷歌图片时，该模型就会开始识别这些视频并创建动画来分享。

我们不断改进并使用更多的数据、特征和模型来提高动作定位的准确性。

时间动作定位的改进可以推动许多重要功能的进步，例如视频集锦、视频摘要和视频搜索。

我们希望继续推进这一领域的技术水平，同时为人们提供更多方式来回忆他们的珍贵记忆。

雷锋网注：本文编译自Google AI Blog【封面图片来源：网站名称Google AI Blog，所有者：Sudheendra Vijayanarasimhan 和 David Ross】雷锋网版权所有文章，未经授权禁止转载。

详情请参阅转载说明。

AI管理个人视频，分享快乐更容易吗？

站长声明

版权声明：本文内容由互联网用户自发贡献，本站不拥有所有权，不承担相关法律责任。如果发现本站有涉嫌抄袭的内容，欢迎发送邮件举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

标签：

上一篇：来自硅谷的一款 AI 硬件表示将淘汰所有应用程序

下一篇：耀明汽车获广东省产业发展基金5亿元战略投资

相关文章

汽车融资租赁平台“来用车”获亿元A轮融资，欲做“零门槛购车”先行者

数据显示，2020年我国互联网汽车市场总规模汽车金融规模将达1.1万亿元。，我国互联网汽车金融总规模可达1.85万亿元，互联网汽车金融行业潜力巨大。　　据投资界8月17日消息，汽车融资租赁平台“来用车”今日正式宣布获得1亿元A轮融资。本轮融资由美丽金融集团、上市公司金

06-18
50亿，光大控股在宜兴设立母基金

投资界（ID：pedaily）消息，2019年4月11日，光大控股宣布设立光大宜兴母基金（即光大宜兴产业投资系列母基金）初始投资已到位。这是继今年2月在香港签署战略合作协议后，光大控股与宜兴市政府在基金领域的合作取得实质性进展。宜兴地处长三角经济区核心区，制造业基础雄厚

06-18
M31资本领航基金成功募集超4.5亿美元

这是M31资本成立以来的首次曝光。据投资界9月29日消息，基于中国新经济的投资基金M31资本正式宣布旗下领航者基金已超额募集目标。该基金募集资金总额为4.5亿美元。其投资者包括全球知名主权基金。、大学基金会、保险公司、基金中的基金、家族办公室、企业家等。 M31资本成

06-18
关于下一个十年，我们在深圳找到了答案

鏋佸鍏洯鍑哄搧 |鏋佸鍏洯鍒涙柊澶細锛圙eekPark IF锛?2骞存潵棣栨绂诲紑鍖椾含锛屽湪OPPO锛圛F鐙鍐犲悕鍚堜綔浼欎即锛夋繁鍦冲競绂忕敯鍖虹殑鍏卞悓鏀寔涓嬪崡涓嬫繁鍦炽?備粖骞翠互鏉ワ紝涓浗浜掕仈缃戣涓氱粡鍘嗕簡澧為?熸斁缂撱?佺洃绠?佽鍛樼瓑璇

06-18
苏宁张近东发声

张近东建议，把品质和体验升级作为农村商业消费升级的主要方向，发挥有线上线下融合成功经验的大型零售实体的引领和带动作用，通过扶持小农村小微零售企业。数字赋能将引领农村消费品质升级，充分释放农村消费潜力。张近东没有回答关于苏宁易购23%股份的受让方为何是深圳国

06-18
清科文创投资消费科技领域龙头企业雅奥供应链

投资圈（ID：pedaily）4月13日报道，近日，知名投资机构清微文化旗下清科国投创意，成功完成国内领先的一公里原产地仓储公司亚奥供应链1亿元B轮融资。亚奥供应链成立于2006年，是行业领先的第一公里供应链综合服务商。青岛文化创意产业有限公司总裁万良表示：“青艺文化创意

06-18
储能价格战这一年

储能价格战今年结束，但价格战尚未结束。价格战贯穿整个储能市场全年，至今仍没有停止的意思。目前能找到的最低报价记录是去年12月初产生的。国家能源青海海南塔拉MW/MWh电站采购招标已开启，最低报价0.元/Wh。 11月初，在广东能源集团新疆有限公司年MW/MWh储能系统设备采

06-18
31家企业入选阿里云首期云原生加速器，共建云原生行业新生态

阿里云加速器首期入选31家企业，共同打造行业新生态。在工业数字化浪潮中，云原生已成大势所趋。 3月9日消息，阿里云宣布袋鼠云、协云、黑湖科技、千云科技等31家企业入选阿里云云原生加速器第一期。其中超过一半为B轮及以上融资，1/5为C轮及以上融资。入选企业总估值超1亿

06-18
文杰M9发布！余承东押注华为全部“黑科技”，挑战千万级SUV

这是万元以内最好的SUV，也是陆地上最好的SUV。在今天下午举行的华为全场景冬季发布会上，文杰M9一经亮相，余承东就引发了观众的期待。最后，经过一阵阵欢呼，文杰M9的售价终于敲定：增程式Max版46.98万元、纯电动Max版50.98万元、增程式Ultra版52.98万元、56.98万元。纯电

06-21
苹果首款耳机Vision Pro发布！为什么你的下一部 iPhone 需要是手机

每隔一段时间，就会有革命性的产品问世。 2016年，乔布斯在第一代iPhone发布会上用这句话作为开场白。 2017年，WWDC23上，乔布斯的接班人库克终于再次说出了“革命性产品”这个词。在 WWDC 40 周年，即 iPhone 发布 16 周年之际，我们有幸来到加州库比蒂诺的 Apple Park，见

06-21
逃亡归来后，年轻人身陷大工厂围攻

拥有8年电商经验的姚冰冰（化名）决定重返字节。半年过去了，这个地方她还是觉得熟悉。大工厂意味着没完没了的会议和没完没了的报告文件。在和雪豹财经通电话的时候，她打开了同事发给她的日历，“1、2、3……15，我同事今天有15个会议，最晚的一个安排到11点30分下午回去

06-17
Tiger向LP道歉：他赔了钱

Tiger已经无法忍受了。 The Information报道称，老虎环球管理公司近日告知有限合伙人，截至去年底，其1亿美元风险投资基金已录得20%的亏损。更惨淡的是，老虎基金未上市项目的整体估值蒸发了1亿美元（约合人民币1亿多），创造了其创投史上最大的窟窿。至此，一向强硬的老虎

06-18