首页 > 科技未来 > 内容

用嘴拍视频真的来了! Meta这个新应用太不可思议了

发布于:2024-06-21 编辑:匿名 来源:网络

今年是AI在图像视频制作领域取得长足进步的一年。

有人凭借人工智能生成的图像获得了数字艺术奖,击败了所有人类艺术家;有像Tiktok这样的应用程序,可以通过文本输入生成图像,并将其变成短视频绿屏背景;而且有新产品可以做到这一点,文字直接生成视频,直接达到“用嘴拍视频”的效果。

这款产品来自Meta,深耕人工智能多年,前不久还因为元宇宙而被嘲笑。

▲ 元元宇宙已经被疯狂嘲讽了,但这一次,你不能再嘲讽它了,因为它真的有了一个小小的突破。

将文本转换为视频可以做什么?现在,你可以用你的嘴来制作视频了。

虽然这有点夸张,但Meta这次推出的Make-A-Video很可能正在朝着这个目标迈进。

Make-A-Video目前可以做的是: 文字直接生成视频——把你的想象变成真实、独特的视频 图片直接转换成视频——让单张图片或两张图片自然移动成视频 生成扩展视频——输入视频要创建视频变体,请说出文本并直接生成视频。

在这方面,Make-A-Video击败了很多动画设计专业的学生。

至少可以做成任何款式,而且制作成本很低。

虽然官网不允许您直接生成视频体验,但您可以先提交您的个人信息,Make-A-Video的任何开发都会先与您分享。

目前能看到的案例并不多,官网上展示的案例还是有一些奇怪的细节。

但无论如何,文字可以直接转换成视频,这本身就是一种进步。

一只泰迪熊正在画自画像,你可以在纸的阴影部分看到泰迪熊的手的不自然的影子。

机器人在时代广场跳舞。

猫拿着电视遥控器换频道。

猫手上的爪子与人的手非常相似。

有时看着有点害怕。

一只戴着橙色针织帽的毛茸茸的树懒正在玩笔记本电脑,电脑屏幕的光线反射在它的眼睛里。

以上都是超现实风格的,更接近现实的案例更容易忽悠。

Make-A-Video展示的案例如果只关注当地的表演就很好,比如艺术家在画布上画画的特写、马在喝水、珊瑚礁里游动的小鱼等。

但走在大雨中的稍微现实一点的小夫妻却显得十分诡异。

上半身还好,下半身的腿却忽隐忽现,有时还被拉长,像鬼片一样。

还有飞船登陆火星的绘画视频、一对穿着晚礼服的情侣被困在倾盆大雨中、阳光洒在桌子上,以及一个动画熊猫娃娃。

从细节上来说,这些视频并不完美,但单从AI文字到视频的创新效果来看,还是让人惊叹的。

静态油画也可以借助制作视频(一艘在大浪中移动的船)制作动画。

海龟在海里游泳。

最初的场景很自然,但后来变得更像绿幕抠图,很不自然。

瑜伽练习者在早晨的阳光下伸展身体,瑜伽垫也会随着视频的变化而变化——这个AI无法击败学习影视制作的学生,因为控制变量没有做好。

最后,输入视频模仿其风格创建视频变体有3种情况。

其中一项变化不太精致。

一段宇航员在太空中跳舞的视频被转变成 4 个不太美观的版本,但都比较粗糙。

跳舞熊的视频中有不少令人惊讶的变化,至少跳舞的姿势发生了变化。

至于最后那个兔子吃草的视频,就是最“能告诉我我是男是女”的类型吗? 5个视频中很难辨认谁是原视频,而且看起来都很和谐。

一旦文本到图像的转换取得进展,视频就出现了。

在《阿法狗之后,它再次彻底颠覆人类认知》中,我们曾经介绍过图像生成应用程序DALL·E。

有人曾用它产生的图像与人类艺术家竞争并最终获胜。

我们现在看到的Make-A-Video可以说是DALL·E(初级版)的视频版——就像18个月前的DALL·E一样。

它有巨大的突破,但目前的效果不一定会让它更受欢迎。

人们很满意。

▲ DALL·E 创作的延伸画甚至可以说是站在巨人 DALL·E 肩膀上的产品。

与文本生成的图像相比,Make-A-Video在后端并没有做出太多新的改变。

研究人员还在论文中表示:“我们看到描述文本生成图片的模型在生成短视频方面也出奇地有效。

” ▲ 目前获奖作品有 3 件,描述了 Make-A-Video 制作的文本生成图片。

优点:加速T2V模型(文本到视频)的训练。

不需要文本到视频数据对。

转换后的视频继承了原始图像/视频的风格。

当然,这些图像也有缺点。

上面提到的不自然现象是真实存在的。

的。

而且它们并不像这个时代诞生的视频。

画质模糊,动作僵硬,不支持声音匹配,视频长度不超过5秒,分辨率64 x 64px。

这些都是缺陷。

他们的清晰度还远远不够。

▲ 这段视频中有几帧狗的舌头和手,非常奇怪。

清华大学和知识产权研究院(BAAI)的研究团队几个月前发布的第一个可以直接根据文本合成视频的CogVideo模型也存在这个问题。

基于大规模预训练的 Transformer 架构,提出了一种多帧率分层训练策略,可以有效对齐文本和视频剪辑,但经不起更仔细的检查。

用嘴拍视频真的来了! Meta这个新应用太不可思议了

但谁能说 18 个月后,Make-A-Video 和 CogVideo 不会制作出比大多数更好的视频呢? ▲ CogVideo 生成的视频 - 目前仅支持中文生成。

虽然已经发布的文本转视频工具不多,但已经有很多正在开发中。

Make-A-Video发布后,初创公司StabilityAI的开发者公开表示:“我们的(文本转视频应用)将会更快更好,适合更多人。

”有竞争就会让它变得更好,越来越真实的文字转图像功能就是最好的证明。

用嘴拍视频真的来了! Meta这个新应用太不可思议了

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中

    请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中

    请检查! 2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛直播实录交付2021年8月24日,为配合疫情防控工作,中国(湘潭)工业软件产业创新创业大赛西南赛区总则 决赛将在钉钉平台举行。 本次大赛由湘潭市人民政府指导,湘潭高新技术产业开发区管委会、阿里云、阿里云创

    06-17

  • 中国证监会已批准诺禾致源、新丰光、莱尔科技等科创板IPO注册,

    中国证监会已批准诺禾致源、新丰光、莱尔科技等科创板IPO注册,

    近期,证监会批准以下公司首次公开发行股票注册依法程序登陆科创板的:深圳市亚汇龙生物科技股份有限公司、北京诺禾致科技股份有限公司、新丰光电科技股份有限公司、广东莱尔新材料股份有限公司上述企业及其承销商将与上交所协商确定发行时间表并陆续公布招股说明书文件。 听

    06-17

  • 餐饮解决方案管理平台宁波易食品有限公司获得数千万元A轮融资,米方资本领投,

    餐饮解决方案管理平台宁波易食品有限公司获得数千万元A轮融资,米方资本领投,

    据投资界1月23日消息,宁波博益食品有限公司(以下简称“宁波博益”)宣布获得米方资本。 方创资本领投数千万元。 宁波益是国内领先的专业从事特殊医学用途配方食品研发和生产的创新型高新技术企业。 以高品质特医产品为核心,针对特定人群提供个性化营养治疗指导方案,致力

    06-17

  • Tank 700 Hi4-T 已上市,国产硬派越野车为何能卖到70万?

    Tank 700 Hi4-T 已上市,国产硬派越野车为何能卖到70万?

    近日,著名车展The Grand Tour迎来更新。 杰里米克拉克森放下锄头,带领伙伴詹姆斯梅和理查德哈蒙德追随撒哈拉沙漠达喀尔拉力赛的脚步。 应制片人的要求,被称为“三贱客”的三位主持人改装了三辆老式跑车,完成了这一公里的旅程。 可想而知,原本应该在高速公路上飞驰的跑车

    06-21

  • 专注矿用车自动驾驶,一控智嘉完成6000万元天使轮融资

    专注矿用车自动驾驶,一控智嘉完成6000万元天使轮融资

    据投资界7月2日消息,矿用车无人驾驶公司一控智嘉宣布完成融资天使轮1万元。 本轮融资投资方为兴韬投资,融资资金将主要用于矿区的技术研发和实施测试。 北京易控智能驾驶技术有限公司成立于今年5月。 主要开发矿用车辆自动驾驶解决方案和作业调度平台。 其核心团队来自自动

    06-17

  • 【融资24小时】2022年12月6日投融资事件汇总及明细

    【融资24小时】2022年12月6日投融资事件汇总及明细

    今日国内市场共发生19起投资披露事件,其中先进制造9起(浙江广芯微电子、中芯能源光电、墨芯半导体) 、宏芯宇电子、瑞芯微电子、中科国盛、瑞芯微电子、汇芯半导体、理想万里汇),医疗健康案例5个(奥力生物科技、威斯进生物科技、海色斯诺维、奇辉生物科技、灵芯智能),

    06-18

  • 腾讯各业务群裁员比例不足30%

    腾讯各业务群裁员比例不足30%

    36氪从多位与腾讯关系密切的人士处获悉,从去年底至今,腾讯多个业务群一直在裁员。 主要裁员的是CSIG 和PCG。 ,而IEG等公司的削减幅度较小或尚未采取任何行动。 有传言称,腾讯本轮裁员幅度将高达30%至50%。 我从很多员工那里了解到,腾讯整体的裁员比例不会那么高,也没有

    06-18

  • 国家统计局:5月份二手房销售价格环比持平或下降

    国家统计局:5月份二手房销售价格环比持平或下降

    国家统计局数据显示,5月份,70个大中城市二手房销售价格环比持平或下降< titlesplit > 53个城市二手房价格环比下降,环比扩大3个。 。 分看各一线城市,5月份,一线城市二手房销售价格与上月持平,上涨0.4%;二线城市环比下降0.3%,降幅与上月持平;三线城市环比下降0.5%,

    06-18

  • 珠江投资激增,湾区创新引领, 2023粤港澳大湾区创业投资高峰论坛隆重举行

    珠江投资激增,湾区创新引领, 2023粤港澳大湾区创业投资高峰论坛隆重举行

    5月20日,广东粤科金融集团有限公司与广东省创业投资促进会在广州粤科金融大厦召开会议隆重举办“2019粤港澳大湾区创业投资高峰论坛”。 论坛以“珠江投资热潮与湾区创新先行”为主题,设置领导演讲、主题演讲、成果分享、百亿签约、高端对话等环节,邀请各国政府领导高层、著

    06-18

  • 跨境电商易仓科技获2500万美元B+轮融资,由中金资本

    跨境电商易仓科技获2500万美元B+轮融资,由中金资本

    投资圈旗下基金领投(ID:pedaily)据8月3日消息,易仓科技完成1万美元B+轮融资由中金资本资本领投的基金领投,现有股东EWTP、CCV、Paradox继续跟投。 本轮融资将用于迭代易仓ERP产品并持续打造跨境生态,在产品研发、流量系统、供应链系统、组织管理等方面赋能卖家,并持续引

    06-18

  • 日本福岛地震:或加剧全球半导体产业链的不确定性

    日本福岛地震:或加剧全球半导体产业链的不确定性

    当地时间3月16日23点34分(北京时间22点34分)和23点36分(北京时间22点36分),日本发生两次地震福岛县附近海域发生地震,震级分别达到6.1级和7.4级,引发大范围停电、停水,并对高铁、高速公路等基础设施造成不同程度的破坏。 地震暂时导致瑞萨、信越、村田、索尼、东芝等半

    06-08

  • 卓源资本领投,“博涵智能”获数千万A轮融资

    卓源资本领投,“博涵智能”获数千万A轮融资

    投资圈(ID:pedaily)据7月18日消息,工业互联网AI+大数据平台解决方案提供商“博涵智能”(易通科技(原“易通科技”)近日获得数千万A轮融资,本轮融资由清华投资机构卓源资本领投,公司创始团队跟投,云沐资本跟投。 本轮融资将主要用于研发团队扩充和销售团队建设 近年来

    06-18