首页 > 科技未来 > 内容

使用神奇工具TikTok后,我立即卸载了PS

发布于:2024-06-21 编辑:匿名 来源:网络

将图像转换为文本。

今天这不再是问题。

各种OCR功能让从图像中提取文本变得更加容易,对于AI解读图片来说也不是什么大问题。

但对于今天的人工智能来说,画画仍然很困难。

识别图片并提取信息就是为AI处理信息。

但绘画多了一层,不仅是处理信息,也是完成创作。

前者是选择题,后者是命题论文。

回答好选择题后,下一步就是回答好自由发挥的主观题。

但没人认为,第一个在自己的应用程序上回答这个问题的人是TikTok。

用TikTok创造Facebook和马云。

与在AI行业投入巨资、长期沉浸在巨头手中的谷歌和OpenAI相比,TikTok或许只是一个“让渡者”。

但转学生绕过了巨头,先解决了问题。

为什么这并不奇怪呢?虽然转校生也用了一些巧思,但至少做出来还是让人惊叹的。

TikTok打造的文字转图像功能被称为“AI绿屏”。

它取代了原来单调的白色背景,利用AI为您生成视频的背景。

这些视频的背景或许并不能全部满足创作者的需求,但毕竟这是为您定制的独一无二的绿屏背景。

如果幸运的话,可能更符合视频内容的主题。

使用神奇工具TikTok后,我立即卸载了PS

▲ 发布视频时点击特效即可体验该功能。

图片来自硅星。

我们对这个新功能做了一些测试,看看 TikTok 绘制的图片是什么样子的。

在随机测试的词语中,有些画作的呈现方式让人摸不着头脑,而另一些则被评价为“非常擅长描绘怪异感”。

备受好评的是输入“Facebook”后出现的画作。

你依稀可以认出Facebook的蓝色图标。

画面中的单眼单耳营造出一种独特的恐怖感。

结合最近关于Facebook的新闻,不得不说这张图很好的描述了Facebook这个词的感觉。

图像中还准确地描绘了“苹果”和“中国”等词语。

前者很容易被视为一个苹果,而后者也可以被视为一座中式建筑。

同时,也避免了国旗等二次创新领域较为敏感的图案。

只是如果你想呈现一张苹果的图片,那是很困难的。

甚至关键词“苹果”+“苹果首席执行官库克”也呈现出与苹果和菜肴相关的模式。

不过,也有很多无关紧要的。

比如我们尝试了阿里巴巴、腾讯、字节跳动,但生成的也不能说与这些品牌断然无关。

但无论怎样,一眼望去都很难辨认,而且有些抽象。

还有很多通过输入人名画出的有趣的图画。

享誉海外的手工博主李子柒以自己的名字创作了一幅舒缓的山水画;前英超著名教练温格生成的图片也具有辨识度,属于经典照片重新解构的风格。

;马云的画风也有点怪异,和脸书一致的眼神有一种偷窥的感觉。

至于马斯克,我们使用 TikTok 生成了四张图像,但都无法识别。

当然,除了通过人物文字和抽象图片取得成功之外,还有Switch和广州被认为是恰到好处、能让人联想到的。

塞尔达风格的绘画中的人物可以被粉丝认出“这可能是马里奥”。

同样,广州的标志性建筑和绚丽的色彩也很容易辨认。

每个背景图像的生成时间不到 5 秒。

如果主题相似,那么这些图片就非常适合用作视频的背景图片。

生成时间短,每个人都可以使用。

这些都是TikTok的优势。

因此,这样一款文字转图像产品出现在日均数亿用户的应用上,可以说是一个里程碑式的事件。

只是TikTok还是走了捷径。

目前产生的图像几乎都属于绘画风格,很多甚至属于抽象派、印象派。

与生成真实图像相比,这个难度要低得多。

毕竟,即使看起来不像,但你仍然可以依靠你的大脑来弄清楚。

理解你输入的单词的人工智能面临着和你去美术馆看艺术展览时同样的问题。

如果相似度不够,那就理解并弥补。

这也是一种节省成本的方法。

它的难度较小,需要的计算能力较少,因此成本较低。

▲ 即使是带有轻微血腥文字的图片也不会太吓人。

即使是谷歌也没有可以立即生成的产品。

从效果来看,TikTok的AI绿屏渲染效果不能给予高分。

但作为一项门槛较高的技术,如果能在几秒钟内无任何门槛地被用户使用,那就算是进步了。

虽然目前生成的图像还不够“日常”、不够真实,引发了人们对技术滥用和图像造假的担忧,但真实的图像实际上是可以实现的,但还没有像 AI 绿屏那样为所有人所用。

就这样。

谷歌还发布了 Imagen AI 工具,可以将简单的句子变成真实的图片——就像拍摄的照片一样真实。

但遗憾的是,即便是在AI方面投入巨资的谷歌,也未能生产出可以即时生成的产品。

换句话说,输入请求并让 AI 为您绘制图像的选项在 Imagen AI 中尚不可用。

▲ Imagen AI 可以点击不同的选项来创建不同的图片。

目前,官网仅提供一些预设选项。

即使点开每一种,也只有几十种组合,但有写实风格和油画风格可供选择。

有兴趣的读者还是可以自己去看看。

谷歌是那种出名的人,一举一动都引人注目。

而人工智能研究实验室OpenAI则依靠作品,他们推出了原创且最流行的人工智能文本转图像生成器Dall-E。

▲ Dall-EDall-E 可以根据文本内容真实地重新编辑现有图像。

它可以为您添加和删除元素。

在执行这些操作的同时,它还会考虑阴影、反射和纹理的渲染效果——PS技术可以秒杀你。

分析和模仿现有的绘画并替换它们是非常简单的。

灵感风格来源于原作,但主角换了。

作为一个研究项目,Dall-E 仍处于内测阶段,名单上的“有限数量的可信用户”已经陆续在社交媒体上发布了照片。

每个参与测试的用户最初可以获得50个免费积分,然后每月获得15个积分。

1点可以生成4张图片,其中一种文字内容,还可以选择三种绘画风格。

目前,Dall-E 针对内测用户的变现方式仍然很少——如果每月用完 15 个积分后仍想体验该服务,可以以 15 美元的价格购买 1 个积分。

幸运的是,生成的图像也可以商业化,一旦您使用 Dall-E 创建它们,您就可以将它们用于从插图到封面再到 T 恤设计的所有内容。

▲ 用户可以在设定的位置添加元素,添加到照片中的元素会自动补充阴影等方面。

视频总监Karen X. Cheng告诉彭博社:我已经经历了几个小时的生成图片,甚至迷路了。

方向...感觉更像是在和一个活生生的、会呼吸的人一起工作,而不是像 Photoshop 这样的工具。

当然,Dall-E 目前并不完美。

要创造出完全逼真的人脸,还是有一定难度的。

它需要专业的医学知识才能准确地代表人体骨骼。

这也不是很好。

研究人员 Aditya Ramesh 表示,DALL-E 只知道如何阅读文本并生成图像,因此它实际上是在尝试创建视觉上相似的东西。

▲Dall-E生成奇幻图片的技术无疑是非常有前景的。

你可以想象它为内容创作者降低了图像搜索的门槛,你也可以想象肖像画家可以在它的帮助下提高工作效率。

但正如每一项出现的技术都可能被滥用一样,AI帮助文本生成图像的技术也存在着Deepfakes上曾经出现过的负面应用场景一一重现的风险。

好在,这一次技术提供商已经提前做好了准备,想要将AI关在笼子里。

TikTok的抽象形象本身就是一种保护,因为它不现实。

另外,即使你在TikTok中输入一些暗示性内容(暴力、裸露),画作仍然不会达到预期效果。

抽象风格不清晰,避免了巨大的审稿成本。

▲ Dall-E 官网的限制表明,Dall-E 还限制 AI 生成暴力、成人和仇恨内容,并且算法最大限度地减少了 Dall-E 接触此类概念的机会。

同时,该平台还拥有先进的技术,可以防止使用真人脸部生成图像(名人松了一口气),自动和手动监控系统也可以防止 Dall-E 的滥用。

只是随着新技术的出现,我们不能只看到不好的一面。

其带来的高效前景值得期待。

至少,爱范儿很期待文章推送的那一天,并在文章末尾加上“文章标题图片由Dall-E生成”的字样。

使用神奇工具TikTok后,我立即卸载了PS

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 国际顶级学术会议CIKM2019即将在北京开幕,重量级嘉宾带你一睹人工智能前沿

    国际顶级学术会议CIKM2019即将在北京开幕,重量级嘉宾带你一睹人工智能前沿

    第28届国际顶级“信息提取、知识管理与数据库”年会(CIKM - The ACM International Conference on Information and Knowledge Management)即将召开今年11月3日至7日在中国北京举行。 CIKM自2017年成立以来,一直致力于汇聚这三个相关领域的研究人员和开发人员,实现深入的跨

    06-17

  • 致茂电子携手群益能源,抢占新能源汽车测试市场氢燃料电池商机

    致茂电子携手群益能源,抢占新能源汽车测试市场氢燃料电池商机

    大型测量仪器测试公司「致茂电子」与燃料电池测试设备制造商「群益能源」,双方签署合作意向,正式进军氢燃料电池测试市场,进一步拓展新能源行业商机。 群益能源是燃料电池测试及自动化生产设备的专业制造商。 多年来深耕燃料电池领域。 其产品具有很强的竞争力。 结合致茂

    06-06

  • 2021广州车展:福特新设计实拍-凯迪拉克LYRIQ实车亮相-奥迪Q5 e-tron开始预售

    2021广州车展:福特新设计实拍-凯迪拉克LYRIQ实车亮相-奥迪Q5 e-tron开始预售

    宝马2系Coupe亮相,依旧原味。 对于宝马来说,小尺寸、前置后轮驱动的2系Coupe是一款有趣的汽车。 不久前,全新一代BMW 2系Coupe在古德伍德速度节上全球首发,并在今年的广州车展上首次中国亮相。 新车的外观比四门车型更具攻击性,尤其是“让人大开眼界”的前大灯和巨大的三

    06-21

  • 云蝠智能2022年投资加盟政策详解

    云蝠智能2022年投资加盟政策详解

    作为中国智慧营销领域的积极探索者,云蝠智能获得了广泛的市场认可,客户涵盖房地产、汽车、装饰、金融、互联网、教育、电子商务、企业服务等众多行业。 公司希望通过人工智能、过程自动化领域的技术优势赋能传统行业,推动传统行业智能化转型升级,最终在提高营销效率的同时

    06-18

  • 总投资超28亿元,内蒙古新华半导体多晶硅项目预计月底竣工

    总投资超28亿元,内蒙古新华半导体多晶硅项目预计月底竣工

    据《内蒙古新闻广播》消息,内蒙古新华半导体科技有限公司万吨半导体级多晶硅项目已进入最后阶段,预计11月底完工。 据相关负责人介绍,该项目总投资28.3亿元,产值约24亿元。 年产高纯电子级多晶硅0吨,二氯氢硅、三氯氢硅、四氯化硅1吨。 吨。 项目建成后,公司从原材料净

    06-06

  • 酒旅会员互联网运营商“OTM”获近4000万元天使轮融资

    酒旅会员互联网运营商“OTM”获近4000万元天使轮融资

    酒旅会员互联网运营商“OTM钟书科技”近日宣布完成近万元天使轮融资轮融资。 本轮融资由Creation Partners CCV领投,高榕资本跟投,回声资本担任独家投资方。 本轮融资将继续用于技术研发、市场拓展和人才引进。

    06-18

  • SIA:6月全球半导体产品销售额345亿美元

    SIA:6月全球半导体产品销售额345亿美元

    根据半导体行业协会(SIA)最新公布,今年6月全球半导体产品销售额1亿美元,同比增长5.1%,但低于上年2.5亿,环比下降1.4%。 半导体行业协会主席兼首席执行官John Neuffer透露,6月份美国市场半导体产品销量大幅增长,同比增长近30%;中国市场增长4.7%;其他亚太市场同比增长

    06-06

  • 特斯联获得Investcorp投资,将在AI CITY领域进一步拓展

    特斯联获得Investcorp投资,将在AI CITY领域进一步拓展

    据投资界9月8日消息,在完成相关国家注册后,国际知名投资机构Investcorp宣布正式完成投资全球领先的智慧场景服务商特斯联。 特斯联科技此次投资将用于特斯联在AI CITY(人工智能城市)领域的进一步拓展。 此前,特斯联已获得光大控股、IDG资本、中信产业资本、京东、商汤科

    06-18

  • 对话张建锋:阿里云重回“卡门线”

    对话张建锋:阿里云重回“卡门线”

    如果你这六个月经常出差,你可能已经注意到,阿里云的机场口号已经换成了“为了不可估量的价值”——这阿里云在云栖大会上发布的口号,时隔七年重新回到公众视野。 所以,这句话在广告中看似不够“直接”,但确实引起好奇和阅读。 这是什么意思?为什么要回来?回到这句话诞

    06-17

  • 【PW热点】虎牙2020年第四季度营收29.9亿元,同比增长21.2%

    【PW热点】虎牙2020年第四季度营收29.9亿元,同比增长21.2%

    昨晚虎牙公布了第四季度及全年财报

    06-18

  • 与iQOO一起,我们把电竞赛场带入了未来社会

    与iQOO一起,我们把电竞赛场带入了未来社会

    当中国的健儿在亚运会上获得金牌时,当重庆狼队在KPL中获得十个冠军时。 当电竞赛场加冕荣耀时,我们总会看到iQOO。 在以“让玩家尝试新玩法”为宗旨的首届inG游戏艺术节上,坚持顶级性能、顶级电竞的iQOO与我们不谋而合,共同为玩家打造了“iQOO未来游戏现场”,让球迷们可以

    06-21

  • 神州租车申请在香港联交所上市, 2012年放弃赴美上市

    神州租车申请在香港联交所上市, 2012年放弃赴美上市

    5月22日晚间消息,据香港联交所公告,中国最大的汽车租赁公司神州租车已提交上市申请在香港上市。   数据显示,神州租车全年营收8亿元,逐年增长至27亿元,年复合增长率高达81.6%。 一季度净利润1.63亿元,全年净利润1.43亿元。   截至2019年3月31日,神州租车车队总规模

    06-17