首页 > 科技未来 > 内容

AIGC:热潮中的前沿在哪里?丨GAIR2023

发布于:2024-06-18 编辑:匿名 来源:网络

从画画到写诗,从文案到制表,从PPT到写代码,十几个月前,如果有人说所有这些工作都可以由AI完成,很少有人会相信。

然而,技术发展的速度总是爆炸性的。

年末还远未结束,生成式AI的风潮席卷了整个科技圈,让人着迷、趋之若鹜。

由GAIR研究院、雷锋网、世界科技出版社、科特勒咨询集团共同主办的第七届GAIR全球人工智能与机器人大会上,AIGC领域大咖齐聚新加坡乌节大酒店,向世界致敬分享生成AI领域的第一手资讯和最新知识。

此次参加GAIR AIGC及生成内容分论坛的演讲嘉宾包括:南洋理工大学计算机科学与工程学院助理教授、潘新钢joinrealm.ai创始人、蔡丛兴新加坡Help&Grow社区发起人、王统荔枝集团CTO、丁宁南洋科学家,理工大学高级研究员;创始人、Deepir Inc.、吴鹏程、腾讯海外游戏发行算法中心总监郎君。

在当前炙手可热的AI赛道上,郎君如何保持清醒的头脑,在技术、产品和商业模式上进行研究和创新?与会嘉宾有何见解使他们能够驾驭生成式人工智能的浪潮? 南洋理工大学潘新钢:我们没有使用扩散模型来拖动视觉内容的关键点。

说到AIGC,在目前的赛道上,大家首先会想到海外评价很高的MidJourney,以及其背后的技术支撑——Diffusion模型。

然而,曾师从香港中文系唐晓鸥教授的南洋理工大学计算机科学与工程学院助理教授潘新钢,在其最新的《视觉内容关键点拖拽》中果断放弃了扩散模型编辑”,而是使用一种较旧的技术——生成对抗网络(GAN)。

很多人看到了AI生成图像的强大能力,认为AIGC时代已经到来;但潘新钢发现,“生成图像”往往并不是用户创作过程的最后一步。

后续对图片——尤其是AI生成的图片元素的调整往往充满不确定性。

为了满足用户的需求,图片中的每个元素都必须由用户在后期进行微调。

例如,人工智能生成了一只非常逼真的狮子。

如果用户想要转动狮子的头部、移动狮子的位置,甚至改变狮子的表情,以目前的产品形态很难完成。

这些操作听起来很简单,但都是对物体空间属性的精细控制,仍然面临着巨大的技术挑战。

过去有一种根据文字引导编辑图片的方法——比如“将狮子的鼻子向右移动30像素”,效仿文森特的图片。

但这种方案也存在问题:一方面,文本模型必须对物体的空间属性有足够强的理解,以满足用户各种编辑需求和方式,让交互更加直观;另一方面,对于语言模型来说,据说很难准确理解图像中的长度和大小,这也给可视化内容编辑带来了很大的麻烦。

在交互层面,对于用户来说,最直观、易用的无疑是拖放交互;而从技术实现层面来说,用户只需要指定一个红色抓取点和一个蓝色目标点,AI就会将红点对应的图像语义部分移动到蓝点的位置,可以达到编辑图像空间属性的效果。

过去,也有人开发过类似的功能,但通常需要对要编辑的图像进行网格化,并对物体的高度进行一定的假设——图像的编辑无非是对原始图像进行2D扭曲。

无法生成新内容。

它必须是精确的并且已经生成内容。

潘新钢在做技术研判时并没有采用最流行的扩散模型,而是选择了生成对抗网络的技术。

首先,GAN描述的图像空间非常连续,比扩散模型连续得多;其次,GAN紧凑的潜在空间非常适合编辑属性。

随着潘新钢团队研究的进一步发展,他们在原来的基础上支持了多点编辑,可以改变图像中物品的姿势,重新设计汽车的外观,或者改变汽车的视角来制作小猫视而不见地改变肖像的发型或表情、姿势或服装长度,让用户更方便地编辑图像,甚至通过这种方式完成视频内容的生成。

该作品现已在 GitHub 上开源,并获得 0 颗星。

未来,将GAN与扩散模型相结合是潘新钢对正在完成的工作的愿景——它既具有扩散模型的生成能力,又具有GAN在图像编辑方面的优势。

同时,也有可能将这些功能应用到视频和3D和4D内容中,将使未来的AIGC更加智能、更易于使用。

joinrealm.ai 蔡丛兴:基于AIGC构建社交网络。

来自美国加州南湾硅谷山景城的joinrealm.ai的蔡丛兴有一个梦想,就是建立一个AIGC社交网络。

蔡丛兴于 2006 年左右加入 Snapchat,负责公司产品开发。

蔡丛兴经历了行业的超高速发展时期。

在TikTok毫无争议地成为海外现象级产品后,蔡丛兴却有了另外的想法:“我们觉得在制作式内容的赛道上,大家已经在往某个方向发展了;而未来的行业肯定会有一个”于是,蔡丛兴和他的朋友创立了joinrealm.ai。

蔡丛兴认为AIGC是一个特别广泛和抽象的概念,而joinrealm.ai的方向是。

主要处于“直接提供”之间的中间地带。

API”与“完成人机交互创新”——内容创作商业模式的探索。

《内容创作模式为什么重要?根据我们过去十年的观察,一个很大的变化实际上是由于智能相机的出现。

智能相机的普及,很大程度上不仅仅是给了每个人一部手机,而是为世界提供了数十亿的移动基础设施。

”从“文字”到“故事”,这是加入领域的核心关键.ai的创业——通过AI,用户能够将脑海中的内容呈现为图像,就像一台“会思考的相机”。

为了达到这个效果,蔡丛兴在 joinrealm.ai 的探索过程中发现,还有很多问题需要解决:首先,Prompt 和自然语言的区别仍然存在——Prompt 仍然是一种很难的编程语言。

让公众直观地了解。

用户仍然要经历很多“尝试-失败-尝试”的步骤来生成他们想要的内容;其次,基础模型仍然不能完全满足当今AIGC用户的需求。

以Stable Diffusion为例,新用户愿意分享生成内容的比例如今可能还不到20%;缺乏可供用户微调的概念也是AIGC面临的第一大问题。

用户很难用一套定义好的概念来控制AI的产生,从而难以控制自己的“讲故事”;最后是图像生成结果和成本之间的效率平衡,如何在较低的价格范围内生成更高质量的内容,这也是AIGC正在做的事情。

下一个问题很难被忽视。

为了应对这些挑战,蔡丛兴和他的团队会见了近百位有影响力的AI创作者,发现他们的制作方法大多是独特的,很少雷同,并且使用大量工具不断调试和调整。

最终,经过研判,joinrealm.ai决定在三个关键点完成升级:一是工具链,优化用户交互界面,让用户体验更好;其次,允许用户自行微调构建。

例如,利用“我”的描述,产品可以根据用户自身的形象,更准确地生成他想要的形象。

三是搭建自制社区,让用户在社区中得到更多的指导和启发。

圆桌讨论:AIGC“走出去”新加坡Help&Grow社区 发起人 王童担任主持人,joinrealm.ai 创始人蔡丛兴、荔枝集团 CTO 丁宁、南洋理工大学高级研究员 科学家 & Deepir Inc. 创始人 吴鹏程、腾讯海外游戏出版算法中心主任郎军讨论了当前AIGC和生成内容的热点话题。

AIGC的商业化模式是在To B领域更容易落地,还是在To C领域更容易落地?所有客人都根据自己的经历想象了未来的目的地。

郎俊认为,To B 并不容易做,因为它需要根据很多不同的实际案例抽象、提炼出一个解决方案。

在To C方面,可以帮助很多游戏玩家在操作时快速融入游戏。

AIGC:热潮中的前沿在哪里?丨GAIR2023

游戏。

在内部做算法的时候,郎君和团队会不断判断什么样的模型能够更好地深化AIGC实现场景。

吴鹏程表示,To B和To C都有机会,但伟大的公司一定是To C。

他结合了妙芽相机、苹果VR眼镜、数字人Live带货等今年在ToC层面取得成绩的公司,强调AIGC ToC将催生许多有趣的应用。

丁宁认为,AIGC的商业化仍处于早期阶段。

虽然有一些企业已经率先取得了成绩,但大多数仍处于路上。

他特别强调,科技创业者不能只沉浸在科技的兴奋之中,更应该考虑用户的需求和痛点。

对于To B和To C的落地,他表示,To B的市场很大,需要能力和资源,而To C的竞争很大,需要敏锐的市场意识和社区运营能力。

两人未来都有着巨大的潜力。

广阔。

对于AIGC的海外扩张和全球化,多位嘉宾分享了他们的总结经验。

郎君观察到,国内团队拥有非常密集的人才优势、高效的知识共享渠道以及对互联网行业的浓厚兴趣。

事实上,海外配置的资源并不多。

他强调,AIGC目前还没有特别成熟的商业模式,所以谁有能力更好地整合资源,谁就更有可能“跑光”。

丁宁认为,AIGC出海,首先要走出去,低调一点。

它不一定是高端产品。

他意识到,两三年内很难在市场上取得成功。

他补充说,尊重海外市场非常重要。

文化、语言、法律法规差异很大,需要对当地市场有清晰的了解。

吴鹏程认为AIGC走出去的机会很大。

一方面可以在国外使用中国技术;另一方面,国外也有本土需求,两者可以深度融合,会产生巨大的价值。

同时也需要考虑到出国只是第一步,还需要考虑如何更好地去海外旅行。

结束语 8月15日上午,GAIR大会AIGC与生成内容分论坛圆满结束。

会场气氛十分活跃,嘉宾们纷纷慷慨解囊,解答观众提问,分享见解。

如今,生成式人工智能仍然是一个年轻的领域,充满了非共识和未知的挑战。

在AIGC的赛道上,从来不缺少有勇气、有意识、敢做事的创新者。

在这片未知的大陆上,无论多么艰难,他们都必须找到一种方法来引领这场硅基世界的内容革命。

未来,雷锋网(公众号:雷锋网)还将继续输出AIGC相关的其他内容,务实地探索生成式AI赋能现实世界、影响产业格局的可能性。

- 地球方式。

雷锋网原创文章,未经授权禁止转载。

详情请参见转载说明。

AIGC:热潮中的前沿在哪里?丨GAIR2023

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 新闻 -沃尔玛完成对印度Flipkart 160亿美元投资

    新闻 -沃尔玛完成对印度Flipkart 160亿美元投资

    据投资界消息,近日,沃尔玛完成对印度Flipkart 160亿美元投资。 据外媒报道,总裁兼沃尔玛国际首席执行官Judith姚(Judith Yao)表示:“沃尔玛和Flipkart之间的合作将超越我们各自所能完成的目标,创造一个由沃尔玛驱动的强大的本地业务。 ”   “ 通过为客户提供高质量、

    06-18

  • 逃离瑞幸! COO被停职后,董事辞职,CTO也离职,网友表示:灾难来袭,都飞了

    逃离瑞幸! COO被停职后,董事辞职,CTO也离职,网友表示:灾难来袭,都飞了

    瑞幸造假,风波不断。 4月底,中国证监会介入调查后,瑞幸向美国SEC提交文件称,由于疫情影响以及公司内部调查,公司无法在4月30日之前提交年报尚未得出结论——这些听证会并不都是好消息。 5月1日,坏消息再次传来:瑞幸CTO辞职。 何刚:瑞幸CTO,上任不到8个月。 这位刚刚离

    06-17

  • 棕榈大道获北极光数百万美元A轮投资,年轻人出国留学成新趋势!

    棕榈大道获北极光数百万美元A轮投资,年轻人出国留学成新趋势!

    据投资界7月25日消息,互联网留学公司棕榈大道今日宣布获得北极光创投数百万美元A轮融资。   此前,棕榈大道获得九合创投等投资的数千万Pre-A轮融资。   棕榈大道成立于2001年,是一家致力于利用P2P+互联网模式为用户提供海外导师一对一个性化咨询的留学服务机构。 其创始

    06-18

  • 飞吧商旅获近千万元Pre-A轮融资,商子诺携手武汉互娱投资

    飞吧商旅获近千万元Pre-A轮融资,商子诺携手武汉互娱投资

    据投资界8月4日消息,飞吧商旅近日宣布获得近千万元Pre-A轮融资。 投资方为商子诺资本和武汉互娱资本。    据悉,本轮融资完成后,飞吧商旅将在三个方面发力:1、继续了解浙江传统机票代理机构,拓展全国分散市场; 2、增加产业链产品线布局,优化服务流程和内容;第三,在

    06-17

  • 未来机器人完成1亿元B1轮融资,联想创投

    未来机器人完成1亿元B1轮融资,联想创投

    投资社区(微信ID:pedialy)消息,未来机器人完成1亿元B1轮融资,本轮融资由联想创投领投由联想创投、飞图创投跟投,老股东钟鼎资本继续跟投。 募集资金将用于工业无人车视觉控制与感知技术的持续研发、急需场景的突破以及规模化复制。 未来机器人(深圳)有限公司成立于200

    06-18

  • 广州带货网红主播可获最高50万元购房奖励; SpaceX可以使用回收火箭和龙飞船来搭载宇航员;谷歌浏览器将不再使用“黑名单”一词雷锋晨报

    广州带货网红主播可获最高50万元购房奖励; SpaceX可以使用回收火箭和龙飞船来搭载宇航员;谷歌浏览器将不再使用“黑名单”一词雷锋晨报

    广州:带货网红主播可获最高50万元购房奖励。 近日,广州市花都区出台《广州市花都区扶持直播电商发展办法 ()》,将大力实施直播电商带动网上零售“十万”倍增计划。 此外,花都还将启动千人(主播)千店成长计划。 据介绍,花都“四顶”企业年销售额过万、万、万元的优秀网

    06-18

  • -ST工信宣布退市,一年亏损20亿,近5万股东震惊

    -ST工信宣布退市,一年亏损20亿,近5万股东震惊

    创造头条新闻 3月5日收盘后,上市公司*ST工信(哈尔滨工业大学高新区)科技实业发展股份有限公司)发布公告称,因业绩连续大幅亏损,触发退市条件,公司被上海证券交易所终止上市。 公告显示,公司股票将于2019年3月15日开始进入退市整理期交易,退市整理期持续十个交易日。

    06-18

  • 瑞健生物完成天使轮融资,紫金港资本独家投资

    瑞健生物完成天使轮融资,紫金港资本独家投资

    投资界消息(ID:pedaily),近期重点关注“First-in-class”和“Best-in-class”的研发“神经和精神疾病。 企业瑞健生物完成天使轮融资。 紫金港资本独家完成本次融资,新增资金将用于管线研发和公司运营。 01、神经精神疾病领域新机制、新药研发难度大,临床需求巨大未满足

    06-17

  • 一起教育科技2023年第二季度财报:SaaS业务稳步推进,营收环比增长6.5倍

    一起教育科技2023年第二季度财报:SaaS业务稳步推进,营收环比增长6.5倍

    8月29日,一起教育科技(YQ.US)公布了今年第二季度财报:第二季度合力教育科技营收达到万元,环比增长6.5倍。 Non-GAAP下调整后净亏损为1万元,环比大幅收窄;公司毛利率提升至48.3%左右,恢复到历史正常水平。 截至6月30日,公司账面现金充裕,包括短期投资、定期存款在内的

    06-17

  • Playground Global完成第三期融资

    Playground Global完成第三期融资

    投资社区(ID:pedaily)1月5日消息,早期风投机构Playground Global完成第三期融资,募资金额4.1亿美元。 迄今为止,Playground Global管理的资产已超过12亿美元。 华港AI Fund of Funds参与认购Playground Global第三期基金。 Playground Global专注于人工智能、下一代计算

    06-18

  • 当中国药企进军非洲

    当中国药企进军非洲

    近日,疫苗产业链人士组织组织了几位生物制药的业内人士人士齐聚一堂,共同探讨当前的行业趋势。 大家感兴趣的话题有一个:看好非洲疫苗市场。 逻辑是这样的:整个非洲市场有10亿人口,相当于整个国内市场。 对于这些国家和地区的卫生部和政府官员来说,提高预期寿命最快最快

    06-18

  • 科大讯飞联合成立新公司,探索脑机协同在医疗、教育领域的应用和产业落地

    科大讯飞联合成立新公司,探索脑机协同在医疗、教育领域的应用和产业落地

    据雷锋网报道,科大讯飞2月25日晚间宣布,其全资子公司安徽讯飞云创公司与胡郁、李远清、广州华南理工大学资产管理有限公司签署合作协议,共同投资设立广州华南脑控智能科技有限公司科大讯飞发布公告 科大讯飞在公告中表示,脑机接口和脑机交互技术具有广阔的应用前景,目前

    06-17