首页 > 科技未来 > 内容

AIGC:热潮中的前沿在哪里?丨GAIR2024

发布于:2024-06-18 编辑:匿名 来源:网络

从画画到写诗,从文案到制表,从PPT到写代码,十几个月前,如果有人说所有这些工作都可以由AI完成,很少有人会相信。

然而,技术发展的速度总是爆炸性的。

年末还远未结束,生成式AI的风潮席卷了整个科技圈,让人着迷、趋之若鹜。

由GAIR研究院、雷锋网、世界科技出版社、科特勒咨询集团共同主办的第七届GAIR全球人工智能与机器人大会上,AIGC领域大咖齐聚新加坡乌节大酒店,向世界致敬分享生成AI领域的第一手资讯和最新知识。

此次参加GAIR AIGC及生成内容分论坛的演讲嘉宾包括:南洋理工大学计算机科学与工程学院助理教授、潘新钢joinrealm.ai创始人、蔡丛兴新加坡Help&Grow社区发起人、王统荔枝集团CTO、丁宁南洋科学家,理工大学高级研究员;创始人、Deepir Inc.、吴鹏程、腾讯海外游戏发行算法中心总监郎君。

在当前炙手可热的AI赛道上,郎君如何保持清醒的头脑,在技术、产品和商业模式上进行研究和创新?与会嘉宾有何见解使他们能够驾驭生成式人工智能的浪潮? 南洋理工大学潘新钢:我们没有使用扩散模型来拖动视觉内容的关键点。

说到AIGC,在目前的赛道上,大家首先会想到海外评价很高的MidJourney,以及其背后的技术支撑——Diffusion模型。

然而,曾师从香港中文系唐晓鸥教授的南洋理工大学计算机科学与工程学院助理教授潘新钢,在其最新的《视觉内容关键点拖拽》中果断放弃了扩散模型编辑”,而是使用一种较旧的技术——生成对抗网络(GAN)。

很多人看到了AI生成图像的强大能力,认为AIGC时代已经到来;但潘新钢发现,“生成图像”往往并不是用户创作过程的最后一步。

后续对图片——尤其是AI生成的图片元素的调整往往充满不确定性。

为了满足用户的需求,图片中的每个元素都必须由用户在后期进行微调。

例如,人工智能生成了一只非常逼真的狮子。

如果用户想要转动狮子的头部、移动狮子的位置,甚至改变狮子的表情,以目前的产品形态很难完成。

这些操作听起来很简单,但都是对物体空间属性的精细控制,仍然面临着巨大的技术挑战。

过去有一种根据文字引导编辑图片的方法——比如“将狮子的鼻子向右移动30像素”,效仿文森特的图片。

但这种方案也存在问题:一方面,文本模型必须对物体的空间属性有足够强的理解,以满足用户各种编辑需求和方式,让交互更加直观;另一方面,对于语言模型来说,据说很难准确理解图像中的长度和大小,这也给可视化内容编辑带来了很大的麻烦。

在交互层面,对于用户来说,最直观、易用的无疑是拖放交互;而从技术实现层面来说,用户只需要指定一个红色抓取点和一个蓝色目标点,AI就会将红点对应的图像语义部分移动到蓝点的位置,可以达到编辑图像空间属性的效果。

过去,也有人开发过类似的功能,但通常需要对要编辑的图像进行网格化,并对物体的高度进行一定的假设——图像的编辑无非是对原始图像进行2D扭曲。

无法生成新内容。

它必须是精确的并且已经生成内容。

潘新钢在做技术研判时并没有采用最流行的扩散模型,而是选择了生成对抗网络的技术。

首先,GAN描述的图像空间非常连续,比扩散模型连续得多;其次,GAN紧凑的潜在空间非常适合编辑属性。

随着潘新钢团队研究的进一步发展,他们在原来的基础上支持了多点编辑,可以改变图像中物品的姿势,重新设计汽车的外观,或者改变汽车的视角来制作小猫视而不见地改变肖像的发型或表情、姿势或服装长度,让用户更方便地编辑图像,甚至通过这种方式完成视频内容的生成。

该作品现已在 GitHub 上开源,并获得 0 颗星。

未来,将GAN与扩散模型相结合是潘新钢对正在完成的工作的愿景——它既具有扩散模型的生成能力,又具有GAN在图像编辑方面的优势。

同时,也有可能将这些功能应用到视频和3D和4D内容中,将使未来的AIGC更加智能、更易于使用。

joinrealm.ai 蔡丛兴:基于AIGC构建社交网络。

来自美国加州南湾硅谷山景城的joinrealm.ai的蔡丛兴有一个梦想,就是建立一个AIGC社交网络。

蔡丛兴于 2006 年左右加入 Snapchat,负责公司产品开发。

蔡丛兴经历了行业的超高速发展时期。

在TikTok毫无争议地成为海外现象级产品后,蔡丛兴却有了另外的想法:“我们觉得在制作式内容的赛道上,大家已经在往某个方向发展了;而未来的行业肯定会有一个”于是,蔡丛兴和他的朋友创立了joinrealm.ai。

蔡丛兴认为AIGC是一个特别广泛和抽象的概念,而joinrealm.ai的方向是。

主要处于“直接提供”之间的中间地带。

API”与“完成人机交互创新”——内容创作商业模式的探索。

《内容创作模式为什么重要?根据我们过去十年的观察,一个很大的变化实际上是由于智能相机的出现。

智能相机的普及,很大程度上不仅仅是给了每个人一部手机,而是为世界提供了数十亿的移动基础设施。

”从“文字”到“故事”,这是加入领域的核心关键.ai的创业——通过AI,用户能够将脑海中的内容呈现为图像,就像一台“会思考的相机”。

为了达到这个效果,蔡丛兴在 joinrealm.ai 的探索过程中发现,还有很多问题需要解决:首先,Prompt 和自然语言的区别仍然存在——Prompt 仍然是一种很难的编程语言。

让公众直观地了解。

用户仍然要经历很多“尝试-失败-尝试”的步骤来生成他们想要的内容;其次,基础模型仍然不能完全满足当今AIGC用户的需求。

以Stable Diffusion为例,新用户愿意分享生成内容的比例如今可能还不到20%;缺乏可供用户微调的概念也是AIGC面临的第一大问题。

用户很难用一套定义好的概念来控制AI的产生,从而难以控制自己的“讲故事”;最后是图像生成结果和成本之间的效率平衡,如何在较低的价格范围内生成更高质量的内容,这也是AIGC正在做的事情。

下一个问题很难被忽视。

为了应对这些挑战,蔡丛兴和他的团队会见了近百位有影响力的AI创作者,发现他们的制作方法大多是独特的,很少雷同,并且使用大量工具不断调试和调整。

最终,经过研判,joinrealm.ai决定在三个关键点完成升级:一是工具链,优化用户交互界面,让用户体验更好;其次,允许用户自行微调构建。

例如,利用“我”的描述,产品可以根据用户自身的形象,更准确地生成他想要的形象。

三是搭建自制社区,让用户在社区中得到更多的指导和启发。

圆桌讨论:AIGC“走出去”新加坡Help&Grow社区 发起人 王童担任主持人,joinrealm.ai 创始人蔡丛兴、荔枝集团 CTO 丁宁、南洋理工大学高级研究员 科学家 & Deepir Inc. 创始人 吴鹏程、腾讯海外游戏出版算法中心主任郎军讨论了当前AIGC和生成内容的热点话题。

AIGC的商业化模式是在To B领域更容易落地,还是在To C领域更容易落地?所有客人都根据自己的经历想象了未来的目的地。

郎俊认为,To B 并不容易做,因为它需要根据很多不同的实际案例抽象、提炼出一个解决方案。

在To C方面,可以帮助很多游戏玩家在操作时快速融入游戏。

游戏。

在内部做算法的时候,郎君和团队会不断判断什么样的模型能够更好地深化AIGC实现场景。

吴鹏程表示,To B和To C都有机会,但伟大的公司一定是To C。

他结合了妙芽相机、苹果VR眼镜、数字人Live带货等今年在ToC层面取得成绩的公司,强调AIGC ToC将催生许多有趣的应用。

丁宁认为,AIGC的商业化仍处于早期阶段。

虽然有一些企业已经率先取得了成绩,但大多数仍处于路上。

他特别强调,科技创业者不能只沉浸在科技的兴奋之中,更应该考虑用户的需求和痛点。

对于To B和To C的落地,他表示,To B的市场很大,需要能力和资源,而To C的竞争很大,需要敏锐的市场意识和社区运营能力。

两人未来都有着巨大的潜力。

广阔。

对于AIGC的海外扩张和全球化,多位嘉宾分享了他们的总结经验。

郎君观察到,国内团队拥有非常密集的人才优势、高效的知识共享渠道以及对互联网行业的浓厚兴趣。

事实上,海外配置的资源并不多。

他强调,AIGC目前还没有特别成熟的商业模式,所以谁有能力更好地整合资源,谁就更有可能“跑光”。

丁宁认为,AIGC出海,首先要走出去,低调一点。

它不一定是高端产品。

他意识到,两三年内很难在市场上取得成功。

他补充说,尊重海外市场非常重要。

文化、语言、法律法规差异很大,需要对当地市场有清晰的了解。

吴鹏程认为AIGC走出去的机会很大。

一方面可以在国外使用中国技术;另一方面,国外也有本土需求,两者可以深度融合,会产生巨大的价值。

同时也需要考虑到出国只是第一步,还需要考虑如何更好地去海外旅行。

结束语 8月15日上午,GAIR大会AIGC与生成内容分论坛圆满结束。

会场气氛十分活跃,嘉宾们纷纷慷慨解囊,解答观众提问,分享见解。

如今,生成式人工智能仍然是一个年轻的领域,充满了非共识和未知的挑战。

在AIGC的赛道上,从来不缺少有勇气、有意识、敢做事的创新者。

在这片未知的大陆上,无论多么艰难,他们都必须找到一种方法来引领这场硅基世界的内容革命。

AIGC:热潮中的前沿在哪里?丨GAIR2024

未来,雷锋网(公众号:雷锋网)还将继续输出AIGC相关的其他内容,务实地探索生成式AI赋能现实世界、影响产业格局的可能性。

- 地球方式。

雷锋网原创文章,未经授权禁止转载。

详情请参见转载说明。

AIGC:热潮中的前沿在哪里?丨GAIR2024

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 无代码企业数字智能协作平台“Treelab”获数千万美元融资,红杉中国等领投

    无代码企业数字智能协作平台“Treelab”获数千万美元融资,红杉中国等领投

    国内无代码企业数字智能协作平台“Treelab”获数千万美元融资在A轮融资中,红杉中国与某战略投资者共同投资。 老股东GGV纪源资本、五源资本、明石资本均参与投资并支持。 穆棉担任专属财务顾问。 本轮融资后,Treelab将加大在产品研发、服务升级、市场拓展和人才方面的投入,

    06-18

  • 为B端客户提供移动音视频解决方案,美摄科技获小米投资

    为B端客户提供移动音视频解决方案,美摄科技获小米投资

    投资界消息,音视频技术研发及解决方案提供商美摄科技获得新一轮融资。 本轮融资的投资方为小米。 企查查数据显示,北京美摄网络科技有限公司于4月10日进行两次工商变更,小米投资主体天津金米投资合伙企业(有限合伙)成为新股东,持股1.67%;注册资本也增加至人民币10,000元

    06-18

  • 翌擎科技完成数千万元B1轮融资,耀明资本独家投资

    翌擎科技完成数千万元B1轮融资,耀明资本独家投资

    上海翌擎智能科技有限公司(简称“翌擎科技”)宣布完成数千万元B1轮融资B1轮融资。 本轮融资由兴富资本独家投资,木棉资本担任独家投资方。 翌擎科技CEO陆维琦表示,本轮募集的资金将用于打造汽车服务商SaaS平台。

    06-17

  • 商用清洁机器人的想象力有多大?

    商用清洁机器人的想象力有多大?

    进入21世纪第三个十年,我国产业结构进入快速升级阶段,落后产业逐步被淘汰,高端制造业蓬勃发展。 随之而来的是生产关系的调整:低附加值、简单的体力劳动,如运输、检验、清洁等被机器取代。 其中,清洁是生产、生活中的硬性要求。 无论是高档写字楼还是工厂园区,都需要日

    06-17

  • 旷视科技走向IPO:清华三名姚班学者估值300亿

    旷视科技走向IPO:清华三名姚班学者估值300亿

    科创板将迎来又一个AI独角兽。 昨晚(1月12日),北京证监局备案公告显示,旷视科技正在接受中信证券上市辅导,拟通过公开发行中国存托凭证(CDR)的方式在科创板上市。 随后,旷视科技也向投资界证实了这一消息。 这是由三位清华大学高材生联合打造的AI独角兽。 2006年,在清

    06-18

  • 山东工友即将赴德国上市,计划融资400万欧元

    山东工友即将赴德国上市,计划融资400万欧元

    山东工友集团股份有限公司(以下简称“山东工友”)在法兰克福证券交易所上市已进入倒计时。 该公司是第一家在德国上市的大陆公司。 得益于宽松的融资环境,越来越多的中国企业选择在欧洲上市。     春节前后上市    负责山东工友海外上市融资的陈经理表示:“山东工

    06-18

  • 【全球财经24小时】2024年4月12日投融资事件汇总及详情

    【全球财经24小时】2024年4月12日投融资事件汇总及详情

    欢迎订阅《全球财经24小时》系列文章,动动你的小手指,帮助我们更好更快地获取资讯给你~ 点击此处输入表格摘要。 今日全球市场共发生22起投资披露事件,其中境内11起,境外11起。 其中,国内先进制造业1例,医疗健康行业4例,汽车交通行业1例,企业服务业2例,人工智能行业1

    06-18

  • 蓝彩金服获数亿元C轮融资,加大人工智能、大数据研发

    蓝彩金服获数亿元C轮融资,加大人工智能、大数据研发

    据投资界5月31日消息,智能财富管理服务商蓝彩金服今日宣布,收购中建投(北京)投资基金管理有限公司股权,获得数亿元C轮融资。 此前,蓝彩金服已获得君联资本等公司的多轮投资,包括A轮、A+轮、B轮。   蓝彩金服表示,本轮融资将主要用于三个方面:  一是继续加大人工

    06-17

  • Kindle严重断货,亚马逊回应“下架”猜测

    Kindle严重断货,亚马逊回应“下架”猜测

    被调侃“一半方便面,一半闲鱼”的Kindle是亚马逊旗下的一款电子书阅读器。 自推出以来,它一直是该领域的代名词。 无论是给心灵充电,还是缓解“买书如潮,读书如纺纱”的症状,Kindle都是一剂良药。 近日,有网友指出Kindle大面积缺货,Kindle官方淘宝店关闭,Kindle京东自

    06-21

  • 裁员1.4万人,思科转型背后的阵痛

    裁员1.4万人,思科转型背后的阵痛

    硬件和算法在人工智能领域的作用可以说是各半,但在芯片层面,业界几乎一致——GPU在人工智能中的作用智能深度学习算法的重要性远高于CPU,这也是为什么NVIDIA在人工智能领域的受欢迎程度甚至超过了Intel。 毫无疑问,GPU 是训练深度学习神经网络最流行的方法。 该解决方案受

    06-18

  • 投资世界24小时-华熙生物开始销售玻尿酸饮用水;前小米高层副总裁周受资将出任字节跳动CFO;滴滴传拟赴美上市

    投资世界24小时-华熙生物开始销售玻尿酸饮用水;前小米高层副总裁周受资将出任字节跳动CFO;滴滴传拟赴美上市

    首个玻尿酸饮用水品牌“水鸡泉” 说起华熙生物,就不得不提其背后的女老板——赵燕。 2000年,一次偶然的机会,赵燕开始了玻尿酸生意。 多年后,他接管了中国玻尿酸行业的半壁江山,成为“玻尿酸王牌”。 2019年11月,华熙生物成功登陆科创板,上市后股价飙升。 根据《福布斯

    06-18

  • 收集!一汽、三一、方太等10家主要制造企业知识管理案例

    收集!一汽、三一、方太等10家主要制造企业知识管理案例

    党的二十大提出推动制造业高端化、智能化、绿色化发展,推动制造业深度融合数字经济和实体经济。 近日,全国常委会审议通过《制造业数字化转型行动方案》。 制造企业利用数字化转型升级赋能研发设计、生产加工、运营管理、销售服务等全产业链已成为必然趋势。 知识管理作为数

    06-18