SK集团旗下3家公司将筹集1万亿韩元投资半导体、Yuanverse等,
06-08
**作者|连然**主编|郑玄3月23-24日,重点关注全球开发者精英,由上海人工智能产业协会(SAIA)主办的全球开发者先锋大会(GDC)在上海举行。
本次大会是我国大型模型企业展示最新科研成果和技术创新的重要舞台。
朴方正作为大会战略合作伙伴,联合Waveform Intelligence、Dify.AI、百川智能、Zilliz、Dark Side of the Moon、Kyligence、Xmind AI、Kanjian Concept共同打造“大型模型展示及研讨会区” 、米知科技等国内多家优秀人工智能企业打造了人工智能产品互动展区,举办Workshop、创业者闭门交流会等行业性研讨会。
分享内容。
极客园|方正园大模型展示及研讨会区 国内大模型领域前沿的创业者、技术专家分享行业知识,探讨大模型基础、长文、数据、应用等行业要点执行。
问题。
我们对所有嘉宾分享的内容进行了梳理,提取了关键信息。
无论他们是在大模特领域工作、创业,还是单纯关心行业发展,他们的分享对于洞察行业都有很大帮助。
周望春树,Waveform Intelligence联合创始人兼CTO,《大模型如何做到超长文本写作》Waveform Intelligence是最早将大规模语言模型应用于互联网场景的科技公司之一。
波形智能通过自研模型,打造了覆盖全产业链的AI互动内容平台。
在GDC期间,波形智能展示了其大型AI创作模型“织者”和首款产品“瓦加写作”,这是一款可以生成数十万甚至数百万字小说的工具。
研讨会上,周望春树分享了大模型在长文本写作中的创新技术和应用。
首先,他介绍了RecurrentGPT技术,这是一种可以处理并生成无限长文本的方法。
它使模型能够通过架构更改和额外的训练来处理更长的输入数据。
该技术的核心在于高效/稀疏注意力机制、循环神经网络(RNN)和状态空间模型,它们共同提高了模型处理长文本的能力。
周望春树进一步阐述了记忆增强智能体的概念,包括短期记忆和长期记忆的应用。
短期记忆使模型能够处理更复杂的上下文信息,而长期记忆使模型能够在较长时间内保留和回忆信息,通常通过外部向量存储和快速检索系统。
反复提示是另一项关键技术,它不仅可以提高文本的连贯性,而且还可以通过计划、提纲、表演、写作、记忆更新和总结等步骤帮助对故事和小说进行计划。
Waveform Intelligence推出的Weaver大型模型是全球领先的创意工具。
通过Instruction BackTranslation、Constitutional DPO等技术,生成的内容更具人性化特征,增强写作的“人”味。
在个性化、垂直领域写作方面,Weaver模型展现了强大的适应性,可以根据特定的参考风格生成相似的叙述,涵盖了写作、延续、润色、风格转移和总结等创意写作的多个方面。
此外,Weaver模型在性能上超越了同型号的GPT-4,同时在性价比上也表现出色,比GPT-4便宜10倍,比GLM-4便宜5倍。
在训练方法上,Weaver模型采用了持续预训练、监督微调和偏好优化等策略。
特别是在偏好优化方面,采用Constitutional DPO方法,通过专家的原理标注和数据合成,提高训练数据的质量,从而提高模型的性能。
最后,周望春树介绍了Weaver模式的应用场景,包括面向开发者的标准化API、云端和本地私有化部署选项,以及Weaver-Ultra、娃娃写作1.0等产品。
这些服务以其自然的写作风格、个性化的训练、快速的生成、情感的细腻,为企业级客户提供定制化的解决方案,推动人工智能在创意写作领域的应用和发展。
Waveform Intelligence展位Vince He,Dify.AI产品负责人,《Dify Workflow:从 Prompt 工程到 Flow 工程》Dify.AI是全球领先的开源大规模语言模型应用开发平台,由原腾讯云CODING DevOps核心团队创建。
自去年 5 月推出以来,Dify.AI 取得了巨大成功,包括在 GitHub 上获得了超过 18K 颗星。
作为Dify.AI的产品经理,Vince He讨论了从传统即时工程到流程工程(Flow Engineering)的转变,并分享了Dify.AI在该领域的实践和成果。
Vince Ho 解释了流程工程的核心概念,这是一种通过将复杂的任务分解为更小、更易于管理的步骤来降低系统复杂性的方法。
这种方法通过增加人类监督和控制来减少对单提示词技术和模型推理能力的依赖,从而提高大型语言模型在处理复杂任务时的性能。
何文斯举了一个例子,在代码编程任务中,通过流程工程,基于GPT-4的成功率从19%提高到44%。
该方法通过减少对提示词技术和模型推理能力的依赖,提高了系统的可观测性、稳定性和容错性。
他强调,过程工程的关键优势在于其可观测性、稳定性和容错性。
在演讲中,Vince Ho 还讨论了为什么需要工艺工程。
他指出,太长的提示词会导致大型语言模型中指令跟随能力下降、注意力丧失和产生幻觉。
此外,他还提到了大型语言模型在推理能力上的局限性,尤其是在多步推理任务中,随着步数的增加,准确率会大幅下降。
根据 Berkeley Function Call Leaderboard 的数据,多步工具调用达到 4 次以上时,整体准确率会下降到 50% 以下。
Vince Ho还讨论了Yann LeCun教授的观点,即LLM并不是通向AGI的充分途径,因为它缺乏对物理世界的理解和层次推理能力。
他在演讲中谈到了Ng Enda教授最近提出的“AI Agent Workflow”。
这个概念应用了过程工程的概念。
代理工作流程将在今年大规模推动人工智能的进步,甚至可能超越下一代模型。
强烈建议所有AI领域的工作者关注这个领域。
Vince Ho进一步分析了流程工程的适用应用场景,并将其分为严肃场景和创造性场景。
严肃场景,如企业知识库、聊天机器人、数据分析等,更多依赖流程工程和传统技术,实施难度更大;而情感陪伴、营销写作、文章翻译等创意场景实施起来难度较小,流程工程可以大幅提高生产力。
在演讲的最后部分,Vince He介绍了Dify.AI正在开发的新产品——Dify Workflow。
他提到,这个产品将提供更多的人性监督和控制,以及更好的任务迭代过程。
Dify.AI展台 高宇辰,百川智能算法总监,《打造大模型时代的超级底座》百川智能是一家研发通用人工智能并提供相关服务的中国公司。
其核心业务是构建基础大模型及其颠覆性的上层应用。
是目前国内领先的大型企业。
模范科技公司之一。
高宇辰谈到了百川智能采取的技术策略和解决方案:百川智能借鉴传统计算机架构,将大型模型视为新时代的“CPU”,强调内存(上下文窗口长度)和硬盘(搜索增强技术)。
公司提出“大语言模型+搜索增强”技术路线,通过结合互联网实时信息和企业知识库,解决大模型实时数据不足、专业数据不足的问题。
百川智能还推出了百川智能知识库产品,该产品结合了向量搜索和稀疏索引以及消除模型错觉的能力,为用户提供高效、准确的信息服务。
高宇辰还分享了百川智能对大模型的理解:大模型的实现面临人才、算力、训练周期、效果稳定性、更新升级等诸多挑战。
尤其是在人才方面,训练领域的大型模型对算法人员的要求极高。
在计算能力方面,甲方通常有自己的需求,这增加了实现大型模型的成本和复杂性。
Agent不仅仅是一个工具,而是一个可以创建和使用工具的智能代理。
该公司的最终目标是创建一个能够创建和使用工具的Agent,这将是一项重大的技术突破。
最后,高宇辰还谈到了百川智能对于商业化的思考:在ToB领域,我们将不断探索大模型能力的边界,与金融、消费、娱乐等领域的领先企业一起探索大模型的行业落地。
我们也将持续探索大模型技术的前沿创新,打造C端的超级应用。
百川智能展台 Jerry,Zilliz 开发者生态和市场运营负责人,《年重新再来说说什么是向量数据库》Zilliz 是一家致力于开发 AI 应用非结构化数据平台的公司。
它是全球最受欢迎的开源矢量数据库 Milvus 的创建者。
广泛应用于图像分析、视频分析、语音分析、自然语言处理(NLP)、自动驾驶和AIoT等领域。
Milvus被全球超过100家公司使用,累计下载安装量超过20M。
2017年,Zilliz基于Milvus推出云原生服务Zilliz Cloud,已实现全球5大云13个节点的全覆盖。
是全球第一家在国内外提供多云服务的矢量数据库公司。
Jerry首先指出,矢量数据库的概念已经出现并发展了五六年,并在业界得到了广泛的实践和开源。
他提到,自从2005年向量检索算法取得重大进步以来,这一领域的需求和发展一直在增长。
在解释向量和向量检索的基本概念时,Jerry强调了向量在表示非结构化数据特征方面的重要性。
他提到,通过深度学习模型,可以将非结构化数据转换为向量,以便在多维空间中进行高效检索。
他还讨论了最近邻问题在向量检索中的核心作用以及如何通过不同的算法来解决它。
Jerry介绍,Milvus作为全球第一个开源矢量数据库,由Zilliz开发。
具有云原生分布特性,支持存储计算分离、高可用。
Milvus 2.0 版本集成了 OpenAI、Langchain、Huggingface 和 Pytorch 等多个 AI 生态系统,提供强大的功能和灵活性。
Jerry提到,Milvus在GitHub上拥有超过26颗星,下载量超过1000万,可见其在社区的受欢迎程度。
去年,Zilliz 还推出了基于 Milvus 的云服务 Zilliz Cloud,为 AIGC 用户提供开箱即用的向量数据库服务,丰富了生态系统,同时进一步降低了使用门槛和成本。
不过,Jerry也指出了矢量数据库面临的挑战,包括非结构化数据与矢量存储分离、缺乏嵌入能力、无法直接连接通用数据源等。
他预计向量数据库未来的发展可能会走向非结构化数据处理平台,这将涉及更多的数据处理任务,如ETL、嵌入、向量检索和数据分析等。
在讨论开源与商业化问题时,Jerry强调了开源对于科技公司从0到1的重要性,并分享了他对开源项目如何影响商业化的看法。
他提到,虽然开源可能会带来一些商业化挑战,但Zilliz将继续支持开源并提供商业版本,以满足不同用户的需求。
Zilliz Booth 唐飞虎,月之暗面开发者关系负责人,《从 LLM Riddle 到哄哄模拟器,Moonshot AI大模型应用实战案例分享》月之暗面(Moonshot AI)成立于2020年3月,致力于寻求将能量转化为智能的最优解决方案,并分享通过产品与用户。
2020年10月,创智推出全球首款支持20万汉字输入的智能助理产品Kimi。
2018年3月18日,月暗面宣布,旗下产品Kimi在长上下文窗口技术上再获突破,无损上下文长度从20万字增加到万字。
唐飞虎在 Moonshot AI 担任开发者关系职位。
他的主要任务是向开发者分发模型券并支持创意项目,例如独立游戏开发商 Case 在 Bilibili 上分享的大型模型益智游戏。
经验。
唐飞虎表示,随着多模态模型的进步,通过将流程或工作流程与稳定的扩散模型相结合,可以创建新的应用形式。
他还提到了游戏中使用大型模型作为模式,让玩家可以与NPC直接对话。
他强调了模型微调和提示工程在大型模型应用中的关键作用,并指出随着模型能力的增强,原来需要微调的任务现在可以通过提示工程来完成。
在分享中,唐飞虎谈到了探月AI推出的万字大模型的试用版。
这是一个具有里程碑意义的版本,因为它的大规模使得它在理解和生成文本方面更强。
他举例说明了用户如何使用该模型模仿《红楼梦》中林黛玉的言谈举止,展示了该模型在理解和模仿文学作品中人物独特语言风格方面的潜力。
具体来说,用户可以通过向模型提供林黛玉的一些背景信息和特定的文本样本来引导模型生成类似风格的文本。
这种模仿不仅仅是简单的文本复制,而是模型在了解林黛玉的性格、语言习惯和情感表达后生成的风格相似的新文本。
这些应用展示了大型模型在文学创作、人物模拟和内容生成方面的巨大潜力。
唐飞虎鼓励开发者尝试Moonshot AI的开放平台,这意味着开发者可以注册并使用这个大模型来实现自己的项目和想法。
开放平台为开发者提供了一个试验场,让开发者可以探索大型模型的可能性,无论是在文学创作、游戏设计、教育工具开发,还是任何其他可以想象到的应用场景。
这些信息表明,Moonshot AI不仅提供了强大的技术工具,还建立了一个支持创新和实验的生态系统,旨在促进开发者社区的成长和发展。
关于Moonshot AI意外收到大量流量,导致在线服务一度崩溃。
唐飞虎解释说,这是公司没有预料到的情况,但他们采取了多种方法,比如增加更多的计算机和更智能的调度策略,希望能在短期内缓解流量指数级增长的问题。
关于产品线,唐飞虎强调,Kimi的主要目标是针对消费市场(ToC),因为公司认为可以通过大模型的扩展(scaling)为用户和开发者赋能,而针对企业市场的挑战(ToB)在于它需要极高的定制成本,而随着模型能力的升级,这些定制工作往往会变得繁琐。
月之暗面展位 李东,Kyligence合伙人、副总裁,《大数据+大模型:高效开发企业数据产品和数据资产》Kyligence是领先的数据+AI企业服务软件提供商。
由Apache Kylin创始团队于2016年创立,专注于数据分析、指标平台和AI技术。
公司得到了全球及国内领先分析机构的认可和领先投资机构的支持。
李东的演讲围绕“指标+人工智能”的核心主题,阐述了大数据和大模型如何在实践中结合和落地。
他强调了企业数据产品在BI向AI转型中的重要性,包括决策增强、决策支持和决策自动化。
李东引用彼得·德鲁克的名言,强调了衡量和管理数据的重要性,并指出指标作为统一的数据语言,对于数据决策的知识积累至关重要。
AI时代,企业业务决策将更多依赖AI,涵盖决策增强、决策支持和决策自动化。
人工智能要成为数据驱动的关键,首先需要了解企业的??指标体系,这是数据和业务的共同语言。
Kyligence提供智能一站式指标平台产品Kyligence Zen,内置AI数字助理Kyligence Copilot。
通过使用大语言模型自动评估KPI、业务归因并指导行动,帮助用户通过自然语言对话替代传统的可视化报告,并提供数据汇总、自动归因分析等功能。
李东还提出了AI时代的新形态数据产品,包括自然语言对话、自动化商战报道、移动数据洞察、集成IM实现从洞察到决策的闭环,以及开放的接口和与第三方的低代码集成。
李东还展示了该产品在银行业的应用场景。
李东还讨论了AI数据分析需要解决的技术挑战,如数据和结论的正确性、对用户问题的理解、数据口径的统一、数据权限管理等。
Kyligence采取的技术路线是“指标+AI”,即通过指标平台对指标进行管理和计算,保证数据查询的准确性。
指标平台还保证数据安全,实现用户权限控制,避免数据篡改风险。
最后,李东分析了大型模型在数据分析场景中的性能评估结果,指出参数超过1亿的大型模型表现更好,并且国产大型模型在某些场景下优于GPT3.5。
他的演讲总结了Kyligence将大数据与大模型结合的见解和实践,展示了公司如何通过创新技术提高企业人工智能应用的可靠性,推动新形态数据产品的发展。
Kyligence展位夏希云,Xmind AI产品负责人&王安智 Xmind AI产品经理,《思·释·卜 - AI 创新应用三重奏》Xmind是最专业、最受欢迎的思维导图工具。
如今,近千万用户使用 Xmind 来理清思维、管理复杂信息。
,集思广益。
作为Xmind AI产品负责人,夏曦云分享了Xmind的发展历程,并重点介绍了她负责的AI思维导图产品。
夏希云演示了Xmind AI和Chatmind的特点和优势。
Xmind AI通过内置的Copilot功能,提高团队协作场景的创造力和生产力; Chatmind更关注个人用户,通过大模型和提示的协同,提供个人思维拓展的工具,帮助用户一句话生成和优化思维结构。
夏希云进一步强调了人工智能技术在思维导图中的应用。
通过AI的能力,用户可以高效整合PDF、链接、图片、视频等多种格式的信息,直接转换为思维导图摘要进行展示,从而提高输入效率。
同时,AI技术还可以帮助用户拓展思维边界,在输出内容时提供多样化的选择,满足不同场景的需求,大大降低用户使用思维导图的门槛。
夏曦云随后分享了AI原生产品中的具体设计实践,包括如何明确使用场景、提供明确的产品用途、构建足够的语境、结合图形界面和语言界面的优势。
她强调,向产品中的大型模型提供有用的信息可以更好地理解用户意图。
王安智分享了AI大藏经产品,帮助用户用文言文而非白话文阅读佛经,大大降低了用户的学习成本。
他提到,虽然佛经文本体量庞大、翻译难度大,但通过人工智能技术,他们可以很好地完成这项艰巨的任务,让更多人轻松获取、理解和学习佛经知识。
随后,王安智进一步介绍了佛经机器人的研发,它可以通过对话深入学习佛经相关知识,并在佛经中找到相应的相关内容。
并且AI大藏非常重视用户的反馈,通过专业人士的反馈来优化翻译质量。
最后,王安智还提到了最近发布的AI塔??罗新应用——Quin,它提供了一种自我探索和辅助决策的新方式。
奎因能够模仿人类塔罗大师的方式,提供个性化的解读和持续的对话,成为全天候塔罗牌伙伴。
Xmind AI展位胡秀涵,See Concept创始人,《AI 时代下的 UGC 内容社区,能有什么想象力?》“See Concept”的目标是“让每个人的故事被看到”。
其愿景是打造AI时代的UGC内容社区,鼓励和支持创意表达和故事分享。
。
胡秀涵在演讲中提出了AI时代UGC内容社区的愿景,即通过“See Concept”公司实现“让每个人的故事被看到”的目标。
他认为AI时代给UGC内容社区带来了新的机遇,虽然变化可能比预期慢,但他相信这种变化正在发生。
他强调,内容生产是驱动需求变化的关键因素,尤其是抖音、小红书等内容平台的发展,供给侧的爆发先于消费模式的变化。
胡秀涵提出社会创新理念,认为公众广泛参与是内容创作的关键。
他主张开源内容协作,认为这不仅可以带来文化认同,还可以满足小众爱好的需求。
在AI时代,这种个性化的供需关系变得更加可行。
之前的新兴趋势(例如 NFT)已经表明,围绕共识构建故事可以创造价值。
对于AI的作用,胡秀涵认为,AI应该充当叙事编排者,而不是简单的内容生成器。
他通过实验和实践,展示了人工智能如何在UGC内容创作中发挥作用,特别是在世界观构建、角色设计和情节生成方面。
他强调,虽然人工智能可以提供知识和联系,但创造力的核心灵感仍然需要人类提供。
在技??术层面,胡秀涵讨论了人工智能作为创意伙伴的角色,强调人工智能作为作曲家而不是创造者的角色,并讨论了GenAI下的技术可行性。
他提出了通过AI技术实现创意的理念,让简单的模板创作也变得有意义。
胡秀涵还分享了他的团队进行的内容实验,利用变量控制方法来探索哪些人工智能内容可以在最少的人工参与下获得持续的流量。
他们发现,世界观可以通过平台构建,角色设计可以由用户轻松完成,但剧情控制仍然是一个挑战。
他强调,无论是PGC、UGC还是AIGC,找到最有效的内容元素供给方式至关重要。
在确保尽可能基于人工智能的同时,必须有人愿意消费所制作的内容。
最后,胡秀涵提出了社区化创作分享的目标,以及社区与MMORPG相结合的目标,鼓励用户通过活动和角色扮演来创作和分享故事。
他展望了未来通过技术进步(例如升级基本视觉模型)讲述更好的故事,并强调不断提高解读细节的能力的重要性。
他认为,随着科技的进步,每个人都可以参与故事的发挥和创作过程。
他认为,原创和二次创作的界限将变得模糊,创造和创新的效率将得到前所未有的提高,推动人类文明的进步。
概念展台结束语 GDC大会为大模型领域的企业提供了展示技术创新的平台。
例如,Waveform Intelligence展示了其在超长文本书写方面的技术突破,Dify.AI介绍了从Prompt工程到Flow工程的转变,百川智能和Zilliz分别分享了他们在大模型技术和矢量数据库方面的进展。
这些分享不仅展示了公司的技术实力,也促进了行业内的技术交流和知识传播。
会议通过研讨会和闭门交流的形式,推动了大模型技术在不同行业应用的深入讨论。
例如,Moonshot AI分享了其在游戏开发方面的潜力,Kyligence讨论了大数据与大模型相结合的实践,而Xmind AI和Seeing Concept分别探索了AI在思维导图和UGC内容中的运用。
社区中的应用程序。

这些讨论将有助于行业企业和专家更好地了解大模型技术的多样化应用,推动相关领域的创新和发展。
GDC大会还提供了探索大模型领域商业模式的机会。
通过分享他们的产品和解决方案,公司展示了如何将大型技术商业化并创造新的收入来源。
这些讨论和演示有助于启发业内其他公司思考如何有效地将技术创新转化为商业价值。
GDC大会通过互动展台等形式,为公众提供了了解和体验大型模型技术的机会。
这有利于增强公众对大模型技术及其应用的认知,增加社会对此领域的关注和支持,为行业的长期发展创造良好的社会环境。
GDC大会的成功举办也体现了中国政府对人工智能和大模型领域的重视和支持。
通过这样的国际会议,可以向世界展示中国在该领域的成就和潜力,为中国大型模型领域与全球市场接轨提供了平台。
#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助您掌握新兴技术趋势。
以及行业变化,洞悉未来技术趋势。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-17
06-18
06-06
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态