首页 > 科技未来 > 内容

中国AI开源新事：扔掉旧地图，才能找到新大陆

发布于：2024-06-18 编辑：匿名来源：网络

中国AI开源新动态：扔掉旧地图，寻找新大陆。

在2019年的大机型浪潮中，“开源”是绕不开的关键词。

各大厂商、明星初创公司、高校、科研院所悉数参与：6月9日，致远研究院宣布“启蒙3.0”进入全面开源新阶段； 6月15日，百川智能推出70亿参数大量中英文预训练大模型baichuan-7B，模型免费可商用； 7月，百川智能继续推出baichuan-13B，完全开源、免费、可商用； 7月17日，智普AI宣布开源大模型ChatGLM-6B和ChatGLM2-6B； 8月3日，阿里巴巴宣布开源统一钱文70亿参数模型Qwen-7B； 10月30日，昆仑万维宣布开源百亿级大型语言模型“天宫”Skywork-13B系列，并罕见开源GB、B Token大型优质开源中文数据集； 11月6日，远翔XVERSE宣布开源亿参数高性能通用大模型XVERSE-65B； ...为何大型模型会引发中国新一轮AI开源热潮？对于这一轮的大模创业公司来说，开源是一箭三雕的好办法——首先，开源是自我推销的免费渠道。

快速迭代的开源模型可以及时向外界“秀肌肉”。

个人开发者或公司实际使用模型后，可以直观地感受到公司的技术实力。

其次，企业还可以通过开源模式聚集一批潜在的合作伙伴。

甚至是潜在客户，为未来商业化积累；第三，“高手在民间”，企业可以通过开源聚集一批分散在各地的优秀开发者，共同迭代自己的模式。

大模型推动了沉寂已久的AI开源产业，但真正能星星之火燎原的是真正能创造良性循环的开源生态。

在开源生态的建设中，除了模型开发者之外，还有一支非常重要的力量——开源社区。

如果说模型开发者不断为开源生态注入“活水”，那么开源社区就是开源生态中的“蓄水池”。

长期以来，国内开源生态的一大痛点就是优质“水库”太少，大量源源不断的“活水”流向国外。

最终，间接导致了生态系统难以成熟，以至于在很多人的心目中，烙上了“中国不可能成为开源社区”的刻板印象。

如今，在“大模式重做所有行业”的新背景下，行业或许需要重新审视中国AI开源生态的可能性。

本文中，“甲子光年”深度对话wisemodel AI创始人兼CEO、清华校友会AI大数据委员会副秘书长刘道全，畅谈人工智能的新机遇大模型时代的中国AI开源生态。

1、成为“中国版抱脸” 2019年9月4日，国内首个完全独立运营的第三方AI开源社区“wisemodel.cn”上线。

“我们的目标是打造‘中国版抱脸’，汇聚国内外常用开源AI模型、数据集等资源，打造中立、开放的AI开源创新平台。

” Wisemodel上线当天，其背后公司创始人世智AI刘道全在官方微信公众号上写下了第一篇文章。

除了时智AI创始人兼CEO之外，刘道全还有另一个身份——清华校友会AI大数据委员会副秘书长。

2017年，刘道全毕业三年后重返清华大学，开始负责清华校友的AI大数据生态。

2006年，刘道全开始准备独立创业。

彼时，ChatGPT还没有成为AI界的“屠龙少年”，新的风暴还没有出现。

刘道全*瞄准了一条赚钱最快、最容易掌握的赛道——提升算力。

确定方向后，刘道全走访了全国各大云厂商和数据中心，基本摸清了全国算力的分布格局。

但很快，他发现算力是一项基础资源业务。

“基础资源业务通常不可避免地会陷入价格战。

”刘道全告诉甲子光年。

他想做一些更有价值的事情。

事实上，当时的刘道全已经站在了“天时、地利、人和”的交界处。

2017年，GPT-3的出现在AI圈引起了小范围的震动，清华大学无数技术人蠢蠢欲动。

最终，“清华大学”种子选手智浦AI成为国内首家进军大型模型行业的初创公司。

三年后的今天，当年的种子选手已经摇身一变成为行业的领军企业。

作为“清华”圈子的内部人士，刘道全明显感觉到一些变化正在发生。

他开始盘算手头的资源。

中国AI开源新事：扔掉旧地图，才能找到新大陆

刘道全在负责AI大数据生态的七年时间里，接触了大量的AI和大数据公司，对各种技术路线和产品分类有了基本的了解。

一方面掌握国家算力版图，另一方面掌握AI行业最新趋势，而身在群星闪耀的清华系，他接下来要解决的问题就是找到一个切入点，最大化地发挥自己的优势。

利用他已有的资源。

ChatGPT给刘道全带来了东风。

ChatGPT出现后，很多人都陷入了迷茫，互相追逐，希望在恐慌中尽快找到自己的位置。

刘道全敏锐地意识到，大模型与应用场景之间的“最后一公里”仍然存在大量机会。

他分享道：“每个企业的模式都有不同的功能和特点，现在很多需求方企业在选择模式时都要一一尝试，有时甚至会混淆使用同一个模式。

”解决大模型的问题打通实施的“最后一公里”，大致有两种方式：一是针对具体问题构建单点工具；二是针对具体问题构建单点工具；二是搭建一个平台，将算力、模型、数据集、工具链等资源汇集到平台上，让每一个问题都能找到最合适的解决方案。

历史证明，国内的商业环境和用户付费习惯对工具应用并不友好，仅单点工具很难变现。

因此，六刀盘点了自己手中的所有资源，果断选择了另外一条搭建平台的道路。

“纵观商业发展史，企业最大的竞争壁垒来自于生态壁垒，大车型时代也不例外。

”刘道全说道。

打造生态，最好的起点就是打造社区，这就是“中国版抱脸”的小目标的由来。

在这个小目标的背后，刘道全还有一个更远大的愿景，那就是在中国市场建立wisemodel，并努力将其打造成Hugging Face之外最活跃的社区。

上线三个多月以来，AIwisemodel社区已聚集数千注册用户，公私模型总数超万个，公私数据集总数接近万个。

社区日均PV在10万到20万次之间，每天模型和数据集的下载量在1000次左右。

社区公众号的关注人数也超过了人，累计阅读次数超过86000次。

然而，长期以来，中国开源社区仍然笼罩着一个被诅咒的刻板印象——中国在开源社区做得不好。

wisemodel如何打破这个旧的现状呢？ 2.扔掉旧地图，寻找新世界。

“中国做不好开源社区”的刻板印象背后，是中国开源社区多年来难以商业化的残酷现实。

直到今天，中国很多人仍然相信“开源意味着免费”。

如何养活自己是所有开源社区都会面临的历史性问题。

事实上，这并非国内独有的困境。

即使在开源理念的发源地美国，开源运动的先驱们也花了很长时间探索开源商业模式。

回顾历史，从软件诞生的第一天起，“开源意味着免费”的认知就已经铭刻在软件的基因里。

时光倒流到20世纪50年代，“软件”的概念刚刚诞生。

长期以来，软件只是硬件的附件。

可以随硬件一起免费赠送，后续升级也是免费的。

当时的软件还直接附带源代码，方便专业人员调试和修改。

这在某种程度上为后续的开源软件模式定下了基调。

2006年，IBM率先打破软件的“免费赠送”模式，开始对部分软件收费。

此后20年，收费模式在带动软件市场快速繁荣的同时，也让软件生态系统变得越来越“封闭”。

除了付费使用之外，软件厂商还会利用各种技术和法律手段来限制他人共享、修改甚至研究程序。

软件从免费、开放到付费、封闭的转变也引起了很多开发者的不满。

当时还在麻省理工学院人工智能实验室担任程序员的理查德·斯托曼（Richard Stallman）尤其反对。

Richard Stallman 的想法相当激进，主张“所有软件都应该向所有人开放”。

当年10月，Richard Stallman还成立了自由软件基金会，资助更多的自由软件开发者。

Richard Stallman，图片来源：历史照片现在回想起来，Richard 激进的软件共享理念就像一把双刃剑——一方面，它大力推动了开源软件的发展进程，成为开源软件的第一源头。

思想核心；另一方面，“free”在英语中也有“免费”的意思。

因此，自由软件（free software）被一些人误认为是“自由软件”。

20世纪90年代，为了避免这种理解误区，Netscape用“开源软件”取代了“自由软件”，正式开启了开源时代。

在随后几十年的发展中，开源社区逐渐形成了几种典型的商业模式。

BentoML亚太区负责人刘聪曾在一次活动中将开源商业模式分为三个时代：“所谓的1.0可能是红帽，卖支持和许可证，而2.0更多的是OpenCore模式， 3.0可能就像一个将Databricks与云平台强绑定的模型，其收费和使用可以与云平台共享。

”但是，在大模型时代，AI开源可能会形成新的模式。

除了传统的开源模式之外。

商业模式。

刘道全告诉甲子光年，开源社区本身并没有很好的商业模式，但大模型引发的AI开源热潮与传统软件开源有本质区别，可能会给AI带来新的商机。

开源社区。

。

“传统的软件开源是纯代码托管，开发者下载代码部署在自己的服务器上运行，用户和社区的互动主要是下载。

除了代码，AI开源比模型更重要在大模型时代，模型和应用分离已经成为趋势，用户开发的应用可以利用模型能力解决实际问题，还有可以挖掘的商业价值。

”刘道全进一步解释道。

抛弃旧地图，寻找新大陆。

历史仅证明基于代码托管的传统软件开源模式在国内无法成功采用，但大模式带来的新机遇仍需要无数后来者的验证。

刘道全是带头的。

在他的想象中，wisemodel会经历两个商业化阶段——第一阶段，平台主要面向开发者，连接模型和算力资源，通过算力变现。

大型模型的高门槛在于，即使大型模型开源，用户（企业或个人）仍然需要一定的计算资源来下载和部署模型。

准备好算力后，用户还需要在算力平台上安装各种基础环境进行调试。

调试完成后，可以添加自己的数据进行微调或部署推理等。

Wisemodel可以连接模型和算力平台，帮助用户省去模型和算力平台的调试过程，让企业可以轻松使用模型一键操作，还可以直接提供模型托管等服务。

第二阶段，平台开始面向应用开发者，真正深入应用场景，解决模型和应用的“最后一公里”。

当社区的活跃度和丰富度相对成熟时，wisemodel可以根据企业真实场景的需求，将平台上聚集的模型和工具进行封装，提供给企业的应用开发者，解决场景业务问题。

然而，理想虽然丰满，但脚下的路依然艰难。

3、开源之路是漫长而艰难的。

“中国仍然有很多人认为在中国建立开源社区是不可能的。

”刘道全告诉甲子光年。

他坦言，wisemodel上线之前，经历过冷启动期。

今年7月以来，刘道全一直在与“清华系”的模型厂商保持联系。

智普AI、百川智能等首批wisemodel“VIP”用户几乎全部来自清华系。

“第一波基本上都是‘刷脸’上传的。

”刘道全自言自语道。

冷启动的难点在于，wisemodel真正想要实现的不仅仅是让模型厂商完成“上传模型”的动作，而是从根本上改变国内开发者几十年来形成的习惯——大家都知道在国外中国的开源生态更加成熟，开发者选择国外社区几乎已经成为一种习惯。

培养用户的使用习惯注定是一个需要耐心的过程。

自今年9月成立以来，刘道全将大部分精力投入到社区的运营上。

“我每天都会看到谁有新模型，我就鼓励他们把模型放上去。

我们也会帮助社区用户在各个行业群体中推送模型。

”对于接下来的计划，刘道全与企业家有些不一致。

“佛教徒”。

他说：“我们不会为自己设定KPI。

开源社区是一项长期工作，就像长跑一样，不需要太关注起跑速度。

只要wisemodel继续存在，整个AI行业不断发展，自然会有源源不断的新东西上传到社区，让社区变得‘活’，而不是‘死’社区。

”有人可能会问，既然开源无国界，追求开放包容，为什么还需要在国外有成熟的开源社区呢？您想在中国重新运营社区吗？刘道全表示，社区之间的关系并不完全是竞争关系。

每个社区都会有自己的特点。

许多社区可以链接。

每个社区都是整个开源领域不可或缺的一部分。

另外，国内很多模型厂商的培训语料以中文为主，他们的客户也在中国。

Wisemodel可以为开发者提供更及时的服务，降低开发者获取和使用模型的门槛。

同时，“由于Hugging Face上的模型和数据集的数量和类型太多，除了有影响力的领先机构发布的内容外，很多内容基本上没有人关注和下载。

”刘道全说道。

刘道全也坚定表示wisemodel将保持中立。

“现在我仍然坚持，如果开源社区被贴上特定的标签，可能不太可能。

如果有大公司来找我，我会直接告诉他，‘我们可以合作，但*不要投资我'。

” “展望未来，开源生态将成为国产大机型浪潮中的沃土。

从技术角度看，国内AI实力与美国仍有差距，更何况极高的成本和成本。

”大模型的研发门槛在技术层面上大大降低了大模型的准入门槛，让更多的创业者更容易拿到入场券。

从商业实现的角度来看，很多时候，企业需要的并不是一个千亿甚至万亿参数的SOTA（高级）模型，而是一个能够稳定支持企业在此基础上构建稳定的大规模模型应用的模型库。

基础。

这些模型通常可能只有数十亿个参数，这对于开源生态系统来说是一个机会。

开源模式虽然能力相对较弱，但实施起来更加灵活、经济。

因此，国内AI从业者完全有理由对国内AI开源生态给予更多的耐心和信心。

事实上，中国并不缺乏优秀的开发者。

Tiamat创始人兼CEO甘庆曾在甲子重力年终盛典上感叹：“大师就在民间”。

她分享道：“我自己就是开源生态系统的受益者。

在学校的时候，我花了很多时间在 Discord 上潜水或者和别人聊天。

大佬讨论你可以接触到很多大佬对于我们这些从社区出来的年轻创业者来说，与社区里的技术大佬交流会给我们很多启发。

在开源社区，它可能成为开启下一个时代的垫脚石。

正如被誉为“开源运动圣经”的《大教堂与集市》书中所写：“开源不仅仅是让我们看代码，更是让我们使用代码。

而后者才是真正的开源”开源的魔力，或者换句话说，就是力量所在。

” ????????????【本文由投资界合作伙伴微信公众号授权：甲子光年。

】如有疑问，请联系投资界（）。

站长声明

标签：

上一篇：大朋VR获数千万元战略投资

下一篇：苹果赢得“滑动解锁”专利战，判三星支付1.196亿美元

《IDC 中国游戏云市场跟踪研究，2022H2》系列文章五：游戏云关键动态与总结

各大游戏云服务商动态腾讯云在腾讯数字生态大会上，腾讯云在“游戏专场”中围绕游戏研发与测试、发行和运营等方面进行了展示。启动和运营增长。游戏全生命周期解决方案。作为国内众多老牌游戏客户和大部分游戏项目的主要云服务提供商，腾讯云从“帮助行业客户打造优质游

06-17
光速正式成立东南亚办事处，今年成功融资40亿美元

据投资界（微信ID：pedaily）消息，光速美国近日正式启动总部位于新加坡的东南亚业务，宣布今年完成融资，总计40亿美元的全球基金支持东南亚投资。这一最新举措表明，光速正在通过辐射全球的网络，与无畏挑战的企业家携手，打造引领世界的优秀企业，实现让世界变得更美好的

06-18
海富产业设立半导体专项基金，规模13亿元

据投资界（ID：pedaily）6月9日消息，近日，海富产业投资基金管理有限公司（简称“海富产业投资基金”）海通证券旗下子公司海富产业”）发起设立并管理的海富半导体创业投资（嘉兴）合伙企业（有限合伙）（简称“半导体专项基金”）完成工商设立。该基金由全国社会保障基金

06-17
中国核电：上半年核电发电量同比增长23.43%

中国核电7月2日晚间公告称，据公司统计，截至6月30日，公司累计发电量上半年商业发电量3.8亿千瓦时。上网发电量9.3亿千瓦时，其中核电发电量8.4亿千瓦时，同比增长23.43%。新能源发电容量43.54亿千瓦时。

06-17
唯柯医疗获数千万元A轮融资，全面推广心力衰竭及结构性心脏病解决方案

投资界（ID：pedaily）据11月25日消息，唯柯医疗宣布完成数千万元融资人民币A轮融资。本轮融资由上海山澜资本领投，盛誉投资跟投。据悉，本轮融资筹集的资金将主要用于公司自主研发的国内一流器械D-shant心房分流器的多中心临床试验，并持续推进临床试验和注册工作。纳米膜

06-18
诸神之战-围观！湖南赛区启动仪式

阿里巴巴集团年度大赛封神之战全球创客大赛湖南赛区于6月13日在长沙启动，百万奖金支持创业者梦想。

06-17
工信部：6G目前处于探索阶段

工信部部长肖亚庆表示，6G目前处于探索阶段。我们也在与国际社会互动，推动共同标准、愿景需求、技术成熟度等，我们需要与世界各地的行业朋友相互沟通、共同探讨，共同推动新的发展。

06-18
《农村电商人才报告》：2025年人才缺口将达350万，拼多多已成为最大的人才促农平台

“以拼多多为代表的新电商，在推动农产品和农产品崛起方面激起了一波增长”培养电子商务兴农人才。面对现实的变化，拼多多正在成为中国最大的人才发展平台，成为农产品电商的黄埔军校。 ” 2019年6月10日，中国农业大学智慧电商研究院发布《中国农村电商人才现状与发展报告》

06-17
一站式商业智能解决方案提供商“思迈特软件”完成过亿B+轮战略融资

4月20日消息，一站式商业智能解决方案提供商“思迈特软件”完成B+轮战略融资融资过亿。本轮投资方为全球企业级数据分析和组织智能服务平台提供商明略科技。此前，思迈特软件已获得价值资本、方广资本的数千万A轮投资，以及高城资本、琥珀资本的1.25亿B轮投资。

06-17
Intel CES发布会：10纳米终于重见天日

Intel在CES前夕召开了发布会。英特尔公布了有关10纳米处理器的更多细节，宣布与阿里巴巴达成奥运战略合作，并推出了Nervana神经网络推理处理器。此前，英特尔在10nm工艺上遇到了一些困难，导致10nm量产芯片的发布推迟。在今年12月的Intel架构日上，Intel推出了下一代Sunny

06-06
扔掉谷歌翻译！这款免费无广告的超级AI翻译工具是你的最佳选择

两个月前，一本书在豆瓣引起轩然大波：有网友评论乌拉圭作家、马里奥贝内德蒂的小说《休战》“机器翻译标记”很严重”和“工作被毁了”。没想到，译者韩烨的朋友愤怒地写信给该用户所在的学校，要求她就该言论道歉。被译者好友行为冒犯的豆瓣网友也发起反击。他们在豆瓣上

06-21
“耀明电子”完成数百万元天使轮融资，标志着黑客信息组建智网

投资社区（ID：pedaily）9月27日消息，据36氪报道，网络安全创业公司耀明电子（北京））科技有限公司（以下简称“耀明电子”）近日完成天使轮融资。本轮融资领投方为海贝资本，同创九吾跟投，GEW资本担任独家投资方。本轮资金将主要用于完善智能安防产品研发团队和实施解决

06-18