用这款软件看看APP在用户背后做了什么
06-21
中国AI开源新动态:扔掉旧地图,寻找新大陆。
在2019年的大机型浪潮中,“开源”是绕不开的关键词。
各大厂商、明星初创公司、高校、科研院所悉数参与:6月9日,致远研究院宣布“启蒙3.0”进入全面开源新阶段; 6月15日,百川智能推出70亿参数大量中英文预训练大模型baichuan-7B,模型免费可商用; 7月,百川智能继续推出baichuan-13B,完全开源、免费、可商用; 7月17日,智普AI宣布开源大模型ChatGLM-6B和ChatGLM2-6B; 8月3日,阿里巴巴宣布开源统一钱文70亿参数模型Qwen-7B; 10月30日,昆仑万维宣布开源百亿级大型语言模型“天宫”Skywork-13B系列,并罕见开源GB、B Token大型优质开源中文数据集; 11月6日,远翔XVERSE宣布开源亿参数高性能通用大模型XVERSE-65B; ...为何大型模型会引发中国新一轮AI开源热潮? 对于这一轮的大模创业公司来说,开源是一箭三雕的好办法——首先,开源是自我推销的免费渠道。
快速迭代的开源模型可以及时向外界“秀肌肉”。
个人开发者或公司实际使用模型后,可以直观地感受到公司的技术实力。
其次,企业还可以通过开源模式聚集一批潜在的合作伙伴。
甚至是潜在客户,为未来商业化积累;第三,“高手在民间”,企业可以通过开源聚集一批分散在各地的优秀开发者,共同迭代自己的模式。
大模型推动了沉寂已久的AI开源产业,但真正能星星之火燎原的是真正能创造良性循环的开源生态。
在开源生态的建设中,除了模型开发者之外,还有一支非常重要的力量——开源社区。
如果说模型开发者不断为开源生态注入“活水”,那么开源社区就是开源生态中的“蓄水池”。
长期以来,国内开源生态的一大痛点就是优质“水库”太少,大量源源不断的“活水”流向国外。
最终,间接导致了生态系统难以成熟,以至于在很多人的心目中,烙上了“中国不可能成为开源社区”的刻板印象。
如今,在“大模式重做所有行业”的新背景下,行业或许需要重新审视中国AI开源生态的可能性。
本文中,“甲子光年”深度对话wisemodel AI创始人兼CEO、清华校友会AI大数据委员会副秘书长刘道全,畅谈人工智能的新机遇大模型时代的中国AI开源生态。
1、成为“中国版抱脸” 2019年9月4日,国内首个完全独立运营的第三方AI开源社区“wisemodel.cn”上线。
“我们的目标是打造‘中国版抱脸’,汇聚国内外常用开源AI模型、数据集等资源,打造中立、开放的AI开源创新平台。
” Wisemodel上线当天,其背后公司创始人世智AI刘道全在官方微信公众号上写下了第一篇文章。
除了时智AI创始人兼CEO之外,刘道全还有另一个身份——清华校友会AI大数据委员会副秘书长。
2017年,刘道全毕业三年后重返清华大学,开始负责清华校友的AI大数据生态。
2006年,刘道全开始准备独立创业。
彼时,ChatGPT还没有成为AI界的“屠龙少年”,新的风暴还没有出现。
刘道全*瞄准了一条赚钱最快、最容易掌握的赛道——提升算力。
确定方向后,刘道全走访了全国各大云厂商和数据中心,基本摸清了全国算力的分布格局。
但很快,他发现算力是一项基础资源业务。
“基础资源业务通常不可避免地会陷入价格战。
”刘道全告诉甲子光年。
他想做一些更有价值的事情。
事实上,当时的刘道全已经站在了“天时、地利、人和”的交界处。
2017年,GPT-3的出现在AI圈引起了小范围的震动,清华大学无数技术人蠢蠢欲动。
最终,“清华大学”种子选手智浦AI成为国内首家进军大型模型行业的初创公司。
三年后的今天,当年的种子选手已经摇身一变成为行业的领军企业。
作为“清华”圈子的内部人士,刘道全明显感觉到一些变化正在发生。
他开始盘算手头的资源。

刘道全在负责AI大数据生态的七年时间里,接触了大量的AI和大数据公司,对各种技术路线和产品分类有了基本的了解。
一方面掌握国家算力版图,另一方面掌握AI行业最新趋势,而身在群星闪耀的清华系,他接下来要解决的问题就是找到一个切入点,最大化地发挥自己的优势。
利用他已有的资源。
ChatGPT给刘道全带来了东风。
ChatGPT出现后,很多人都陷入了迷茫,互相追逐,希望在恐慌中尽快找到自己的位置。
刘道全敏锐地意识到,大模型与应用场景之间的“最后一公里”仍然存在大量机会。
他分享道:“每个企业的模式都有不同的功能和特点,现在很多需求方企业在选择模式时都要一一尝试,有时甚至会混淆使用同一个模式。
”解决大模型的问题 打通实施的“最后一公里”,大致有两种方式:一是针对具体问题构建单点工具;二是针对具体问题构建单点工具;二是搭建一个平台,将算力、模型、数据集、工具链等资源汇集到平台上,让每一个问题都能找到最合适的解决方案。
历史证明,国内的商业环境和用户付费习惯对工具应用并不友好,仅单点工具很难变现。
因此,六刀盘点了自己手中的所有资源,果断选择了另外一条搭建平台的道路。
“纵观商业发展史,企业最大的竞争壁垒来自于生态壁垒,大车型时代也不例外。
”刘道全说道。
打造生态,最好的起点就是打造社区,这就是“中国版抱脸”的小目标的由来。
在这个小目标的背后,刘道全还有一个更远大的愿景,那就是在中国市场建立wisemodel,并努力将其打造成Hugging Face之外最活跃的社区。
上线三个多月以来,AIwisemodel社区已聚集数千注册用户,公私模型总数超万个,公私数据集总数接近万个。
社区日均PV在10万到20万次之间,每天模型和数据集的下载量在1000次左右。
社区公众号的关注人数也超过了人,累计阅读次数超过86000次。
然而,长期以来,中国开源社区仍然笼罩着一个被诅咒的刻板印象——中国在开源社区做得不好。
wisemodel如何打破这个旧的现状呢? 2.扔掉旧地图,寻找新世界。
“中国做不好开源社区”的刻板印象背后,是中国开源社区多年来难以商业化的残酷现实。
直到今天,中国很多人仍然相信“开源意味着免费”。
如何养活自己是所有开源社区都会面临的历史性问题。
事实上,这并非国内独有的困境。
即使在开源理念的发源地美国,开源运动的先驱们也花了很长时间探索开源商业模式。
回顾历史,从软件诞生的第一天起,“开源意味着免费”的认知就已经铭刻在软件的基因里。
时光倒流到20世纪50年代,“软件”的概念刚刚诞生。
长期以来,软件只是硬件的附件。
可以随硬件一起免费赠送,后续升级也是免费的。
当时的软件还直接附带源代码,方便专业人员调试和修改。
这在某种程度上为后续的开源软件模式定下了基调。
2006年,IBM率先打破软件的“免费赠送”模式,开始对部分软件收费。
此后20年,收费模式在带动软件市场快速繁荣的同时,也让软件生态系统变得越来越“封闭”。
除了付费使用之外,软件厂商还会利用各种技术和法律手段来限制他人共享、修改甚至研究程序。
软件从免费、开放到付费、封闭的转变也引起了很多开发者的不满。
当时还在麻省理工学院人工智能实验室担任程序员的理查德·斯托曼(Richard Stallman)尤其反对。
Richard Stallman 的想法相当激进,主张“所有软件都应该向所有人开放”。
当年10月,Richard Stallman还成立了自由软件基金会,资助更多的自由软件开发者。
Richard Stallman,图片来源:历史照片 现在回想起来,Richard 激进的软件共享理念就像一把双刃剑——一方面,它大力推动了开源软件的发展进程,成为开源软件的第一源头。
思想核心;另一方面,“free”在英语中也有“免费”的意思。
因此,自由软件(free software)被一些人误认为是“自由软件”。
20世纪90年代,为了避免这种理解误区,Netscape用“开源软件”取代了“自由软件”,正式开启了开源时代。
在随后几十年的发展中,开源社区逐渐形成了几种典型的商业模式。
BentoML亚太区负责人刘聪曾在一次活动中将开源商业模式分为三个时代:“所谓的1.0可能是红帽,卖支持和许可证,而2.0更多的是OpenCore模式, 3.0可能就像一个将Databricks与云平台强绑定的模型,其收费和使用可以与云平台共享。
”但是,在大模型时代,AI开源可能会形成新的模式。
除了传统的开源模式之外。
商业模式。
刘道全告诉甲子光年,开源社区本身并没有很好的商业模式,但大模型引发的AI开源热潮与传统软件开源有本质区别,可能会给AI带来新的商机。
开源社区。
。
“传统的软件开源是纯代码托管,开发者下载代码部署在自己的服务器上运行,用户和社区的互动主要是下载。
除了代码,AI开源比模型更重要在大模型时代,模型和应用分离已经成为趋势,用户开发的应用可以利用模型能力解决实际问题,还有可以挖掘的商业价值。
”刘道全进一步解释道。
抛弃旧地图,寻找新大陆。
历史仅证明基于代码托管的传统软件开源模式在国内无法成功采用,但大模式带来的新机遇仍需要无数后来者的验证。
刘道全是带头的。
在他的想象中,wisemodel会经历两个商业化阶段——第一阶段,平台主要面向开发者,连接模型和算力资源,通过算力变现。
大型模型的高门槛在于,即使大型模型开源,用户(企业或个人)仍然需要一定的计算资源来下载和部署模型。
准备好算力后,用户还需要在算力平台上安装各种基础环境进行调试。
调试完成后,可以添加自己的数据进行微调或部署推理等。
Wisemodel可以连接模型和算力平台,帮助用户省去模型和算力平台的调试过程,让企业可以轻松使用模型一键操作,还可以直接提供模型托管等服务。
第二阶段,平台开始面向应用开发者,真正深入应用场景,解决模型和应用的“最后一公里”。
当社区的活跃度和丰富度相对成熟时,wisemodel可以根据企业真实场景的需求,将平台上聚集的模型和工具进行封装,提供给企业的应用开发者,解决场景业务问题。
然而,理想虽然丰满,但脚下的路依然艰难。
3、开源之路是漫长而艰难的。
“中国仍然有很多人认为在中国建立开源社区是不可能的。
”刘道全告诉甲子光年。
他坦言,wisemodel上线之前,经历过冷启动期。
今年7月以来,刘道全一直在与“清华系”的模型厂商保持联系。
智普AI、百川智能等首批wisemodel“VIP”用户几乎全部来自清华系。
“第一波基本上都是‘刷脸’上传的。
”刘道全自言自语道。
冷启动的难点在于,wisemodel真正想要实现的不仅仅是让模型厂商完成“上传模型”的动作,而是从根本上改变国内开发者几十年来形成的习惯——大家都知道在国外中国的开源生态更加成熟,开发者选择国外社区几乎已经成为一种习惯。
培养用户的使用习惯注定是一个需要耐心的过程。
自今年9月成立以来,刘道全将大部分精力投入到社区的运营上。
“我每天都会看到谁有新模型,我就鼓励他们把模型放上去。
我们也会帮助社区用户在各个行业群体中推送模型。
”对于接下来的计划,刘道全与企业家有些不一致。
“佛教徒”。
他说:“我们不会为自己设定KPI。
开源社区是一项长期工作,就像长跑一样,不需要太关注起跑速度。
只要wisemodel继续存在,整个AI行业不断发展,自然会有源源不断的新东西上传到社区,让社区变得‘活’,而不是‘死’社区。
”有人可能会问,既然开源无国界,追求开放包容,为什么还需要在国外有成熟的开源社区呢?您想在中国重新运营社区吗? 刘道全表示,社区之间的关系并不完全是竞争关系。
每个社区都会有自己的特点。
许多社区可以链接。
每个社区都是整个开源领域不可或缺的一部分。
另外,国内很多模型厂商的培训语料以中文为主,他们的客户也在中国。
Wisemodel可以为开发者提供更及时的服务,降低开发者获取和使用模型的门槛。
同时,“由于Hugging Face上的模型和数据集的数量和类型太多,除了有影响力的领先机构发布的内容外,很多内容基本上没有人关注和下载。
”刘道全说道。
刘道全也坚定表示wisemodel将保持中立。
“现在我仍然坚持,如果开源社区被贴上特定的标签,可能不太可能。
如果有大公司来找我,我会直接告诉他,‘我们可以合作,但*不要投资我'。
” “展望未来,开源生态将成为国产大机型浪潮中的沃土。
从技术角度看,国内AI实力与美国仍有差距,更何况极高的成本和成本。
”大模型的研发门槛在技术层面上大大降低了大模型的准入门槛,让更多的创业者更容易拿到入场券。
从商业实现的角度来看,很多时候,企业需要的并不是一个千亿甚至万亿参数的SOTA(高级)模型,而是一个能够稳定支持企业在此基础上构建稳定的大规模模型应用的模型库。
基础。
这些模型通常可能只有数十亿个参数,这对于开源生态系统来说是一个机会。
开源模式虽然能力相对较弱,但实施起来更加灵活、经济。
因此,国内AI从业者完全有理由对国内AI开源生态给予更多的耐心和信心。
事实上,中国并不缺乏优秀的开发者。
Tiamat创始人兼CEO甘庆曾在甲子重力年终盛典上感叹:“大师就在民间”。
她分享道:“我自己就是开源生态系统的受益者。
在学校的时候,我花了很多时间在 Discord 上潜水或者和别人聊天。
大佬讨论你可以接触到很多大佬对于我们这些从社区出来的年轻创业者来说,与社区里的技术大佬交流会给我们很多启发。
在开源社区,它可能成为开启下一个时代的垫脚石。
正如被誉为“开源运动圣经”的《大教堂与集市》书中所写:“开源不仅仅是让我们看代码,更是让我们使用代码。
而后者才是真正的开源”开源的魔力,或者换句话说,就是力量所在。
” ????????????【本文由投资界合作伙伴微信公众号授权:甲子光年。
】如有疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-21
06-06
06-17
06-17
06-17
06-21
06-17
06-17
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态