总规模达1亿 浙江江山设立“两山”转型领域产业基金
06-18
字节的豆宝已经悄然成为中国用户最多的原生AI应用。
在近日的一次活动中,字节跳动产品与策略副总裁朱骏透露,5月中旬,豆宝的月活已经达到1万。
目前,豆宝APP下载量已超过1亿次,平台上创建的代理商数量超过1万个。
从月活跃度来看,豆宝已经超越了今年流行的Kimi聊天和百度文心一言。
虽然字节跳动的豆宝大模型(原云雀大模型)去年8月才上线,但不到一年的时间,字节跳动已经成为发布数量最多的公司,无论是模型层还是应用层发布。
——据极客公园不完全统计,字节跳动目前已有11款AI产品。
与此前在XR、房地产、教育、SaaS等领域“高调”推出新业务线不同,在生成式AI爆发的这一年半里,字节跳动的打法可谓是古风十足。

出征打仗的成语。
:意思是“有头衔,快速前进”。
一方面,字节打造了全明星阵容的技术中心,并推动各业务线尝试拥抱AI。
它还组建了多个新团队,探索人工智能在各个领域的原生应用。
另一方面,与投资强度相比,字节在AI领域的声音却极其低调。
今年5月之前,只有飞书发布了与代理相关的新应用。
据极客公园介绍,去年字节内部有多个团队想要发布AI产品,但均遭到高管打压。
低调并不代表没有实力。
事实上,在不少业内人士眼中,字节被认为是这波技术浪潮中最有可能做出杀手级大型模型或原生AI应用的国内厂商。
至少有四个原因: 字节在AI领域拥有强大的积累。
它在全球率先大规模利用AI技术进行信息分发,并在过去几年中积累了海量的GPU计算资源。
作为一家不断依靠今日头条、抖音等产品突破国内BAT天花板的移动互联网时代的创业公司,字节拥有国内顶尖的产品研发和运营团队。
作为今日头条、飞书、抖音、番茄小说等产品的母公司,字节跳动拥有庞大的用户基础和内容生态,积累了大量优质数据。
后者的重要性不言而喻。
是推动人工智能技术发展和应用的关键“燃料”。
最后也是最重要的一点:背靠抖音,字节拥有中国乃至全球最好的流量池。
许多创业者梦想的数百万日活用户,对于Byte来说,只需“轻推”即可实现。
这就像当年游戏行业的腾讯。
Byte不用担心流量,只需要做好产品就可以了。
毫无疑问,字节是国内原生AI应用的种子选手。
这或许就是字节选择“快进”的原因。
5月份,随着大豆宝模型的发布,字节的AI战略显然将进入下一阶段。
至此,极客公园对字节迄今为止公布的所有AI产品进行了梳理和体验,希望通过这种方式探索这些产品背后的思维,一窥字节整体的AI战略。
火力覆盖范围:不错过任何类别。
穷则打击精准,富则火力覆盖。
后者用来形容Byte在AI应用领域的战略再合适不过了。
据极客公园不完全统计,去年8月以来,字节跳动在AI领域基于现有产品共推出8个大模型、2个代理开发平台、近20个原生或AI应用。
如下图所示,极客公园对字节跳动目前的AI产品进行了分类: 总体来说,字节跳动的AI产品体系涵盖了最基础的模型层、中间开发Agent的层、以及产品层面。
应用层。
其中模型层和中间层比较常规,而应用层则表现出非常明显的多元化,可以说是百花齐放。
据极客公园统计,在已发布的产品中,Byte已涵盖聊天、社交、图像/视频、教育、音乐等领域,其中包括Dreamina、CodeGen等生产力导向的工具产品,还有猫箱(音箱)和豆袋是更多 ToC 应用。
在产品层面,字节基本上不会放过市场上任何热门品类,以上产品基本上都能在市场上找到标杆。
例如,AI对话产品豆宝包括ChatGPT、文心一言、Kimi; AI机器人开发平台Button以GPT为基准; “Cat Box”(以前的“Talk Stove”)以 MiniMax 的“Hoshino”为基准;教育产品Gauthmath,猿辅导的类似数学产品;而Sponge Band、海外的Suno和国内的昆仑万维天宫都是同类产品。
可以看到,在过去的一年里,字节正在重新夺回移动互联网时代“应用工厂”的力量,其技术和产品团队都在快速进步。
产品体验:Byte想做什么? 极客公园点击图片体验一圈字节的产品。
这里我们挑选了三款具有代表性的产品来谈谈:豆袋、“猫盒”和剪影“Dreamina”。
豆宝 豆宝是字节跳动基于豆宝模型(原云雀模型)开发的人工智能机器人。
可以看到,豆宝具有辅助写作、图像生成、AI搜索、PDF问答、翻译、网页摘要等许多基础功能。
下载桌面版后,您还可以启用设置权限,允许桌面上的每个应用程序访问AI。
豆宝使用页面|图片来源:极客公园 在豆宝上,你可以自己创建各种智能代理。
字节跳动产品与策略副总裁和朱骏此前在发布会上提到,团队成员将英语老师的智能身体捏在豆袋上。
除了用自然语言定义“这位老师需要用英语说话,并在对话过程中随时纠正用户的语法错误”这一功能之外,还定义了会员最喜欢的声音和图像。
我通常在路上用语音留言与“他”交谈,回到家后我也用实时通话模式模拟英语口语对话。
从笔者的个人体验来看,字节跳动的豆宝和百度的文心一言并没有太大区别。
不过,目前豆宝的使用是免费的,这在一定程度上降低了用户的试用和使用成本。
文心一言已经需要付费才能调用文心大模型4.0并解锁高级功能。
文心一言的会员价|图片来源:极客公园 在进一步的体验中,豆宝的TTS语音技术让我眼前一亮。
。
创建代理时,您只需要阅读一小段文字,即可立即生成一个听起来与您自己的代理一模一样的代理。
在对话过程中,豆宝上的智能体在回复时会在括号中添加一些情态助词,以模拟真人的语气,使交互更加自然。
这背后是字节跳动早期对优化语音交互体验的投入,包括基于大模型的ASR和超自然的TTS声音,所有这些都旨在尽可能接近与真人交谈的体验。
豆宝几乎是中国第一家建立语音交互门户作为默认交互界面的大公司。
后来其他公司也跟进了这个功能。
Catbox“淘宝”是一款以AI角色为核心的社交应用。
同样由抖音豆宝大模型驱动,与豆宝数据进行通信。
4月11日,《话灶》更名为《猫盒》。
《猫盒子》的特点在于其互动内容的高度自由度以及受用户决定影响的故事走向,给用户带来了一种全新的社交娱乐方式。
在Cat Box的体验中,我一进入应用,就被推荐了一系列AI角色,每个角色都有自己的特点,让我跃跃欲试。
“猫盒子”支持文字和语音两种输入方式,让沟通更加自然便捷。
在与AI角色的对话中,我发现我所做的每一个决定都会影响故事的发展。
这种参与感让我感觉自己身处一个真实的故事世界。
每一个选择都可能导致不同的故事走向,而这次经历让我一开始就很享受。
如果用户对当前的虚拟角色感到厌倦,“猫盒”提供了一个简单直观的解决方案:只需轻轻一划,即可刷新新的虚拟伙伴。
这个设计类似于抖音上下滑动短视频,“以前是刷短视频,现在是刷智能手机”,让作者体验到从浪漫到奇幻、从猜谜游戏的多种聊天乐趣到日常聊天,每一次刷新都是新的探索。
但新鲜感是短暂的。
当我第一次见到各具特色的AI角色时,交谈后发现他们非常相似。
他们的回答和反应模式逐渐显露出机械性的重复性,缺乏真实人类交流的复杂性和不可预测性。
虽然语音输入比打字容易多了,但聊了半天,我不自觉地期待一些其他的玩法。
不幸的是,我还没有看到它。
虽然《猫盒子》的语音输入功能确实给交流带来了便利,让作者能够更自然地与AI角色对话,但经过长时间的交流,我开始渴望更多的互动方式,期待被能够通过更多样化的方式进行沟通。
它使用定制的游戏玩法来丰富这种沟通体验。
遗憾的是,在目前的版本中,更多的创新功能尚未出现,这让笔者对这款APP的长期吸引力产生了质疑。
人们真的有那么多话要说吗?与一个纯粹虚幻的人工智能产品交谈能获得多少乐趣?这样的产品吸引力能持续多久? 问完之后,我强迫自己浏览了一会。
可能是因为我在boss频道待的时间长了一些,“猫盒子”给我推荐的boss越来越多。
《猫盒》中的boss |图片来源:极客公园 这和抖音的个性化推荐是一样的,但不同的是“猫盒子”无法查看每个AI角色的互动数据,比如点赞、转发等。
以及评论数量。
这些交互机制是抖音平台设计的一部分,可以让用户发现和观察内容的受欢迎程度,也可以让平台了解哪些内容受欢迎并相应地做出内容推荐。
除了在“猫盒子”用户页面查看聊天记录外,您还可以点击心形符号来收集角色。
分享渠道也比较简单|图片来源:极客公园 虽然也支持对外分享,但从目前的页面设置来看,一方面,“猫盒子”似乎更倾向于私人体验。
用户可能看不到其他人在玩什么,社交性不足,交流受到限制。
不过,这样的设计也减少了社会影响,保持了用户的注意力。
可以更加专注于交互本身;另一方面,相比于用户之间的社交互动,“猫盒子”可能更注重用户与AI角色之间的互动。
这个设计似乎是在探索一些AI原生的人机交互。
。
在这样的前提下,用户想要爱上使用这款产品,就会考验AI角色本身的交互性和内容的创意性。
Dreamina 前段时间,字节的AI创作平台“Dreamina”的视频生成功能也开放测试。
我尝试了一下。
可以看到,“Dreamina”的页面非常简洁,主要有两个功能区:AI绘图和AI视频。
不过看侧边栏,还有四个AI工具:图像生成、智能画布、视频生成、故事创作尚未推出。
这次笔者主要体验了视频生成功能。
首先,我尝试了文本生成视频,输入了一段简短的文本: 可以看到有5种摄像机移动:即时摄像机移动、向前推进、缩小、顺时针旋转和逆时针旋转,16:5视频比例:9 、4:3、1:1、3:4、9:16 和 3 种运动速度:慢、中、快。
生成一个视频需要12点积分,系统每天会赠送60点免费积分。
等了大约两分钟后,“Dreamina”为我生成了一个3秒的视频。
在这短短的三秒钟里,画面中金发短发的女孩似乎在通过转头、叹息、眼角似乎有泪水来表达悲伤和思考。
可以看到生成的视频下方有三个创意选项:再次生成、重新编辑和延长3秒。
再生也需要 12 点。
延长3秒需要开通月费69元的VIP。
69元的会员福利包括单月积分、无水印视频下载、延长视频生成时间、多种声音、视频对口型等。
由于我没有会员,所以我又花了12个免费积分重新生成了一个3秒的视频:这一次,生成的视频自动从侧面转向正面,但女主角右眼的双眼皮在视频看起来有点尴尬和眨眼。
速度略落后于左眼,感觉没有初代想象中那么好? 成为会员看看效果是否可以更好? 这是作者输入的文字提示:春江月夜,一位身穿旗袍的卷发女子在苏州河边行走。
她似乎迷路了。
恰巧有人路过。
她上前问路,那人却有些不耐烦。
他把她推开。
这是我花69元成为会员,使用3秒延迟、对口型等会员功能(需要36积分)后生成的视频。
总体来说还是怪怪的,后半句的文字内容不显示。
出来。
从目前的结果来看,《Dreamina》或许能够吸引对视频创作感兴趣但可能缺乏专业技能的用户群体。
平台通过积分制度和会员服务提供激励机制,试图鼓励用户创造并支付增值服务。
不过,从目前生成的视频质量的稳定性和精准度来看,《Dreamina》背后的AI算法还需要大量优化。
“人盯人防守”下,创新还没有出现。
自去年8月推出豆宝模式(原云雀)以来,不到一年时间,字节跳动已推出11款AI产品,涵盖坐席定制、聊天、社交、图像/视频、办公、教育、电商内容创作等、音乐、教育、代码生成等领域,基本覆盖了当前应用层创业的主流方向——可以说目前所有的产品范式都有Byte的参与。
图中几乎采用了“盯人防守”的打法。
同时,字节很可能会有国内外双轮驱动的产品开发策略:即先在海外市场测试产品,验证PMF,提高产品与技术的匹配度,以利于产品的落地。
在中国推出更成熟的人工智能应用。
,保持市场竞争优势。
目前,在国内市场,字节跳动依靠自主研发的“云雀”大模型提供技术支持,而在国际市场,至少部分采用基于GPT的技术服务。
例如,AI对话产品豆宝的海外版本是Cici;针对GPT的AI机器人开发平台Button的海外版本是Coze; AI角色交流工具“花鹿”的海外版是BagelBell; AI工具合集“小悟空”的海外版本是“ChitChop”……字节跳动的优势在于它积累了移动互联网时代最多的数据、最多的流量、更多的算力,但它目前与 OpenAI 没有明显区别。
看看正确的投注方向,确保自己不落后,能跟上。
与此同时,作为主要产品制造商,字节也在其产品中探索AI原生功能。
比如《猫盒》目前似乎更偏向于私人体验。
用户可能无法看到其他人在玩什么,并且可能更注重设计。
用户与AI角色的互动,而不是用户之间的社交互动。
经过几轮的体验,我们可以感觉到现阶段这些产品普遍不成熟。
这一点在我们与业内人士的交流中也得到了证实。
换句话说,这些产品或服务虽然在理念上有创新,但实际吸引力却并不如预期。
有些座席给出的场景设置可能很有趣,但反馈大多依赖于用户的聊天技巧。
如果用户不能很好地设置或调动代理,用户体验可能会低于预期。
从用户的角度来看,目前市场上的“猫盒子”等人工智能对话产品在功能上看起来非常相似。
无论是角色扮演还是会话交流,大多依赖文本或多模态交互。
当与这些AI产品交流时,感觉就像是在跑一场单向马拉松,不断地输入内容,却只能得到一维的响应。
这种“高互动、低媒体”的模式需要用户投入大量的精力,但不一定能收到同样丰富的反馈。
如果产品继续沿着这条道路发展,其潜在的用户群将受到限制。
这是因为大多数用户要么不愿意投入太多精力,要么缺乏通过多轮对话开发深度内容的能力。
从对话历史可以看出,如果想要获得更好、更有趣的回复,用户需要具备一定的聊天技巧,比如在对话中添加表情符号或描述性词语。
然而,大多数用户不具备这样的表达或陈述能力。
但目前的形式也是最能让用户接受的。
用户不太可能直接与复杂的大型模型进行交互,也不太可能通过简单的对话框充分体验人工智能的功能。
你必须给用户一个有基本设置、基本情感、基本形象的产品形态,用户才能上手。
未来,AI对话产品想要扩大用户基础和市场影响力,需要考虑如何降低用户与产品交互的门槛,同时提高媒体的互动性和反馈质量,吸引更广泛的用户。
团体。
豆宝等产品上的智能代理,通过强大的语言处理能力和持续学习特性,为用户提供从知识获取到文本创作的全方位服务。
他们甚至超越了后来者,月活跃度一度超过了温心怡。
但该产品也面临着行业共同的挑战,即如何在同质化中突围并找到核心竞争力。
毕竟类似的产品太多了。
寻找自己的核心竞争力也是字节跳动在AI时代面临的课题。
这对广大AI创业者来说或许也是个好消息:即便是字节这样的大公司,如今在AI应用领域也还处于摸索阶段,距离做出像抖音、今日头条这样的杀手级应用还很远。
需要更长的时间。
不过,面对AI领域各大厂商的“加价”策略,创业者在创业第一天或许也不得不思考。
经过产品的0到1阶段之后,到了1到10、10阶段,什么是自己产品真正的核心竞争力,是不可能被有流量和资本的大厂商轻易模仿和取代的。
每一个新技术时代,都会有突破上一个时代天花板的创新者。
当年,字节跳动突破了BAT的天花板。
这曾经被认为是不可能的,但每个大公司都有自己的“大”腰带。
伴随着绝对的优势,也必然存在“大”带来的先天劣势,就连字节跳动也无法避免。
对于AI时代的创业来说,正值巅峰的字节跳动无疑是一个不可忽视的重要变量。
唯一的希望是人工智能时代才刚刚开始。
时至今日,即便是字节跳动的所有努力也将不容忽视。
我只是在追随和探索。
未来还没有被书写,所以就向前走吧。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-17
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态