首页 > 科技未来 > 内容

在体验了字节的所有AI产品后,杀手级的AI应用可能比想象的更远

发布于:2024-06-18 编辑:匿名 来源:网络

字节的豆宝已经悄然成为中国用户最多的原生AI应用。

在近日的一次活动中,字节跳动产品与策略副总裁朱骏透露,5月中旬,豆宝的月活已经达到1万。

目前,豆宝APP下载量已超过1亿次,平台上创建的代理商数量超过1万个。

从月活跃度来看,豆宝已经超越了今年流行的Kimi聊天和百度文心一言。

虽然字节跳动的豆宝大模型(原云雀大模型)去年8月才上线,但不到一年的时间,字节跳动已经成为发布数量最多的公司,无论是模型层还是应用层发布。

——据极客公园不完全统计,字节跳动目前已有11款AI产品。

与此前在XR、房地产、教育、SaaS等领域“高调”推出新业务线不同,在生成式AI爆发的这一年半里,字节跳动的打法可谓是古风十足。

在体验了字节的所有AI产品后,杀手级的AI应用可能比想象的更远

出征打仗的成语。

:意思是“有头衔,快速前进”。

一方面,字节打造了全明星阵容的技术中心,并推动各业务线尝试拥抱AI。

它还组建了多个新团队,探索人工智能在各个领域的原生应用。

另一方面,与投资强度相比,字节在AI领域的声音却极其低调。

今年5月之前,只有飞书发布了与代理相关的新应用。

据极客公园介绍,去年字节内部有多个团队想要发布AI产品,但均遭到高管打压。

低调并不代表没有实力。

事实上,在不少业内人士眼中,字节被认为是这波技术浪潮中最有可能做出杀手级大型模型或原生AI应用的国内厂商。

至少有四个原因: 字节在AI领域拥有强大的积累。

它在全球率先大规模利用AI技术进行信息分发,并在过去几年中积累了海量的GPU计算资源。

作为一家不断依靠今日头条、抖音等产品突破国内BAT天花板的移动互联网时代的创业公司,字节拥有国内顶尖的产品研发和运营团队。

作为今日头条、飞书、抖音、番茄小说等产品的母公司,字节跳动拥有庞大的用户基础和内容生态,积累了大量优质数据。

后者的重要性不言而喻。

是推动人工智能技术发展和应用的关键“燃料”。

最后也是最重要的一点:背靠抖音,字节拥有中国乃至全球最好的流量池。

许多创业者梦想的数百万日活用户,对于Byte来说,只需“轻推”即可实现。

这就像当年游戏行业的腾讯。

Byte不用担心流量,只需要做好产品就可以了。

毫无疑问,字节是国内原生AI应用的种子选手。

这或许就是字节选择“快进”的原因。

5月份,随着大豆宝模型的发布,字节的AI战略显然将进入下一阶段。

至此,极客公园对字节迄今为止公布的所有AI产品进行了梳理和体验,希望通过这种方式探索这些产品背后的思维,一窥字节整体的AI战略。

火力覆盖范围:不错过任何类别。

穷则打击精准,富则火力覆盖。

后者用来形容Byte在AI应用领域的战略再合适不过了。

据极客公园不完全统计,去年8月以来,字节跳动在AI领域基于现有产品共推出8个大模型、2个代理开发平台、近20个原生或AI应用。

如下图所示,极客公园对字节跳动目前的AI产品进行了分类: 总体来说,字节跳动的AI产品体系涵盖了最基础的模型层、中间开发Agent的层、以及产品层面。

应用层。

其中模型层和中间层比较常规,而应用层则表现出非常明显的多元化,可以说是百花齐放。

据极客公园统计,在已发布的产品中,Byte已涵盖聊天、社交、图像/视频、教育、音乐等领域,其中包括Dreamina、CodeGen等生产力导向的工具产品,还有猫箱(音箱)和豆袋是更多 ToC 应用。

在产品层面,字节基本上不会放过市场上任何热门品类,以上产品基本上都能在市场上找到标杆。

例如,AI对话产品豆宝包括ChatGPT、文心一言、Kimi; AI机器人开发平台Button以GPT为基准; “Cat Box”(以前的“Talk Stove”)以 MiniMax 的“Hoshino”为基准;教育产品Gauthmath,猿辅导的类似数学产品;而Sponge Band、海外的Suno和国内的昆仑万维天宫都是同类产品。

可以看到,在过去的一年里,字节正在重新夺回移动互联网时代“应用工厂”的力量,其技术和产品团队都在快速进步。

产品体验:Byte想做什么? 极客公园点击图片体验一圈字节的产品。

这里我们挑选了三款具有代表性的产品来谈谈:豆袋、“猫盒”和剪影“Dreamina”。

豆宝 豆宝是字节跳动基于豆宝模型(原云雀模型)开发的人工智能机器人。

可以看到,豆宝具有辅助写作、图像生成、AI搜索、PDF问答、翻译、网页摘要等许多基础功能。

下载桌面版后,您还可以启用设置权限,允许桌面上的每个应用程序访问AI。

豆宝使用页面|图片来源:极客公园 在豆宝上,你可以自己创建各种智能代理。

字节跳动产品与策略副总裁和朱骏此前在发布会上提到,团队成员将英语老师的智能身体捏在豆袋上。

除了用自然语言定义“这位老师需要用英语说话,并在对话过程中随时纠正用户的语法错误”这一功能之外,还定义了会员最喜欢的声音和图像。

我通常在路上用语音留言与“他”交谈,回到家后我也用实时通话模式模拟英语口语对话。

从笔者的个人体验来看,字节跳动的豆宝和百度的文心一言并没有太大区别。

不过,目前豆宝的使用是免费的,这在一定程度上降低了用户的试用和使用成本。

文心一言已经需要付费才能调用文心大模型4.0并解锁高级功能。

文心一言的会员价|图片来源:极客公园 在进一步的体验中,豆宝的TTS语音技术让我眼前一亮。

创建代理时,您只需要阅读一小段文字,即可立即生成一个听起来与您自己的代理一模一样的代理。

在对话过程中,豆宝上的智能体在回复时会在括号中添加一些情态助词,以模拟真人的语气,使交互更加自然。

这背后是字节跳动早期对优化语音交互体验的投入,包括基于大模型的ASR和超自然的TTS声音,所有这些都旨在尽可能接近与真人交谈的体验。

豆宝几乎是中国第一家建立语音交互门户作为默认交互界面的大公司。

后来其他公司也跟进了这个功能。

Catbox“淘宝”是一款以AI角色为核心的社交应用。

同样由抖音豆宝大模型驱动,与豆宝数据进行通信。

4月11日,《话灶》更名为《猫盒》。

《猫盒子》的特点在于其互动内容的高度自由度以及受用户决定影响的故事走向,给用户带来了一种全新的社交娱乐方式。

在Cat Box的体验中,我一进入应用,就被推荐了一系列AI角色,每个角色都有自己的特点,让我跃跃欲试。

“猫盒子”支持文字和语音两种输入方式,让沟通更加自然便捷。

在与AI角色的对话中,我发现我所做的每一个决定都会影响故事的发展。

这种参与感让我感觉自己身处一个真实的故事世界。

每一个选择都可能导致不同的故事走向,而这次经历让我一开始就很享受。

如果用户对当前的虚拟角色感到厌倦,“猫盒”提供了一个简单直观的解决方案:只需轻轻一划,即可刷新新的虚拟伙伴。

这个设计类似于抖音上下滑动短视频,“以前是刷短视频,现在是刷智能手机”,让作者体验到从浪漫到奇幻、从猜谜游戏的多种聊天乐趣到日常聊天,每一次刷新都是新的探索。

但新鲜感是短暂的。

当我第一次见到各具特色的AI角色时,交谈后发现他们非常相似。

他们的回答和反应模式逐渐显露出机械性的重复性,缺乏真实人类交流的复杂性和不可预测性。

虽然语音输入比打字容易多了,但聊了半天,我不自觉地期待一些其他的玩法。

不幸的是,我还没有看到它。

虽然《猫盒子》的语音输入功能确实给交流带来了便利,让作者能够更自然地与AI角色对话,但经过长时间的交流,我开始渴望更多的互动方式,期待被能够通过更多样化的方式进行沟通。

它使用定制的游戏玩法来丰富这种沟通体验。

遗憾的是,在目前的版本中,更多的创新功能尚未出现,这让笔者对这款APP的长期吸引力产生了质疑。

人们真的有那么多话要说吗?与一个纯粹虚幻的人工智能产品交谈能获得多少乐趣?这样的产品吸引力能持续多久? 问完之后,我强迫自己浏览了一会。

可能是因为我在boss频道待的时间长了一些,“猫盒子”给我推荐的boss越来越多。

《猫盒》中的boss |图片来源:极客公园 这和抖音的个性化推荐是一样的,但不同的是“猫盒子”无法查看每个AI角色的互动数据,比如点赞、转发等。

以及评论数量。

这些交互机制是抖音平台设计的一部分,可以让用户发现和观察内容的受欢迎程度,也可以让平台了解哪些内容受欢迎并相应地做出内容推荐。

除了在“猫盒子”用户页面查看聊天记录外,您还可以点击心形符号来收集角色。

分享渠道也比较简单|图片来源:极客公园 虽然也支持对外分享,但从目前的页面设置来看,一方面,“猫盒子”似乎更倾向于私人体验。

用户可能看不到其他人在玩什么,社交性不足,交流受到限制。

不过,这样的设计也减少了社会影响,保持了用户的注意力。

可以更加专注于交互本身;另一方面,相比于用户之间的社交互动,“猫盒子”可能更注重用户与AI角色之间的互动。

这个设计似乎是在探索一些AI原生的人机交互。

在这样的前提下,用户想要爱上使用这款产品,就会考验AI角色本身的交互性和内容的创意性。

Dreamina 前段时间,字节的AI创作平台“Dreamina”的视频生成功能也开放测试。

我尝试了一下。

可以看到,“Dreamina”的页面非常简洁,主要有两个功能区:AI绘图和AI视频。

不过看侧边栏,还有四个AI工具:图像生成、智能画布、视频生成、故事创作尚未推出。

这次笔者主要体验了视频生成功能。

首先,我尝试了文本生成视频,输入了一段简短的文本: 可以看到有5种摄像机移动:即时摄像机移动、向前推进、缩小、顺时针旋转和逆时针旋转,16:5视频比例:9 、4:3、1:1、3:4、9:16 和 3 种运动速度:慢、中、快。

生成一个视频需要12点积分,系统每天会赠送60点免费积分。

等了大约两分钟后,“Dreamina”为我生成了一个3秒的视频。

在这短短的三秒钟里,画面中金发短发的女孩似乎在通过转头、叹息、眼角似乎有泪水来表达悲伤和思考。

可以看到生成的视频下方有三个创意选项:再次生成、重新编辑和延长3秒。

再生也需要 12 点。

延长3秒需要开通月费69元的VIP。

69元的会员福利包括单月积分、无水印视频下载、延长视频生成时间、多种声音、视频对口型等。

由于我没有会员,所以我又花了12个免费积分重新生成了一个3秒的视频:这一次,生成的视频自动从侧面转向正面,但女主角右眼的双眼皮在视频看起来有点尴尬和眨眼。

速度略落后于左眼,感觉没有初代想象中那么好? 成为会员看看效果是否可以更好? 这是作者输入的文字提示:春江月夜,一位身穿旗袍的卷发女子在苏州河边行走。

她似乎迷路了。

恰巧有人路过。

她上前问路,那人却有些不耐烦。

他把她推开。

这是我花69元成为会员,使用3秒延迟、对口型等会员功能(需要36积分)后生成的视频。

总体来说还是怪怪的,后半句的文字内容不显示。

出来。

从目前的结果来看,《Dreamina》或许能够吸引对视频创作感兴趣但可能缺乏专业技能的用户群体。

平台通过积分制度和会员服务提供激励机制,试图鼓励用户创造并支付增值服务。

不过,从目前生成的视频质量的稳定性和精准度来看,《Dreamina》背后的AI算法还需要大量优化。

“人盯人防守”下,创新还没有出现。

自去年8月推出豆宝模式(原云雀)以来,不到一年时间,字节跳动已推出11款AI产品,涵盖坐席定制、聊天、社交、图像/视频、办公、教育、电商内容创作等、音乐、教育、代码生成等领域,基本覆盖了当前应用层创业的主流方向——可以说目前所有的产品范式都有Byte的参与。

图中几乎采用了“盯人防守”的打法。

同时,字节很可能会有国内外双轮驱动的产品开发策略:即先在海外市场测试产品,验证PMF,提高产品与技术的匹配度,以利于产品的落地。

在中国推出更成熟的人工智能应用。

,保持市场竞争优势。

目前,在国内市场,字节跳动依靠自主研发的“云雀”大模型提供技术支持,而在国际市场,至少部分采用基于GPT的技术服务。

例如,AI对话产品豆宝的海外版本是Cici;针对GPT的AI机器人开发平台Button的海外版本是Coze; AI角色交流工具“花鹿”的海外版是BagelBell; AI工具合集“小悟空”的海外版本是“ChitChop”……字节跳动的优势在于它积累了移动互联网时代最多的数据、最多的流量、更多的算力,但它目前与 OpenAI 没有明显区别。

看看正确的投注方向,确保自己不落后,能跟上。

与此同时,作为主要产品制造商,字节也在其产品中探索AI原生功能。

比如《猫盒》目前似乎更偏向于私人体验。

用户可能无法看到其他人在玩什么,并且可能更注重设计。

用户与AI角色的互动,而不是用户之间的社交互动。

经过几轮的体验,我们可以感觉到现阶段这些产品普遍不成熟。

这一点在我们与业内人士的交流中也得到了证实。

换句话说,这些产品或服务虽然在理念上有创新,但实际吸引力却并不如预期。

有些座席给出的场景设置可能很有趣,但反馈大多依赖于用户的聊天技巧。

如果用户不能很好地设置或调动代理,用户体验可能会低于预期。

从用户的角度来看,目前市场上的“猫盒子”等人工智能对话产品在功能上看起来非常相似。

无论是角色扮演还是会话交流,大多依赖文本或多模态交互。

当与这些AI产品交流时,感觉就像是在跑一场单向马拉松,不断地输入内容,却只能得到一维的响应。

这种“高互动、低媒体”的模式需要用户投入大量的精力,但不一定能收到同样丰富的反馈。

如果产品继续沿着这条道路发展,其潜在的用户群将受到限制。

这是因为大多数用户要么不愿意投入太多精力,要么缺乏通过多轮对话开发深度内容的能力。

从对话历史可以看出,如果想要获得更好、更有趣的回复,用户需要具备一定的聊天技巧,比如在对话中添加表情符号或描述性词语。

然而,大多数用户不具备这样的表达或陈述能力。

但目前的形式也是最能让用户接受的。

用户不太可能直接与复杂的大型模型进行交互,也不太可能通过简单的对话框充分体验人工智能的功能。

你必须给用户一个有基本设置、基本情感、基本形象的产品形态,用户才能上手。

未来,AI对话产品想要扩大用户基础和市场影响力,需要考虑如何降低用户与产品交互的门槛,同时提高媒体的互动性和反馈质量,吸引更广泛的用户。

团体。

豆宝等产品上的智能代理,通过强大的语言处理能力和持续学习特性,为用户提供从知识获取到文本创作的全方位服务。

他们甚至超越了后来者,月活跃度一度超过了温心怡。

但该产品也面临着行业共同的挑战,即如何在同质化中突围并找到核心竞争力。

毕竟类似的产品太多了。

寻找自己的核心竞争力也是字节跳动在AI时代面临的课题。

这对广大AI创业者来说或许也是个好消息:即便是字节这样的大公司,如今在AI应用领域也还处于摸索阶段,距离做出像抖音、今日头条这样的杀手级应用还很远。

需要更长的时间。

不过,面对AI领域各大厂商的“加价”策略,创业者在创业第一天或许也不得不思考。

经过产品的0到1阶段之后,到了1到10、10阶段,什么是自己产品真正的核心竞争力,是不可能被有流量和资本的大厂商轻易模仿和取代的。

每一个新技术时代,都会有突破上一个时代天花板的创新者。

当年,字节跳动突破了BAT的天花板。

这曾经被认为是不可能的,但每个大公司都有自己的“大”腰带。

伴随着绝对的优势,也必然存在“大”带来的先天劣势,就连字节跳动也无法避免。

对于AI时代的创业来说,正值巅峰的字节跳动无疑是一个不可忽视的重要变量。

唯一的希望是人工智能时代才刚刚开始。

时至今日,即便是字节跳动的所有努力也将不容忽视。

我只是在追随和探索。

未来还没有被书写,所以就向前走吧。

在体验了字节的所有AI产品后,杀手级的AI应用可能比想象的更远

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 总规模达1亿 浙江江山设立“两山”转型领域产业基金

    总规模达1亿 浙江江山设立“两山”转型领域产业基金

    近日,江山市“两山合作社”与浙江省联合设立国之茂产业基金(以下简称产业基金)国茂集团全面启动投资运作,基金总规模1亿元,双方分别认购1万元、1万元,成为江山“两山”改造领域首支产业基金。 “这是双方共同努力的结果,重塑了对口支持机制。 ”省国贸集团临时干部、张

    06-18

  • 博世新设立2.5亿欧元风险投资基金,支持初创企业

    博世新设立2.5亿欧元风险投资基金,支持初创企业

    据投资界6月6日消息,博世宣布旗下子公司罗伯特博世创业投资有限公司(简称“博世创投”) Capital”)设立了一项总金额为2.5亿欧元的新基金,用于支持世界各地的初创企业通过其技术提高人类生活质量并保护自然资源。 资料显示,作为欧洲最大的企业投资者之一,博世创投专注

    06-17

  • 最明白AI实施难度的人就是李彦宏

    最明白AI实施难度的人就是李彦宏

    进入今年,百度这个全球最大的中文搜索公司在公司规模上已经无法与阿里巴巴和腾讯抗衡,甚至在搜索量上已经落后了。 市场价值。 对于拼多多、京东等公司;尽管如此,BAT仍然是不可替代的词汇组合,百度的角色和东方仍然吸引着整个行业的关注。 尤其是在AI风潮下,百度的表现

    06-18

  • 今年圣诞节,鲜花和巧克力是否被年轻人抛弃了?

    今年圣诞节,鲜花和巧克力是否被年轻人抛弃了?

    又到了圣诞节,送礼物成了最头疼的问题之一。 购买护肤品时,不知道是否适合自己的肤质。 买衣服时,我担心选错尺码。 小红书上买网红的热门单品,又怕被说非原创。 在这一系列的疑问下,看来鲜花和巧克力确实是最好的选择,虽然不够创新,但更有仪式感,充满情感价值。 从公

    06-18

  • KLOOK客路获2.25亿美元D+轮融资,由软银愿景基金领投

    KLOOK客路获2.25亿美元D+轮融资,由软银愿景基金领投

    据投资界4月9日消息,全球旅游体验预订平台KLOOK客路获2.25亿美元D+轮融资,由软银愿景基金牵头。 投资方面,红杉资本中国基金、经纬中国、TCV、OurCrowd等持续跟投。 算上今年8月筹集的2亿美元,目前D轮融资总额为4.25亿美元。 自2017年成立以来,KLOOK共获得6轮融资,总额超

    06-17

  • 糖纸公测丨电视只适合大尺寸吗? Kukai Max 86”:它能做的还不止这些

    糖纸公测丨电视只适合大尺寸吗? Kukai Max 86”:它能做的还不止这些

    本文由作者作为体验者@Sanada撰写,首发于糖纸公测。 过去,电视一直是家庭娱乐的中心,但随着移动互联网的发展和各种移动终端的到来,逐渐形成了一个有趣的局面:“手机电视正在变成电视,电视正在变成电视”。 无用。 ”再加上电视的更换周期长、更换频率低,人们在购买电视

    06-21

  • 今年一季度上海汽车出口总额近一倍

    今年一季度上海汽车出口总额近一倍

    从上海海关获悉,今年一季度,上海汽车出口总额增长0.4%,达到6000万元,其中电动乘用车出口4亿元。 元,增长0.2%。

    06-18

  • 「安麦生物科技」完成1.2亿美元C轮融资

    「安麦生物科技」完成1.2亿美元C轮融资

    「安麦生物科技」近日完成1.2亿美元C轮融资。 本轮融资由招银国际CMBI和韩国未来资产金融集团联合领投。 本轮募集资金将用于推进映象生物正在进行的EMB-01、EMB-02、EMB-06人体临床研究,并拓展公司新型双特异性抗体及其他生物药的产品管线。

    06-17

  • 专为英国人开发!英国口音、笑话的BBC语音助手来了

    专为英国人开发!英国口音、笑话的BBC语音助手来了

    嘿Siri,今天天气怎么样?小爱,帮我定个七点的闹钟!小度小度,附近有什么好吃的餐厅吗……每天给助手打电话似乎已经成为一种习惯。 生活、旅行、娱乐似乎都离不开它的存在。 不过,为了保持沟通顺畅,最好使用比较标准的普通话。 如果你习惯用家乡话,尤其是粤语、四川话等

    06-18

  • 每周感觉良好 -他们用塑料垃圾做了一本书,留给了一千年后的人们

    每周感觉良好 -他们用塑料垃圾做了一本书,留给了一千年后的人们

    麦当劳的第一个可回收咖啡杯是这样的 他用塑料垃圾做了一本书,留给了一千个人 对于2000年后出生的人来说, “蚂蚁森林”这个应用程序可以帮助您找到环保品牌。 让我们带着您的宝宝坐在轮椅上散步吧。 伦理:一小块肥皂能带来多大的改变?麦当劳的第一个可重复使用的咖啡杯看

    06-21

  • 吉威空间拟赴科创板IPO并已签署辅导协议

    吉威空间拟赴科创板IPO并已签署辅导协议

    4月7日获悉,中信证券股份有限公司披露了北京吉威空间信息有限公司辅导的基本情况,股份有限公司首次公开发行股票并在科创板挂牌。

    06-18

  • 亚马逊电商客服系统升级指南

    亚马逊电商客服系统升级指南

    .wp-block-column h3{margin-left:0} 在竞争激烈的亚马逊电商平台上,客户服务不再只是一项义务,它已经成为关键创造卓越的客户体验,提高客户满意度。 卖家不断寻找升级客户服务系统的方法,以满足不断增长的客户需求并提高竞争力。 以下是亚马逊电商客服系统升级的一些关键

    06-18