小米:618期间全平台支付金额突破190亿,同比增长90%
06-18
发布一个月后,智脑再次升级。
乍一看,最显着的变化来自于UI界面。
升级后的智脑外观与chatGPT聊天机器人类似,与上一代的搜索侧边栏不同。
UI界面的这种变化,实际上强化了智脑“产品”的属性——它不再是依赖于搜索的附加功能,而是一个完全独立的产品。
事实上,本次智能大脑升级一个月后最大的提升就是搜索能力。
成为独立产品后,智脑已经能够在聊天时给出的答案中融入互联网内容。
它甚至在界面上设计了一个按钮,以便用户可以选择“使用搜索来回答”。
如此一来,这个大模型的产品就越来越齐全了。
它不仅可以调用大模型能力,还可以结合互联网内容,甚至在所有答案下方添加点赞按钮——用户可以直接表达是否喜欢大模型的表现,而这些反馈反过来又成为驱动力为了智脑的不断发展。
进化的宝贵数据。
这是一个完整的产品演进闭环。
抛给智脑的五个刁钻题已经说了这么多,更重要的是实际测试。
品玩立即试用了智能大脑,挑选了一些或奇葩、或刁钻、或需要较强语境理解的题目来测试这款号称国内第一梯队的大模型产品。
它名副其实吗?第一个问题与技术有关。
我们向智脑询问了我们对苹果头戴式显示设备的看法。
智脑的回答比较全面,涵盖了市场趋势、创新点和用户需求,甚至还触及了成本问题。
当然,我们不会这么轻易放过。
在对智脑的回答表示不满后,它给我的回复是这样的。
首先,智能大脑完全理解问题,并从一开始就指出问题本身没有明确的答案。
其次,还对本问题涉及的一些具体技术细节进行了简要分析。
最后我们就这个问题做出了跟进问题——什么价格合适?这时候,智闹的回答却颇为意外。
从这个回答中我们可以看出,智脑对“合理区间”这个概念,特别是美元,有所谓的理解,其实是符合逻辑的。
对于第二个问题,我们讨论了比特币。

首先是讲解比特币的技术原理。
点击重新回答后,智闹给出了两个答案。
通过分析可以看出,第二个答案更侧重于仔细解释去中心化交易记录的过程。
但总的来说,智脑的回答是准确的。
接下来,让我们把事情变得有点荒谬。
智闹应要求创作了一个比特币笑话。
看得出来它有幽默感,但是它的音乐感呢?当我指出歌词不押韵时,智闹是这么说的。
不得不承认,它有理有据,在音乐性上可能有点不合理,但在幽默性上绝对得分很高。
事实上,在上面的例子中,我们可以感受到大脑整体浮现出的“智能”,这意味着你的聊天过程更像是在与人聊天,而不是与机器聊天。
当然,这还处于起步阶段,在上述测试中出现了一些意想不到的问题。
例如,大脑本质上无法写出押韵的内容,在某些情况下它会向自己承认这一点。
这种错误是大模型“幻觉”的一部分,但正如周鸿祎所说,“能说废话的能力恰恰是智力的分水岭”。
带着对大脑智能的期望,我们提出了第三个问题。
这实际上体现了智能大脑产生创造的能力——这是智能的重要表现。
从上面的回答可以看出,智脑不仅听懂了问题,还针对“采访”的具体情况,根据孙悟空的性格和特点,“创作”了符合要求的内容。
这种产生创造的能力,让智脑非常擅长回答一些抽象、困难的问题,俗称一两句话无法解释的问题。
或许目前这些问题的答案,尤其是拆解逻辑链条的过程,都比较简单粗暴,但我们已经可以看到它对问题本身有相当的把握。
随着训练和推理能力规模的不断提高,尤其是在引入更多用户反馈之后,智能大脑的潜在改进空间非常令人兴奋。
第四个问题,我们请智脑给大众点评写了一份。
这其实就是大规模模型应用中最商业化想象的功能部分——文案生成。
如上图所示,智脑做得非常好。
除了社交网络文案,智能大脑还可以生成旅游指南等需要一定逻辑思维链的内容。
据美国知名风险投资公司A16Z测算,美国人工智能在文案生成领域的应用年收入已超过1亿美元。
这是一条已经被证明行得通的赛道,当然也是大型模型的必争之地。
,智脑在这方面已经展现出了自己的一流实力。
最后一个问题具有中国特色。
我们想看到智脑对中国博大精深、独特的传统文化的理解。
我们试图询问智闹对鲁王心学的看法以及它与程朱理学的区别。
智闹的回答相当出色。
除了中国传统哲学之外,中国的诗词歌赋也是大脑非常熟悉的。
比如它把李白最好的诗选为《将进酒》,它对中国古诗词所代表的意义和形象的理解同样准确。
上述问题有的需要较强的逻辑思维能力,有的需要大模型本身了解人类特有的幽默感,有的需要熟悉中国传统文化背景。
与一般问题相比,它们都有一定的难度,而且从智能大脑的表现来看,其理解度和完成度可以说是相当高的。
这呼应了我们最初的观点:智能大脑已经脱离了搜索的附属功能定位,成为了一个独立的产品。
事实上,智脑的更新不仅限于以上内容。
作为一个大型多模态模型,智脑还可以在聊天对话过程中直接生成图片。
更专业的是使用宏图这个专门用来生成图片的大模型产品。
下图中的提示词是一个在戈壁滩上游泳的侦察机器人。
超人穿越宇宙。
还有凡尔赛宫前杂耍的小丑。
可见宏图在文本理解和生成能力方面也达到了非常不错的水平。
为什么?从文字到图片,智脑在一个月的时间里经历了快速的演变,并推出了相当完整的产品组合。
速度并不能令人满意。
中国用户或许已经习惯了这种快速的产品落地,尤其是chatGPT推出后周鸿祎对AI的密集点评,这在一定程度上让人忽视了大型模型从训练、推理到产品化的实际落地。
这是一个浩大的工程,短时间内要达到优良的品质并不容易。
这是怎么做到的?一方面,这当然与周鸿祎大力晋升“第一位置”有关。
它是国内最早意识到大模型颠覆性影响的互联网企业之一,因此制定了不走弯路全面拥抱人工智能的战略。
称之为“双飞”,即在开发核心技术的同时,加速产品在场景的落地。
你甚至可以先落地,然后优化,小步快走。
清晰的战略定位为在百款之战中赢得先发优势奠定了基础。
在产品落地时,自身在数据语料和安全方面的经验积累发挥了很大作用。
无论是杀毒软件、浏览器还是搜索产品,拥有庞大的用户基础、丰富的数据集资源、以及在安全领域积累的经验,所有这些基础优势都提供了织女训练、推理和产品上线的整个过程。
强力助力。
特别值得一提的是数据语料库。
搜索产品和浏览器多年的精耕细作,积累了大量优质数据。
其声称其数据量是第二名的2倍,是GPT-3的14倍。
智脑刚发布时,周鸿祎曾说这是一个“还没有出生证明的孩子”。
一个月后,这个用周鸿祎的话来说的“未完成版本”的迭代结果令人极为惊讶。
“出生证明”无疑是可以拿到的,而目前的重点是利用各种方法让它成长得更快更好。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-17
06-18
06-18
最新文章
首先告诉我什么是智能汽车!
盲盒明星卡的暴利与泡沫:2元卡卖700万,直播卖卡月入百万
黑色星期五轰轰烈烈地回来了,结果这些中国企业扛起了全场
锂电池隔膜疯狂扩产:兴源材料欲夺回C位?
当我考上缅语专业时:凌晨三点我还在走廊里背单词,毕业后,我不仅仅是一名翻译者
被遗弃,被收获?老年人上网到底有多难?
海外日报 -今年,我国自主研发游戏海外实际销售收入实现两位数增长;三星电子正式成立机器人业务团队36氪海外·15分钟前
腾讯音乐:爱、相信、坚持