打造德国版“去哪儿”,Omio获新一轮1亿美元融资
06-18
人们最担心的事情发生了。
当一位网友在New Bing上提问时,答案存在事实错误。
当他点击参考链接时,他发现作为引用来源的知乎答案也是由人工智能生成的。
回头看这个知乎账号,词句都充满了AI味道,回答速度快如闪电。
它已被禁止。
已经看到的冰山一角指向了一个恶性循环:人工智能产生错误的信息,然后这些信息被输入到更多的人工智能中,导致互联网上的信息质量越来越差。
但说实话,污染互联网并不完全是人工智能造成的。
人工智能欺诈是惊人的。
生成式人工智能有可能输出错误信息。
这是一种刻在DNA中的慢性疾病。
互联网可以缓解一些症状,因为可以参考多个信息源。
然而我们没想到,我们这么快就陷入了一个新的世界。
混沌就像古老的计算机座右铭:垃圾进来,垃圾出去。
AI正在悄然创造出越来越多的“假”产品,也许你在上网时也遇到过它们。
国内外已发生多起人工智能假新闻事件。
今年4月,多达21个账号同时发布了一条恐怖消息:甘肃一列火车撞倒一名筑路工人,造成9人死亡。
网警初步判断该信息不实,针对深圳一家自媒体公司。
经过收集证据,他们发现犯罪嫌疑人在全网搜索近年来的热门社会新闻,并通过ChatGPT进行修改和编辑,并多次上传内容。
国外知名科技媒体CNET年初也被曝利用AI秘密生成文章,其中77篇文章存在不少错误。
新闻可信度评级机构NewsGuard甚至发现7种语言的49个新闻网站的内容大部分或完全由人工智能生成。
他们“同门出身”却各有千秋。
有的捏造虚假信息,有的重写其他媒体报道。
其中,产量最高的每天发表数百篇文章。
最有趣的是,NewsGuard 通过搜索常见的 AI 短语(例如“作为 AI 语言模型”)发现了这些网站。
连AI的标语都不删,脏活累活太粗暴了。
如果你在社交媒体和评论网站上寻找类似的内容,你也会发现不假思索地复制人工智能的账号已经流行起来。
亚马逊上关于吸尘器的虚假评论并不神秘:“作为一个AI语言模型,我没有亲自使用过这款产品,但根据它的功能和用户评论,我可以自信地给它5颗星。
” AI欺骗人的方式如此诚实,背后的理由也很暖心。
不仅是文本,图像和视频的深度伪造也变得越来越复杂。
穿羽绒服的教皇被认为是第一个真正大规模的人工智能虚假信息案例,当时在 Twitter 上的浏览??量达到了数万次。
后来在图片下方添加了“AI生成图片”的描述。
更多的模仿随之而来。
特朗普下乡再就业,街头拉黄包车;外星人经历了生活,整天工作,然后深夜喝醉……更重要的是,人工智能被用来生成“新闻图片”来结论性地描述不存在的历史。
TikTok上的“汤姆克鲁斯”太假了,我看了都觉得很困惑。
风险不一定就在屏幕对面,它们可能已经潜伏在您身边。
今年4月,科技专栏作家乔安娜·斯特恩进行了一项实验,录制了30分钟的视频和2小时的音频,然后用AI克隆了自己。
甚至欺骗了银行和她的家人。
人工智能让我们对那些曾经不容置疑的事情产生了基本的警惕感。
当你连接到互联网并且你和人工智能都在消费人工智能生成的内容的时刻已经到来。
人工智能污染不仅影响现在,还可能对未来产生偏差。
这些就是AI污染互联网的现状,未来的发展可能更加令人不安。
人类受到打击的同时,回旋镖也会打击人工智能。
英国和加拿大的一项研究发现,随着人类越来越多地通过人工智能生成内容,其中大量内容将进入在线数据库并用于训练未来的人工智能。
如果这种情况一代代持续下去,最终会导致“模式崩溃”。
”。
具体来说,随着时间的推移,人工智能产生的错误会不断加剧,导致下一代人工智能从这些错误中学习,对现实的感知更加错误,并很快忘记大部分原始数据,无法区分事实与虚构。
研究人员做了一个形象的比喻:就像让塑料垃圾遍布海洋、让二氧化碳占领大气层一样,我们即将让互联网充满废话。
因此,通过从互联网上抓取数据来训练新模型将变得更加困难。
更糟糕的是,内容平台计划筑墙,为免费、高质量的公共数据设置障碍。
前段时间,“美国贴吧”Reddit 计划对 API 进行收费,因为他们的内容被用于 AI 训练。
ChatGPT 和 Google Bard 此前曾抓取过 Reddit 的数据。
Reddit的首席执行官表示,Reddit的语料库非常有价值,他们不想将这些内容免费提供给巨头。
Reddit 的 API 收费对 OpenAI 和 Google 等老牌玩家影响不大,但对 AI 初创公司来说,获取数据会更加困难。
那些长期依赖Reddit的第三方应用程序受到了这次变化的牵连,并率先宣布崩溃。
在业务方面,Reddit 可能正在试图自救。
过去盈利主要依靠广告,但AI挖掘了Reddit数据的商业价值。
其他UGC内容平台可能也在考虑,这对于很多AI初创公司来说并不是一件好事。
开放数据并不是唯一的挑战。
许多人工智能初创公司希望在金融、医疗等领域建立垂直人工智能模型。
然而,获得专有的训练数据集并不容易。
拥有这些数据的企业更愿意与大型科技公司建立合作关系,因为巨头的可信度更高,数据处理方式更好,数据安全性也更好。
高质量的数据是AI模型的护城河,但获取数据或多或少已经成为一场利益博弈,将互联网分割成孤岛,或者干脆上演基于代际投资的军备竞赛。
一方面,互联网的内容本来就参差不齐;另一方面,互联网趋于封闭。
未来各家公司的AI如何接受高质量的内容训练和微调,已经成为一个悬而未决的问题。
至少在互联网数据方面,AI或许真的可以“自给自足”。
剑桥大学教授罗斯·??安德森指出,目前大多数网络文本都是人类编写的,但它们已被用来训练 GPT-3.5 和 GPT-4。
未来,越来越多的文本将由大型语言模型编写。
那么,如何防止人工智能生成的内容质量一代一代下降呢?英国和加拿大团队提出了两种方法。
一是保留原始数据集的副本,避免其被人工智能生成的数据污染,然后基于这些数据,可以定期重新训练模型或从头开始刷新模型。
第二个是将新的、干净的、人类生成的数据集重新引入模型训练中。
然而,这是假设有一些可行的方法来区分人工智能和人类生成的内容。
ChatGPT的数据来源截至2019年9月,在此之前的互联网可能是最后的净土。
从此,我们步入了一个暗流汹涌的世界,困难摆在面前,对策悬而未决。
人工智能被用来制造垃圾,本应提高互联网的下限。
然而,人工智能不应该为互联网的污染承担全部责任。
事实上,应该用AI来提高互联网内容的下限。
在ChatGPT的前身GPT-3时代,就已经有人将其用作书写工具了。
人工智能从一个新奇的玩具转变为提高生产力的工具是必然趋势,因为它学到了大量的知识,并且擅长编写条理清晰的文章和代码。
如果是人工审核和编辑的话,其实已经比很多“内容农场”的质量要高了。
“内容农场”是指通过快速生产内容来赚取流量和广告费的网站。
此类网站通常找不到作者,夹杂大量广告,占据搜索页面前排。
大部分内容缺乏原创性,无法保证真实性。
很可能是盗用或拼凑别人的文章,出处不明、质量差、翻译差。
准确性等问题。
现在,人工智能正被用来创建新的内容农场。
这是人类为了自身利益的选择。
除了各种假新闻、假图片之外,电子书网站、科幻杂志投稿等也充斥着AI大量生产的垃圾。
软件工程师 Chris Cowell 花了一年多的时间编写了一份技术指南。
结果,在这本书出版之前,亚马逊上就出现了一本关于同一主题的人工智能生成的电子书。
他担心的不是销量,而是这种低质低价、省时省力的AI写作,会对同样打算写小众书的人类产生“寒蝉效应”,减少他们的阅读量。
写作的热情使他们不愿意说出来。
人工智能初创公司Hugging Face首席伦理科学家玛格丽特·米切尔警告说,随着人工智能产生越来越多的内容,我们可能会读到很多不真实的内容,而无法追踪真相。
这就像一个由人工智能主导的“后真相世界”。
“后真相”是指客观事实在塑造舆论方面的影响力不如诉诸情感和个人信仰。
它被《牛津词典》 评选为年度词汇,至今仍然具有现实意义。
前段时间,路透社对超过9.3万名成年人的调查发现,越来越多的年轻人正在使用TikTok来观看新闻。
至于内容的可信度如何,那就要打一个问号了。
最近,TikTok传播了泰坦尼克号从未沉没的理论。
有道理,有理有据,但这只是一个阴谋论。
有人用魔法打败魔法,并制作了视频辟谣。
关注度不低,但没有传出谣言。
一位研究泰坦尼克号60年的专家感叹:“看到这么多垃圾出现,有点令人沮丧。
”更让他担心的是,这类内容的受众包括很多青少年,他们使用TikTok的时间越长,就越相信自己所看到的,然后算法会推荐更多相关内容,让他们欣喜若狂,彻底包围他们。
更多类似的趋势正在显现。
断章取义、碎片化的信息在社交媒体上流传,但严肃的内容可能会被评论为“太长,难以阅读”。

短视频的粗制滥造,促使了新“黄色新闻”的兴起。
它们可能是昙花一现的摆拍照片,也可能是没有营养的轶事,让人想说“没有新闻就发不了”。
小帅的5分钟美式电影解说是一道适合吃的“电子泡菜”。
空镜头和过渡并不重要。
只需给角色贴上标签,然后选择最好奇或最悬疑的情节来解释即可。
因此,在ChatGPT之前,互联网已经降级了。
这不仅与具体内容有关,还与用户的媒体使用习惯有关。
如果用人工智能来加速这个过程,然后通过这些数据进行训练,那么人类将更加无法抵抗污染。
严肃的内容和通俗的内容都有观众,都值得制作。
问题的核心不在这里。
尼尔·波兹曼在电视时代警告说,媒体社会面临的最大问题不是电视为人们提供娱乐内容,而是所有内容都以娱乐的形式呈现。
与纸质媒体的严肃、有序相比,电视等大众媒体传递信息的速度是即时的。
如果沉迷于科技创造的视觉快感,观众可能会逐渐失去独立思考的能力。
网络时代仅此而已。
生产和消费视觉、简短和情感内容的倾向为人工智能污染互联网创造了肥沃的土壤,甚至使人们对虚假信息的抵抗力降低。
因此,人工智能对互联网的污染并不完全负责。
它可以用来完成更好的事情,也可以维持现状。
首先人类选择他们想要什么样的世界,然后人工智能负责放大它。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-17
06-17
06-18
06-21
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态