Cadence和Synopsys的5nm全流程设计工具已获得三星认证,可用于5nm生产线
06-06
没想到雷锋网的编辑花一元钱试用了XX部批准的合法“国际浏览器”,可以阅读海外版总裁。
说起来实在是有点“丢脸”。
毕竟,我不再是一个18岁爱幻想的女孩,而是一个经历过生活煎熬的群居动物。
事情是这样的,日前,阅文集团与国内人工智能公司彩云科技合作的30本AI在线翻译作品在阅文海外门户Webnovel上线。
AI也来参与网络文章的翻译。
看来,继AIPK速记员、AI变脸“威胁”演员之后,AI又触动了我们精神文化生活的另一个领域。
这30篇靠AI走向国际的网络文章就是我前面提到的霸道总裁文章,而且也是女性向的。
emmm,环顾四周,《豪门谋妻》《豪门千金重生之赚大钱》《乔先生撩妻上瘾》。
。
。
布布散发着难以抗拒的总裁魅力。
试水 巴总的文章虽然看起来不是小菜一碟,但其翻译却“非常棒”。
如果以翻译质量满分来衡量,AI翻译的这些作品可以达到80~85分,相当于专业翻译的水平。
彩云科技运营商负责人张可馨表示,此次合作推出的30篇AI翻译的网络文本属于现代言情类,现在比较流行,也很容易翻译。
它们非常适合用作测试AI海外在线文本翻译的第一步。
。
此次合作,阅文提供语料库、修订词汇、用户反馈,彩云进行语料库训练、词汇提取、模型部署,都安排得很好。
起点国际与“彩云小译”联合开发的AI翻译模型,可以比人工翻译快千倍地翻译普通难度的文本。
同时,在翻译质量控制方面,阅文集团的编辑和智能技术团队联合彩云小译的算法工程师对AI模型进行密集的“专项训练”。
过往的优秀翻译、原创的经典网络文本、标准的核心词汇,都是AI学习的语料库。
此外,网上报道称,“双方在训练AI模型时还加入了‘翻译风格’选项,方便准确呈现男性视频、女性视频,甚至不同类别作品的风格。
”风格要求,AI可以将同一句话翻译成多种不同的方式呈现,这是一个引人注目的功能,雷锋网了解到,该功能尚未正式上线,是一个“尚待推出”的模块。
哪里缺少“分”?正如翻译人员的翻译能力受到自身知识的限制一样,AI模型能够实现的能力范围也受到语料库范围的限制。
对于语料库中很少见但相对简单的表达方式,AI可以根据自己所学的语料库“猜测”出正确的翻译。
然而,当遇到更迂回的表达方式时,比如语料库中从未出现过的成语,AI可能会猜错。
性会变得更大。
彩云科技算法工程师毛世谦举例提到:“燃灯如豆”,意思是灯的火焰很小,而不是说火焰像豆子。
如果这个词没有出现在语料库中,那么AI只能翻译字面意思。
公开资料显示,阅文团队基于自然语言理解技术对网络内容进行了深度挖掘。
通过对大量在线内容和优质社区内容的清洗、训练和标注,机器可以更好地理解在线内容并构建阅文自己的内容。
脑。
基于阅文内容大脑,阅文智能可以从网页文本中提取一些专有名词,还可以自动识别角色(人名)、场景(地名)等结构化信息,升级系统构建知识图谱整个网页文本。
基于这些信息的补充,AI翻译目前能够更好地翻译网络文本特殊领域的词、句、段,包括作品中的人名、地名,以及“金蛋”等专业词。
网络作品的核心要素。

有名词,识别各种代词所指对象,尽可能避免传统机器翻译中“一字多译”、“大冠弱头”的现象。
看来阅文正试图用更多的语料来“喂养”他的伙伴们的AI模型。
在构建这个AI模型的过程中,毛士谦遇到了三个困难:一是正确完成句子结构。
文学作品中的一些句子结构复杂或元素缺失,AI需要找到正确的主宾关系。
“还是早点回家比较好。
”AI看到这句话可能会有些困惑。
他必须努力找出主题是“我”还是“你”。
其次,名称指的是统一。
一个角色可以有多个名字。
例如,一个角色可能被命名为“七月”,并且还有“小七”和“月月”等多个昵称。
AI需要知道这些名字指的是同一个人,否则这三个翻译名字在英文中就显得不相关了。
AI不会被这个名字弄糊涂,但读者会立刻感到困惑。
(说实话,像我们这样紧张的读者在亲自阅读文本时可能会变得“脸盲”。
)AI也需要知道。
角色的性别,以便正确使用人称代词。
就拿“霸王篇”来说吧:冷半夏整个人靠在顾瑾白的怀里,苍白的脸上带着放大的笑容,看着冷可欣,比划着嘴:你完了!冷半夏靠在了顾瑾白的怀里。
她苍白的脸上带着放大的笑容,看着冷可欣。
她嘟囔道:“你完蛋了!”上面加粗的部分是基于AI对冷半夏是女性的认识。
只有这样才能正确翻译结果。
三是行文风格统一。
前一句是言情小说的风格,下一句是科幻小说的风格,分分钟让读者过瘾。
AI需要保证作品的翻译风格一致、与作品本身的类别一致。
AI的翻译还有进步的空间。
毛世谦表示,在Transformer模型的基础上,目前可以引入对抗性训练、模型蒸馏等改进技术,以及利用非对齐语料预训练来提高翻译质量,比如BERT、 MASS等,但目前所有的翻译模型本质上都是基于大数据的拟合,机器无法像人类一样真正理解文本。
AI的有力助力 虽然AI的翻译暂时还不如人类那么“机智”,但已经对网络文章出海领域产生了非常大的推动力。
艾瑞咨询发布的报告称,海外在线文本读者对在线文本翻译质量相对满意,但更新速度有待提高。
在这样的背景下,能够达到85分的AI翻译不得不说是很好的满足了需求。
看到这一需求后,国内内容平台阅文、掌阅都加紧了网络文章海外输出的计划。
在阅文与彩云科技联合推出30部AI翻译的网络作品试水之前,2019年11月成立的维文科技经过9个月的数据积累,于2018年7月推出了网络文学人工智能翻译系统。
。
今年3月,推特科技完成了1万元Pre-A轮融资,Wifi万能钥匙、联商文学、联想之星跟投。
它还依托拥有内容资源的平台,将网络文学拓展到海外。
据推特科技接受小凡主采访时表示,人工翻译文字需要一小时,而AI的单片机只需要一秒钟。
成本也降低到原来的1%。
一名专业翻译翻译1万字需要20万元,而AI只需要不到1万元。
毛世谦向雷锋网证实了这一说法,并表示:“只要有足够的钱,购买更多的显卡来部署翻译模型,速度可以是无限的。
即使只有一张显卡,它的翻译速度也比人类快一千倍。
”雷锋网发现,在AI的翻译网站中,推特科技和彩云科技目前只能将中文翻译成英文,但这只是语料库有多少的问题。
张可馨表示,要达到85分的准确率,需要大量的时间。
需要大量的小语言的语料库,有足够的语料库(几千万个句子),基本上几个月就能训练出AI翻译的特定语言类型。
这个人说得对,翻译AI网络文章极其熟练,是一位从海外归来的男性算法工程师,他每个月都不会看这篇网络文章,但海外却有无数人在等待他。
AI朋友翻译的网文文章转载自雷锋网,如需转载请前往雷锋网官网申请授权。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态