首页 > 科技未来 > 内容

AI翻译的30篇女性总裁文本长啥样

发布于:2024-06-18 编辑:匿名 来源:网络

没想到雷锋网的编辑花一元钱试用了XX部批准的合法“国际浏览器”,可以阅读海外版总裁。

说起来实在是有点“丢脸”。

毕竟,我不再是一个18岁爱幻想的女孩,而是一个经历过生活煎熬的群居动物。

事情是这样的,日前,阅文集团与国内人工智能公司彩云科技合作的30本AI在线翻译作品在阅文海外门户Webnovel上线。

AI也来参与网络文章的翻译。

看来,继AIPK速记员、AI变脸“威胁”演员之后,AI又触动了我们精神文化生活的另一个领域。

这30篇靠AI走向国际的网络文章就是我前面提到的霸道总裁文章,而且也是女性向的。

emmm,环顾四周,《豪门谋妻》《豪门千金重生之赚大钱》《乔先生撩妻上瘾》。

布布散发着难以抗拒的总裁魅力。

试水 巴总的文章虽然看起来不是小菜一碟,但其翻译却“非常棒”。

如果以翻译质量满分来衡量,AI翻译的这些作品可以达到80~85分,相当于专业翻译的水平。

彩云科技运营商负责人张可馨表示,此次合作推出的30篇AI翻译的网络文本属于现代言情类,现在比较流行,也很容易翻译。

它们非常适合用作测试AI海外在线文本翻译的第一步。

此次合作,阅文提供语料库、修订词汇、用户反馈,彩云进行语料库训练、词汇提取、模型部署,都安排得很好。

起点国际与“彩云小译”联合开发的AI翻译模型,可以比人工翻译快千倍地翻译普通难度的文本。

同时,在翻译质量控制方面,阅文集团的编辑和智能技术团队联合彩云小译的算法工程师对AI模型进行密集的“专项训练”。

过往的优秀翻译、原创的经典网络文本、标准的核心词汇,都是AI学习的语料库。

此外,网上报道称,“双方在训练AI模型时还加入了‘翻译风格’选项,方便准确呈现男性视频、女性视频,甚至不同类别作品的风格。

”风格要求,AI可以将同一句话翻译成多种不同的方式呈现,这是一个引人注目的功能,雷锋网了解到,该功能尚未正式上线,是一个“尚待推出”的模块。

哪里缺少“分”?正如翻译人员的翻译能力受到自身知识的限制一样,AI模型能够实现的能力范围也受到语料库范围的限制。

对于语料库中很少见但相对简单的表达方式,AI可以根据自己所学的语料库“猜测”出正确的翻译。

然而,当遇到更迂回的表达方式时,比如语料库中从未出现过的成语,AI可能会猜错。

性会变得更大。

彩云科技算法工程师毛世谦举例提到:“燃灯如豆”,意思是灯的火焰很小,而不是说火焰像豆子。

如果这个词没有出现在语料库中,那么AI只能翻译字面意思。

公开资料显示,阅文团队基于自然语言理解技术对网络内容进行了深度挖掘。

通过对大量在线内容和优质社区内容的清洗、训练和标注,机器可以更好地理解在线内容并构建阅文自己的内容。

脑。

基于阅文内容大脑,阅文智能可以从网页文本中提取一些专有名词,还可以自动识别角色(人名)、场景(地名)等结构化信息,升级系统构建知识图谱整个网页文本。

基于这些信息的补充,AI翻译目前能够更好地翻译网络文本特殊领域的词、句、段,包括作品中的人名、地名,以及“金蛋”等专业词。

网络作品的核心要素。

AI翻译的30篇女性总裁文本长啥样

有名词,识别各种代词所指对象,尽可能避免传统机器翻译中“一字多译”、“大冠弱头”的现象。

看来阅文正试图用更多的语料来“喂养”他的伙伴们的AI模型。

在构建这个AI模型的过程中,毛士谦遇到了三个困难:一是正确完成句子结构。

文学作品中的一些句子结构复杂或元素缺失,AI需要找到正确的主宾关系。

“还是早点回家比较好。

”AI看到这句话可能会有些困惑。

他必须努力找出主题是“我”还是“你”。

其次,名称指的是统一。

一个角色可以有多个名字。

例如,一个角色可能被命名为“七月”,并且还有“小七”和“月月”等多个昵称。

AI需要知道这些名字指的是同一个人,否则这三个翻译名字在英文中就显得不相关了。

AI不会被这个名字弄糊涂,但读者会立刻感到困惑。

(说实话,像我们这样紧张的读者在亲自阅读文本时可能会变得“脸盲”。

)AI也需要知道。

角色的性别,以便正确使用人称代词。

就拿“霸王篇”来说吧:冷半夏整个人靠在顾瑾白的怀里,苍白的脸上带着放大的笑容,看着冷可欣,比划着嘴:你完了!冷半夏靠在了顾瑾白的怀里。

她苍白的脸上带着放大的笑容,看着冷可欣。

她嘟囔道:“你完蛋了!”上面加粗的部分是基于AI对冷半夏是女性的认识。

只有这样才能正确翻译结果。

三是行文风格统一。

前一句是言情小说的风格,下一句是科幻小说的风格,分分钟让读者过瘾。

AI需要保证作品的翻译风格一致、与作品本身的类别一致。

AI的翻译还有进步的空间。

毛世谦表示,在Transformer模型的基础上,目前可以引入对抗性训练、模型蒸馏等改进技术,以及利用非对齐语料预训练来提高翻译质量,比如BERT、 MASS等,但目前所有的翻译模型本质上都是基于大数据的拟合,机器无法像人类一样真正理解文本。

AI的有力助力 虽然AI的翻译暂时还不如人类那么“机智”,但已经对网络文章出海领域产生了非常大的推动力。

艾瑞咨询发布的报告称,海外在线文本读者对在线文本翻译质量相对满意,但更新速度有待提高。

在这样的背景下,能够达到85分的AI翻译不得不说是很好的满足了需求。

看到这一需求后,国内内容平台阅文、掌阅都加紧了网络文章海外输出的计划。

在阅文与彩云科技联合推出30部AI翻译的网络作品试水之前,2019年11月成立的维文科技经过9个月的数据积累,于2018年7月推出了网络文学人工智能翻译系统。

今年3月,推特科技完成了1万元Pre-A轮融资,Wifi万能钥匙、联商文学、联想之星跟投。

它还依托拥有内容资源的平台,将网络文学拓展到海外。

据推特科技接受小凡主采访时表示,人工翻译文字需要一小时,而AI的单片机只需要一秒钟。

成本也降低到原来的1%。

一名专业翻译翻译1万字需要20万元,而AI只需要不到1万元。

毛世谦向雷锋网证实了这一说法,并表示:“只要有足够的钱,购买更多的显卡来部署翻译模型,速度可以是无限的。

即使只有一张显卡,它的翻译速度也比人类快一千倍。

”雷锋网发现,在AI的翻译网站中,推特科技和彩云科技目前只能将中文翻译成英文,但这只是语料库有多少的问题。

张可馨表示,要达到85分的准确率,需要大量的时间。

需要大量的小语言的语料库,有足够的语料库(几千万个句子),基本上几个月就能训练出AI翻译的特定语言类型。

这个人说得对,翻译AI网络文章极其熟练,是一位从海外归来的男性算法工程师,他每个月都不会看这篇网络文章,但海外却有无数人在等待他。

AI朋友翻译的网文文章转载自雷锋网,如需转载请前往雷锋网官网申请授权。

AI翻译的30篇女性总裁文本长啥样

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • Cadence和Synopsys的5nm全流程设计工具已获得三星认证,可用于5nm生产线

    Cadence和Synopsys的5nm全流程设计工具已获得三星认证,可用于5nm生产线

    三星代工已认证Cadence和Synopsys的全流程工具,该工具采用极紫外光刻(EUV)5LPE(5nm低功耗早期消耗)工艺技术。 芯片开发人员需要全流程设计工具来快速为先进节点创建高效且可预测的芯片设计。 三星对采用 Arm Cortex-A53 和 Arm Cortex-A57 内核的 5LPE 技术的 Synopsys

    06-06

  • 德方纳米拟发起设立总规模6亿的产业投资基金

    德方纳米拟发起设立总规模6亿的产业投资基金

    据投资界(ID:pedaily)7月25日消息,7月21日,深圳市德方纳米科技有限公司发行关于设立产业投资的公告 基金及关联交易公告:为充分整合和利用各方优势资源,进一步强化与主营业务相关的产业链战略布局,深圳市德方纳米科技有限公司德方(天津)私募股权投资基金管理有限公司

    06-18

  • 欧若数据网络获800万美元Pre-A轮融资

    欧若数据网络获800万美元Pre-A轮融资

    投资界6月5日获悉,据36氪报道,图数据库开发商欧若数据网络科技有限公司(以下简称“欧若数据网络”)欧若数据网”)已完成百万美元Pre-A轮融资。 本轮投资方为红点创投中国基金和经纬中国。 本轮融资将主要用于最新产品2.0版本的开发以及全球市场拓展。 图数据库是专门为处

    06-18

  • 创业板上市委员会:比亚迪半导体等3家公司27日首发

    创业板上市委员会:比亚迪半导体等3家公司27日首发

    创业板上市委员会消息:北京中科润宇环保科技有限公司、比亚迪半导体有限公司、河北工业大学科亚能源科技有限公司第一次会议将于1月27日召开。

    06-18

  • 上海:共发放“复工证明”5851张、“通行证”87766张

    上海:共发放“复工证明”5851张、“通行证”87766张

    36氪获悉,在5月2日举行的上海疫情防控新闻发布会上,上海大院副委员书记邵军数据中心介绍 为稳步推进复工复产,加强电商平台、快递等行业健康管理,市大数据中心推出“复工人员复工电子通行证” 》(简称《复工证明》)和《上海市保证投递人员通行证》和《邮政快递公司投递人

    06-18

  • 射频芯片公司矽典微完成新一轮数千万元融资

    射频芯片公司矽典微完成新一轮数千万元融资

    据投资界3月5日消息,据36氪消息,智能毫米波传感器公司矽典微宣布已完成新一轮融资本轮融资金额数千万元。 本轮投资方未披露。 此前,公司已获得中科创兴等数千万元Pre-A轮融资。 本轮融资将用于引进高端人才、投入研发、开拓市场和支持产品量产运营,加速毫米波系统芯片技

    06-18

  • 线性资本在常州设立总规模6000万美元的QFLP基金

    线性资本在常州设立总规模6000万美元的QFLP基金

    ????????? ??~?–?'?????????????????????…???????????o??€?? ??????????????...?????????QFLP??o?'???o?'???????o????????–??o??? ? ?–????–??€??–?”??‰????–—?‰¢????????????“? ?–??? ~??????o??€?????????o?'?????o?'???a???€?¥? ??–???????a€???????

    06-17

  • 打造出“买iPhone拿百亿补贴”之后,拼多多想要在美妆行业打造几款欧莱雅产品

    打造出“买iPhone拿百亿补贴”之后,拼多多想要在美妆行业打造几款欧莱雅产品

    对于很多福建运动鞋代工来说,有两个选择。 一是继续做OEM。 二是打工或者做假生意,二是打造自己的品牌。 在国际分工体系中,大部分利润都归品牌商所有,而整车厂获得了一小部分利润和大部分污染。 很难说产业链、加工技术或品牌哪一环节最难追赶。 但对于中国制造业来说,从

    06-21

  • 4月份中小企业发展指数为88.3,已连续三个月下降,

    4月份中小企业发展指数为88.3,已连续三个月下降,

    上头条 中国中小企业协会官网5月9日发布的信息显示,4月份中小企业发展指数为88.3,连续三年下滑连续几个月。 衰退。 具体来说,4月份国内疫情导致不少企业停工停产。 加之乌克兰危机持续、全球通胀等因素,经济发展面临更多困难和挑战。 4月份中小企业发展指数为88.3。 在环

    06-17

  • 杨元庆:推动中国制造产业升级离不开“新IT”

    杨元庆:推动中国制造产业升级离不开“新IT”

    造头条“推动中国制造产业升级离不开“新IT”基础设施的支撑和赋能作用。 今天上午,联想集团董事长和首席执行官杨元庆在听取政府报告后表示。 他认为,加快数字经济与实体经济深度融合、推动中国制造业产业升级,离不开“新IT”基础设施的支撑和赋能作用。 但这里的IT不再是

    06-18

  • 中国版Alphago只是另一个“民科”的故事吗?

    中国版Alphago只是另一个“民科”的故事吗?

    《神雕侠侣》结尾,我们看到一群武功差但自尊心很高的人跑到华山“论剑”,但原型出现在杨过这样一个真正的高手面前。 这其实并不奇怪。 想要成名,挑战天下第一武功,是最容易的事情。 人总得有一些梦想,万一梦想成真。 近期,人工智能领域也发生了类似的事情。 不不不,我

    06-18

  • 四维纵横完成超亿元B轮融资,由用友软件、顺义产业基金领投

    四维纵横完成超亿元B轮融资,由用友软件、顺义产业基金领投

    投资社区(ID:pedaily)据10月19日消息,新一代超融合数据库厂商四维纵横近日宣布完成数亿元融资。 B轮融资,本轮融资由用友软件、顺义产业基金领投,广州同创基金跟投。 目前,SiDZongheng打造了主打“分析、事务、计时”的一体化超融合数据库YMatrix。 以此为核心,拥有自

    06-18