首页 > 科技未来 > 内容

看见专精特新的小巨人NO.04 -香农科技独家专访:上云端,让世界听到中国NLP的声音

发布于:2024-06-18 编辑:匿名 来源:网络

01 扬帆情怀,坚定信仰。

第一次见到李纪为是在人工智能小镇。

香农科技杭州新办公区。

说起他的标签,很多人可能都知道“博士最短时间从斯坦福计算机学院毕业”、“《麻省理工科技评论》35位35岁以下科技创新人士”、“《福布斯》30位30岁以下精英”等很快。

不过,相比于他酷炫的头衔,他本人却低调得多。

他更像是一位研究学者,而不是一家公司的首席执行官。

这位年轻的创业者是克劳德·香侬的嫡系弟子。

李纪为2011年从北京大学毕业,前往美国学习生物工程。

后来转向人工智能,就读于斯坦福大学,师从 Dan Jurafsky(斯坦福大学计算机科学系和语言学系主任教授),Dan 是香农的学生。

年初,李纪为回国,与北大老同学一起创业NLP(自然语言分析)领域。

这家公司就是香农科技。

对于公司名称的由来,李纪为表示,源于对信息论和创始人香农的信仰。

在攻读博士学位期间,他仔细阅读了香农里程碑式的研究论文《印刷英语的预测与熵》,这是许多现代NLP理论的来源和基础。

出于对这位 NLP 先驱的敬佩,公司以他的名字命名。

也正是在这一年,香农科技迁移到阿里云,选择用数字技术来陪伴公司的成长。

和所有创业者一样,香农科技的创始团队心中怀揣着梦想,希望有一天,当人们提到香农时,除了是“信息论之父”之外,还能想到一家利用技术连接世界的科技公司。

世界——香农科技。

02 专注前沿AI技术,创造文字社会价值。

人类历史上以语言文字形式记录和传播的知识占知识总量的80%以上。

就计算机应用而言,约85%用于语言和文本信息处理。

自然语言处理是利用计算机处理自然语言的形式、声音、意义等信息,对字符、单词、句子和章节进行输入、输出、识别、分析、理解、生成和处理。

自然语言处理如何应用在我们的生活中?事实上,NLP随处可见,在我们的日常生活和工作中发挥着重要作用。

小到我们常用的翻译软件、搜索引擎、聊天机器人,NLP技术都是用来让机器理解我们的需求,然后通过计算处理,反馈给我们我们想要的答案;大到金融、司法、政务、工业、媒体等行业也都在利用该技术处理复杂的文档和文件,从海量文本中更加方便快捷地获取准确信息。

那么,NLP技术是如何实现这些应用的呢?香农科技创始人和李纪为打了一个形象的比喻:就像小学生通过学习基础知识、训练学习方法达到了大学生的水平。

掌握了这些理论和操作技能后,他投身于各行各业的工作。

通过一定时间的工作实践和刻苦学习,他已经成长为某个垂直领域的“小专家”。

过硬的技术和行业经验的积累,让他在自己的行业里游刃有余。

从技术角度简单概括一下,就是用算法构建“大学生”模型。

通过垂直领域小样本数据的持续训练,掌握相关知识和能力,成为高效、优质的生产工具。

李纪为用香农智能写作产品——火龙果写作进行演示:网络小说作者完成基本框架和初步内容准备后,系统可以根据当前写作内容理解和分析文章类型和主题,并自动推荐相关内容文具;小说完成后,还可以帮助作者进行100多种纠错检查,如语法纠错、事实检查、上下文一致性检查、标点格式检查等,不漏掉任何错误;当创作遇到瓶颈时,可以根据当前内容自动生成原始剧情以供继续。

除了文学创作之外,该产品还可以根据关键信息描述辅助创作不同风格的文字,比如学术风格、公文风格、社交媒体风格等,简直就是文字写作的全能手。

据悉,火龙果写作已成为不少学生党和文学工作者首选的“智能助手”。

短短一年时间,注册用户就实现了10%的快速增长。

此外,香农科技也将科技广泛应用到各行各业。

其自主研发的微数据、舆情监测系统、智能公文处理平台、智能问答引擎、智能数据管理平台广泛应用于金融、司法、政务、新闻出版、教育等行业,遍地开花。

以金融行业为例,金融信息智能服务平台“简微数据”可以分析资本市场信息和事件知识图谱,提供高效便捷的A股、三板、港股、美股、债券信息等信息公开检索服务、HTML格式在线阅读比对、表格修复等信息服务;舆情数据平台可以依靠自主研发的爬虫系统,每天24小时抓取网络新闻,同时利用分词算法、命名实体识别、文本分类、情感分析等,对抓取到的新闻进行各种行业标签标签,从数据采集到知识分析,满足客户不同的舆情分析需求,为企业、金融机构、政府等行业提供一站式舆情数据知识处理服务。

香农科技业务负责人告诉我们,在实际应用过程中,一个商业模式或者一个解决方案可以帮助客户企业降低至少70%到80%的人力成本。

以司法部门的文件为例。

司法机构一年会拥有数十万份文件。

传统的工作模式是人工阅读、组织和分发系统提案。

由于学科门类多、涉及多个领域、人员知识背景不同,效率低下且容易出错。

这几乎是一项大量的工作。

针对人工神经网络计算的连续、大规模深度学习场景,Shannon使用了阿里云推荐的GPU实例和AMD实例。

采用对象存储OSS,数据层面互联互通,满足海量训练数据的低成本存储和访问需求;利用EMR服务对数据进行预处理,提高分析效率;云监控服务用于监控GPU资源。

报警,整个过程更加安全稳定;在ECS、负载均衡、弹性伸缩、资源编排资源的支持下,香农科技在云端快速构建了完整的AI深度学习业务体系。

2020年7月,香农科技为杭州市余杭区人大办公室开发了“余杭区人大建议智能分发平台”。

原本人工需要3分钟的信息处理工作只用了0.35秒就完成了,总时间比原来的人工处理8个小时减少了。

工作时间缩短至5分钟,准确率达到90%以上,极大提升了余杭区人大票据处理效率和服务能力。

这种利用“AI提速”的场景,在银行、券商、媒体等行业也能看到。

在这条“AI加速”的道路上,香农科技也获得了国内外行业的广泛认可。

2017年,香农科技荣获达沃斯世界经济论坛“全球科技先锋”、IDC中国金融科技50强、德勤高科技高成长中国50强、福布斯中国企业科技50强等多项荣誉,并于1月荣获当年,获得北京首批专精特新资格。

这些成果都是基于香农科技多年来在NLP技术上不断的自研和创新。

2017年至今,发表顶级会议论文50余篇,核心专利70余项;仿照汉语独特的特点,整合汉字字形和拼音信息;提出了基于机器阅读理解的实体关系联合抽取方法,并取得了国际最好的结果;基于机器阅读理解的命名实体识别方法,大大超越了此前的世界最好成绩;基于大规模图神经网络的语义理解模型,将图结构与预训练相结合,大大提高了模型的语义理解能力。

在自然语言处理、深度学习、知识图谱等领域……香农依托多项拥有自主知识产权的领先技术,打造以自然语言处理为核心的全流程智能计算平台。

03 云上创新,助力中国NLP做强 谈起最初的创业选择,用李纪为自己的话说:将自己的代码变成实际应用,是每个技术人的理想。

“要将研究模型转化为实用工具,科学不仅仅是纸上谈兵,它必须应用于实际过程。

”近年来,自然语言处理发展迅速。

2009年,Google提出了一种新的自然语言处理模型架构——Transformer;从2000年到2016年,大规模预训练模型BERT和GPT相继被提出。

大规模预训练模型基于Transformer模型架构构建,可以利用海量无限数据。

带注释的语料库完成了预训练,建立了语料库的文本感知和知识提取,在几乎所有自然语言处理下游任务上都取得了显着的提升。

大规模预训练已经成为提升深度学习模型性能的必要模块,也是当前AI领域最热门的研究对象。

但针对中文的自然语言处理研究还很薄弱。

“与英语相比,中文的理解要复杂得多。

同一个词、词、句子在不同的语境、不同的表达方式下可能有不同的含义。

过去人工智能自然语言处理算法使用的是西方技术汉字是一种象形文字,经过长期的历史发展,每个汉字的形、音、义都可能蕴藏着深刻的含义。

” “我们之所以开始做这件事,是因为我们既然在中国做这件事,就必须推进汉语领域的研究!汉语作为世界第二大语言资源,有着更加光明的未来。

”何李纪为认为,NLP是一个广阔的市场和空间,需要更多的开发和合作来构建生态系统。

谈及未来计划,李纪为表示,未来希望进一步推进“更懂汉语”的新一代自然语言处理基础研究,打破理论与实践的壁垒,不断钻研更多原创、创新的内容。

和现实问题,加强人才培养和产学研生态系统建设,提升中文自然语言处理研究在国际话语体系中的地位做更多工作。

2017年,刚刚诞生的香农科技选择了“在云上成长”。

香农科技CTO王思宽谈到企业上云的过程,“2009年,作为一家初创公司,运营机房的成本非常高,所以我们采取了选择云厂商的方式现在看来,阿里云是一个最简单、最正确的选择,从简单的云服务器的灵活使用,到后来香农科技在ECS上自己的K8,一切都进展得很顺利。

” Cloud的架构师提议道。

为了进一步降低IT运维成本,香农科技直接采用了阿里云的AKS。

王思宽表示,“在我看来,阿里云的优势在于服务——响应非常及时,技术交流也比较完善。

阿里云能够快速为我们的需求提供答案;其次是云功能的学习支持非常省心,随着云服务不断升级完善,功能越来越强大,企业学习使用云的时间成本给了我们很大的帮助。

支持。

”04 永不止步,未来可期。

近年来,随着深度学习的广泛应用,关于即将到来的“下一代人工智能”的讨论从未停止。

但在李纪为看来,这样的讨论似乎还为时过早。

“下一代是如何定义的? ”他提出了这样的问题。

在他看来,我们还处于科技的“窄域时代”。

人工智能正在我们规定的内容内被拉伸、布局、打磨。

但未来的某一天,我们最终会突破窄域,进入“宽域时代”,这是一个值得期待的场景。

从三人到数百人,李纪为坦言。

困难不是开始,而是现在和未来,从“一个人吃饱,一家人不饿”,到团队和客户越来越多,每一小步都是退一步,也是一大步。

是对未来趋势、风险与机遇的预测,肩负着全体员工和客户的信任,这个“困难”是每个创业者共同的心路历程,无论是“元界”还是“下一代人工智能”。

“聪明”,他们没想那么多。

看见专精特新的小巨人NO.04 -香农科技独家专访:上云端,让世界听到中国NLP的声音

选择赛道不仅关乎自己的兴趣,也关乎其业务能力。

Shannon更关心的是专注于自己行业的一些顶尖技术并依靠团队的力量研究一代技术或者推广一代技术,为最新的研究成果找到实现突破的场景,并真正造福社会。

数字技术伴随着企业的成长。

至此,阿里云的底层技术和产品一直在与香农一起前进。

现在,这条路还将继续走下去。

点击了解更多关于专精特新资助计划的信息。

看见专精特新的小巨人NO.04 -香农科技独家专访:上云端,让世界听到中国NLP的声音

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • Temu围攻亚马逊

    Temu围攻亚马逊

    当外界将Temu与亚马逊“生死存亡”的对手联系在一起时,亚马逊对待这个对手的态度却显得有些“暧昧”。 亚马逊甚至慷慨地为Temu引流。 TemuApp的下载链接发布在亚马逊的App Store中,很多评论都说价格比亚马逊便宜很多。 这种做法让人们称之为“大生意”。 努力工作多年的中

    06-17

  • 用新一代热管理加热技术推进新能源汽车,海姆霍兹获中国科创之星数千万A+轮融资

    用新一代热管理加热技术推进新能源汽车,海姆霍兹获中国科创之星数千万A+轮融资

    据投资界9月17日消息,开发商海姆霍兹近日,新能源汽车传热传动系统制造商中科创兴宣布完成今年8月中科创兴投资的数千万元A+轮融资。 据悉,这是海姆霍兹今年获得的第二轮融资。 之前的投资人是国科嘉禾。 本轮融资将主要用于新工厂产能扩张和新产品研发。 中国科技创新之星

    06-17

  • SK Materials与Group 14成立锂电池硅基负极材料公司

    SK Materials与Group 14成立锂电池硅基负极材料公司

    SK集团旗下半导体和显示材料子公司SK Materials周二表示,该公司将与美国锂硅电池材料Group 14 Technologies合作供应商,在韩国设立锂电池硅基负极材料公司。 Base Anode Materials, Inc. 据韩联社报道,SK Materials 和 Group 14 将在本月晚些时候投资 1 亿韩元(7 亿美元)

    06-08

  • 日本东北强震初步判定对半导体相关生产无影响

    日本东北强震初步判定对半导体相关生产无影响

    3月16日晚,日本福岛近海发生里氏7.3级强震。 根据TrendForce的调查,日本东北地区是全球半导体上游原材料的生产中心。 根据TrendForce的调查,从地震烈度地区来看,本季度只有Kioxia位于北上的K1Fab将投产。 其他存储器或半导体公司正在部分进行机器检查。 总体来说,不会有

    06-08

  • 融金控战略入股天冶矿业,宁愿发展慢一点

    融金控战略入股天冶矿业,宁愿发展慢一点

    据投资界1月26日消息,互联网金融平台融金控宣布,近期战略入股天冶矿业。 据悉,融资资金将用于技术升级和人才奖励,完善风险控制体系,更好地服务中小企业。   金交所于2016年5月上线,是最早的互联网金融平台之一,专注于汽车金融和小额信贷业务。 迄今为止,该平台已服

    06-17

  • 卖不了衣服的美特斯邦威竟然拿卖房子当救命稻草?

    卖不了衣服的美特斯邦威竟然拿卖房子当救命稻草?

    只不过,这一次不是因为老客户木垒,也不是华丽变身的楚雨荨。 12月4日上午,美邦服饰发布正式公告称,拟将公司持有的成都春熙路核心区房产以现金交易方式出售给宁波雅戈尔服饰有限公司。 成交价格6.8亿元。 混乱之中,美国相关人士回应称,此举是为了通过盘活资产继续减少负

    06-17

  • 新能源汽车,电池“跑不了多远”,有新解决办法吗?

    新能源汽车,电池“跑不了多远”,有新解决办法吗?

    作者 |沈周表示,“电池技术”和“功率器件”是主导新能源汽车真正落地的两大制约因素。 “但这两个问题目前还没有实质性突破。 ”欣铼能源CEO叶士弘告诉创头条,“欣铼能源成立于2016年,专注于新能源电池的研发。 我们对行业进行了三年的探索,发现现阶段新能源汽车仍然没有

    06-18

  • 阿里投资VC

    阿里投资VC

    据投资界3月14日消息,苏州阿米巴创新创业投资合伙企业(有限合伙)近日进行工商变更,新增阿里巴巴(中国)网络技术有限公司。 、苏州阿米巴管理咨询合伙企业、杭州阿米巴星阳股权投资合伙企业、阿里巴巴(中国)网络科技有限公司、成都天府一号文化创意产业发展股权投资基

    06-17

  • 冯仑:有了这样的制度环境,创新只是“副产品”

    冯仑:有了这样的制度环境,创新只是“副产品”

    近日,万通集团创始人冯仑在WISE超级进化者大会上谈到创新时表示,个人驱动力是一方面,外部的制度环境也很重要。 冯仑表示,必须有一个允许民营企业存在的制度环境,企业才愿意创新。 比如,土地1-2年不开发就被拿走,比如加大健康住房的投入,但登记价格和不创新一样,企业

    06-18

  • 「纽迈医疗」获超1亿美元C轮融资

    「纽迈医疗」获超1亿美元C轮融资

    上海纽迈医疗科技有限公司宣布完成超1亿美元C轮融资。 本轮融资由淡马锡领投,云锋基金、Become Venture Partners Fund及老股东奥博资本(OrbiMed)、大辰资本、博源资本、张科毅、君紫投资等跟投,皓月资本担任跟投本轮融资独家投资方。 本轮融资公司将用于加速结构性心脏病

    06-17

  • 阿里云VMware云解决方案已开始邀请客户测试

    阿里云VMware云解决方案已开始邀请客户测试

    2月24日,据云栖社区开发者发帖称,阿里云与全球虚拟化厂商VMware合作的解决方案已开始邀请客户测试客户正在进行小规模测试,预计很快就会进行测试。 即将开放测试版。 这意味着双方战略合作进入实施阶段。 去年9月的杭州云栖会议上,阿里云与VMware达成战略合作。 双方合作提

    06-17

  • 网易云音乐寻求在香港联交所上市

    网易云音乐寻求在香港联交所上市

    网易云音乐寻求在香港联交所上市。 已经有了实质性进展,明年大概率会正式提交IPO。 (财联APP)听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立即参与调查并获得礼物。

    06-17