首页 > 科技未来 > 内容

看见专精特新的小巨人NO.04 -香农科技独家专访:上云端,让世界听到中国NLP的声音

发布于:2024-06-18 编辑:匿名 来源:网络

01 扬帆情怀,坚定信仰。

第一次见到李纪为是在人工智能小镇。

香农科技杭州新办公区。

说起他的标签,很多人可能都知道“博士最短时间从斯坦福计算机学院毕业”、“《麻省理工科技评论》35位35岁以下科技创新人士”、“《福布斯》30位30岁以下精英”等很快。

不过,相比于他酷炫的头衔,他本人却低调得多。

他更像是一位研究学者,而不是一家公司的首席执行官。

这位年轻的创业者是克劳德·香侬的嫡系弟子。

李纪为2011年从北京大学毕业,前往美国学习生物工程。

后来转向人工智能,就读于斯坦福大学,师从 Dan Jurafsky(斯坦福大学计算机科学系和语言学系主任教授),Dan 是香农的学生。

年初,李纪为回国,与北大老同学一起创业NLP(自然语言分析)领域。

这家公司就是香农科技。

对于公司名称的由来,李纪为表示,源于对信息论和创始人香农的信仰。

在攻读博士学位期间,他仔细阅读了香农里程碑式的研究论文《印刷英语的预测与熵》,这是许多现代NLP理论的来源和基础。

出于对这位 NLP 先驱的敬佩,公司以他的名字命名。

也正是在这一年,香农科技迁移到阿里云,选择用数字技术来陪伴公司的成长。

和所有创业者一样,香农科技的创始团队心中怀揣着梦想,希望有一天,当人们提到香农时,除了是“信息论之父”之外,还能想到一家利用技术连接世界的科技公司。

世界——香农科技。

02 专注前沿AI技术,创造文字社会价值。

人类历史上以语言文字形式记录和传播的知识占知识总量的80%以上。

就计算机应用而言,约85%用于语言和文本信息处理。

自然语言处理是利用计算机处理自然语言的形式、声音、意义等信息,对字符、单词、句子和章节进行输入、输出、识别、分析、理解、生成和处理。

自然语言处理如何应用在我们的生活中?事实上,NLP随处可见,在我们的日常生活和工作中发挥着重要作用。

小到我们常用的翻译软件、搜索引擎、聊天机器人,NLP技术都是用来让机器理解我们的需求,然后通过计算处理,反馈给我们我们想要的答案;大到金融、司法、政务、工业、媒体等行业也都在利用该技术处理复杂的文档和文件,从海量文本中更加方便快捷地获取准确信息。

那么,NLP技术是如何实现这些应用的呢?香农科技创始人和李纪为打了一个形象的比喻:就像小学生通过学习基础知识、训练学习方法达到了大学生的水平。

掌握了这些理论和操作技能后,他投身于各行各业的工作。

通过一定时间的工作实践和刻苦学习,他已经成长为某个垂直领域的“小专家”。

过硬的技术和行业经验的积累,让他在自己的行业里游刃有余。

从技术角度简单概括一下,就是用算法构建“大学生”模型。

通过垂直领域小样本数据的持续训练,掌握相关知识和能力,成为高效、优质的生产工具。

李纪为用香农智能写作产品——火龙果写作进行演示:网络小说作者完成基本框架和初步内容准备后,系统可以根据当前写作内容理解和分析文章类型和主题,并自动推荐相关内容文具;小说完成后,还可以帮助作者进行100多种纠错检查,如语法纠错、事实检查、上下文一致性检查、标点格式检查等,不漏掉任何错误;当创作遇到瓶颈时,可以根据当前内容自动生成原始剧情以供继续。

除了文学创作之外,该产品还可以根据关键信息描述辅助创作不同风格的文字,比如学术风格、公文风格、社交媒体风格等,简直就是文字写作的全能手。

据悉,火龙果写作已成为不少学生党和文学工作者首选的“智能助手”。

短短一年时间,注册用户就实现了10%的快速增长。

此外,香农科技也将科技广泛应用到各行各业。

其自主研发的微数据、舆情监测系统、智能公文处理平台、智能问答引擎、智能数据管理平台广泛应用于金融、司法、政务、新闻出版、教育等行业,遍地开花。

以金融行业为例,金融信息智能服务平台“简微数据”可以分析资本市场信息和事件知识图谱,提供高效便捷的A股、三板、港股、美股、债券信息等信息公开检索服务、HTML格式在线阅读比对、表格修复等信息服务;舆情数据平台可以依靠自主研发的爬虫系统,每天24小时抓取网络新闻,同时利用分词算法、命名实体识别、文本分类、情感分析等,对抓取到的新闻进行各种行业标签标签,从数据采集到知识分析,满足客户不同的舆情分析需求,为企业、金融机构、政府等行业提供一站式舆情数据知识处理服务。

香农科技业务负责人告诉我们,在实际应用过程中,一个商业模式或者一个解决方案可以帮助客户企业降低至少70%到80%的人力成本。

以司法部门的文件为例。

司法机构一年会拥有数十万份文件。

传统的工作模式是人工阅读、组织和分发系统提案。

由于学科门类多、涉及多个领域、人员知识背景不同,效率低下且容易出错。

这几乎是一项大量的工作。

针对人工神经网络计算的连续、大规模深度学习场景,Shannon使用了阿里云推荐的GPU实例和AMD实例。

采用对象存储OSS,数据层面互联互通,满足海量训练数据的低成本存储和访问需求;利用EMR服务对数据进行预处理,提高分析效率;云监控服务用于监控GPU资源。

报警,整个过程更加安全稳定;在ECS、负载均衡、弹性伸缩、资源编排资源的支持下,香农科技在云端快速构建了完整的AI深度学习业务体系。

2020年7月,香农科技为杭州市余杭区人大办公室开发了“余杭区人大建议智能分发平台”。

原本人工需要3分钟的信息处理工作只用了0.35秒就完成了,总时间比原来的人工处理8个小时减少了。

工作时间缩短至5分钟,准确率达到90%以上,极大提升了余杭区人大票据处理效率和服务能力。

这种利用“AI提速”的场景,在银行、券商、媒体等行业也能看到。

在这条“AI加速”的道路上,香农科技也获得了国内外行业的广泛认可。

2017年,香农科技荣获达沃斯世界经济论坛“全球科技先锋”、IDC中国金融科技50强、德勤高科技高成长中国50强、福布斯中国企业科技50强等多项荣誉,并于1月荣获当年,获得北京首批专精特新资格。

这些成果都是基于香农科技多年来在NLP技术上不断的自研和创新。

2017年至今,发表顶级会议论文50余篇,核心专利70余项;仿照汉语独特的特点,整合汉字字形和拼音信息;提出了基于机器阅读理解的实体关系联合抽取方法,并取得了国际最好的结果;基于机器阅读理解的命名实体识别方法,大大超越了此前的世界最好成绩;基于大规模图神经网络的语义理解模型,将图结构与预训练相结合,大大提高了模型的语义理解能力。

在自然语言处理、深度学习、知识图谱等领域……香农依托多项拥有自主知识产权的领先技术,打造以自然语言处理为核心的全流程智能计算平台。

03 云上创新,助力中国NLP做强 谈起最初的创业选择,用李纪为自己的话说:将自己的代码变成实际应用,是每个技术人的理想。

“要将研究模型转化为实用工具,科学不仅仅是纸上谈兵,它必须应用于实际过程。

”近年来,自然语言处理发展迅速。

2009年,Google提出了一种新的自然语言处理模型架构——Transformer;从2000年到2016年,大规模预训练模型BERT和GPT相继被提出。

大规模预训练模型基于Transformer模型架构构建,可以利用海量无限数据。

带注释的语料库完成了预训练,建立了语料库的文本感知和知识提取,在几乎所有自然语言处理下游任务上都取得了显着的提升。

大规模预训练已经成为提升深度学习模型性能的必要模块,也是当前AI领域最热门的研究对象。

但针对中文的自然语言处理研究还很薄弱。

“与英语相比,中文的理解要复杂得多。

同一个词、词、句子在不同的语境、不同的表达方式下可能有不同的含义。

过去人工智能自然语言处理算法使用的是西方技术汉字是一种象形文字,经过长期的历史发展,每个汉字的形、音、义都可能蕴藏着深刻的含义。

” “我们之所以开始做这件事,是因为我们既然在中国做这件事,就必须推进汉语领域的研究!汉语作为世界第二大语言资源,有着更加光明的未来。

”何李纪为认为,NLP是一个广阔的市场和空间,需要更多的开发和合作来构建生态系统。

谈及未来计划,李纪为表示,未来希望进一步推进“更懂汉语”的新一代自然语言处理基础研究,打破理论与实践的壁垒,不断钻研更多原创、创新的内容。

和现实问题,加强人才培养和产学研生态系统建设,提升中文自然语言处理研究在国际话语体系中的地位做更多工作。

2017年,刚刚诞生的香农科技选择了“在云上成长”。

香农科技CTO王思宽谈到企业上云的过程,“2009年,作为一家初创公司,运营机房的成本非常高,所以我们采取了选择云厂商的方式现在看来,阿里云是一个最简单、最正确的选择,从简单的云服务器的灵活使用,到后来香农科技在ECS上自己的K8,一切都进展得很顺利。

” Cloud的架构师提议道。

为了进一步降低IT运维成本,香农科技直接采用了阿里云的AKS。

王思宽表示,“在我看来,阿里云的优势在于服务——响应非常及时,技术交流也比较完善。

阿里云能够快速为我们的需求提供答案;其次是云功能的学习支持非常省心,随着云服务不断升级完善,功能越来越强大,企业学习使用云的时间成本给了我们很大的帮助。

支持。

”04 永不止步,未来可期。

近年来,随着深度学习的广泛应用,关于即将到来的“下一代人工智能”的讨论从未停止。

但在李纪为看来,这样的讨论似乎还为时过早。

“下一代是如何定义的? ”他提出了这样的问题。

在他看来,我们还处于科技的“窄域时代”。

人工智能正在我们规定的内容内被拉伸、布局、打磨。

但未来的某一天,我们最终会突破窄域,进入“宽域时代”,这是一个值得期待的场景。

从三人到数百人,李纪为坦言。

困难不是开始,而是现在和未来,从“一个人吃饱,一家人不饿”,到团队和客户越来越多,每一小步都是退一步,也是一大步。

是对未来趋势、风险与机遇的预测,肩负着全体员工和客户的信任,这个“困难”是每个创业者共同的心路历程,无论是“元界”还是“下一代人工智能”。

“聪明”,他们没想那么多。

看见专精特新的小巨人NO.04 -香农科技独家专访:上云端,让世界听到中国NLP的声音

选择赛道不仅关乎自己的兴趣,也关乎其业务能力。

Shannon更关心的是专注于自己行业的一些顶尖技术并依靠团队的力量研究一代技术或者推广一代技术,为最新的研究成果找到实现突破的场景,并真正造福社会。

数字技术伴随着企业的成长。

至此,阿里云的底层技术和产品一直在与香农一起前进。

现在,这条路还将继续走下去。

点击了解更多关于专精特新资助计划的信息。

看见专精特新的小巨人NO.04 -香农科技独家专访:上云端,让世界听到中国NLP的声音

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 晶彩智能完成数千万元Pre-A轮融资,由中国经济合作鲁信创业投资基金

    晶彩智能完成数千万元Pre-A轮融资,由中国经济合作鲁信创业投资基金

    投资圈领投(ID:pedaily)6月20日消息,北京晶彩智能科技有限公司(晶彩智能(以下简称“晶彩智能”)宣布完成数千万元Pre-A轮融资。 本轮融资由中经鲁信创业投资基金领投,张家港沙洲科技、锦信资本跟投,耀明资本独家投资。 本轮融资资金将用于数字教育、职业肌肉骨骼健康

    06-18

  • 反对者:美国不需要巨额半导体补贴

    反对者:美国不需要巨额半导体补贴

    过去三十年来,美国在全球半导体产能中所占份额急剧下降,引发了人们对美国依赖对经济至关重要的进口芯片和国家安全的担忧。 为了扭转这种下降趋势,国会去年通过了《美国芯片法案》,并签署成为法律。 它旨在提供政府补贴,鼓励美国芯片生产,并支持半导体研发。 但直到本月

    06-08

  • 实时预览 -松鼠AI首席科学家:在超千亿的教育市场,AI扮演怎样的角色?

    实时预览 -松鼠AI首席科学家:在超千亿的教育市场,AI扮演怎样的角色?

    受地点和教师资质限制,优质教师资源一直极为稀缺,个性化教育是每个家庭的愿望。 围棋界的AlphaGo和医疗领域的IBM-Waston都展现了人工智能技术的优势。 在教育领域,教学比下围棋更难。 松鼠AI智自适应教育利用人工智能和大数据技术打造松鼠AI智自适应学习系统,结合教育学、

    06-18

  • 2023年6月融资月报

    2023年6月融资月报

    【综述】6月国内投融资情况(截至6.30 24:00)6月“融资24小时”共统计国内市场投融资事件,其中包括中小企业融资事件。 IPO上市/退市事件3起。 从领域维度分析中小企业融资事件领域分布,排名前三的分别是先进制造()、医疗健康(56)、企业服务(47)。 其中,本月有6例【

    06-18

  • 跨境MCN安哆巴完成10亿韩元Pre-A轮融资

    跨境MCN安哆巴完成10亿韩元Pre-A轮融资

    投资界(ID:pedaily)1月21日,中国宣布完成专业跨界10亿韩元Pre-A轮融资边境MCN安哆巴。 本轮投资方为韩国著名投资集团LAGUNA INVESTMENT和UNION INVESTMENT PARTNERS。 自去年10月起,韩国安哆巴MCN作为中国专业的跨境MCN企业,正式进军中国网络视频市场,旨在打通海外原创

    06-18

  • 在联想和华平投资的支持下,单次退出套现近30亿元,这家公司简直就是一台“跑印钞机”

    在联想和华平投资的支持下,单次退出套现近30亿元,这家公司简直就是一台“跑印钞机”

    【编者注】投资是一个神奇的东西,我们发现了一些鲜为人知的项目带来了十亿甚至上亿的回报,与投资逻辑和退出策略。 接下来,投资界将推出《这笔投资赚了10亿!》系列,一一解密让LP“深夜笑醒”的项目。 “时速68英里,我的狗坐在后座,收音机里播放着不知名的乡村西部音乐,

    06-17

  • 推出多平台AR系统解决方案,全视科技获数千万元A轮融资

    推出多平台AR系统解决方案,全视科技获数千万元A轮融资

    据投资界9月25日消息,据36氪报道,全视科技近期获数千万元A轮融资A轮融资,由深创投投资。 该投资由清科领投。 此前,公司已获得中科创兴领投的天使投资和君盛投资领投的PreA轮融资。 全视科技是一家致力于AR/VR领域核心传感与交互技术研发及产品实现的企业。 今年以来,全

    06-18

  • 厉害了同侪倩文!国产大模型由你决定

    厉害了同侪倩文!国产大模型由你决定

    近日,OpenAI发布了最新力作——GPT-4o模型。 没想到,此前引起全球大型模型排行榜LMSys热议的正是冠军GPT-2匿名聊天记录。 机器人。 发布会结束后,OpenAI 的 Sam Altman 在 Twitter 上盛赞其,称其为“惊人的成就”!在转发中,我们惊喜地发现,有一个名字在这份名单中脱颖

    06-17

  • 理想汽车11月交付41030辆 ,提前达成全年销量目标

    理想汽车11月交付41030辆 ,提前达成全年销量目标

    理想汽车11月销量41,030辆,提前完成全年销售目标。 2019年12月1日,理想汽车公布11月交付数据。 2020年11月,理想汽车交付新车4.1万辆,同比增长0.9%。 截至2019年11月30日,理想汽车全年累计交付汽车3万辆,提前完成全年30万辆的销售目标。 “凭借丽丽L系列三款车型,理想汽

    06-18

  • 证监会:定期打击场外融资

    证监会:定期打击场外融资

    证监会市场二部副主任刘云峰表示,下一步,证监会将坚决落实零容忍工作要求,会同公安部等有关部门密切配合,定期打击场外资金配置行为,严厉查处场外资金配置违法犯罪案件,有效保障切实维护投资者合法权益,全力保障资本市场健康发展。

    06-18

  • 微信朋友圈已经存在10年了,你还会用它来分享生活吗? |ifanrTalllk

    微信朋友圈已经存在10年了,你还会用它来分享生活吗? |ifanrTalllk

    4月19日,朋友圈功能上线。 快进十年,朋友圈已经成为我们不可或缺的功能之一。 作为最具影响力的个人表达产品,我们可以在新闻中看到各科技公司对某一事件的创始人朋友圈回应截图;我们可以跟踪不同事件的进展,看看哪些事件引起了我们的注意;我们可以分享你的生活,分享测

    06-21

  • 用工新趋势:“网通电通+无影”让客服业务突破时间和空间限制,兼顾安全性和灵活性-云谷创新漫谈NO.17

    用工新趋势:“网通电通+无影”让客服业务突破时间和空间限制,兼顾安全性和灵活性-云谷创新漫谈NO.17

    近年来,灵活用工逐渐成为企业用工新趋势,特别是在客服行业,不少企业的客服岗位选择人力外包服务,或者采用多元化用工方式,如如远程客户服务和兼职客户服务。 在此背景下,传统的集中办公、纯人工客服的工作模式正在发生变化。 云客户服务模式越来越受到企业的欢迎。 这是

    06-17