Temu围攻亚马逊
06-17
01 扬帆情怀,坚定信仰。
第一次见到李纪为是在人工智能小镇。
香农科技杭州新办公区。
说起他的标签,很多人可能都知道“博士最短时间从斯坦福计算机学院毕业”、“《麻省理工科技评论》35位35岁以下科技创新人士”、“《福布斯》30位30岁以下精英”等很快。
不过,相比于他酷炫的头衔,他本人却低调得多。
他更像是一位研究学者,而不是一家公司的首席执行官。
这位年轻的创业者是克劳德·香侬的嫡系弟子。
李纪为2011年从北京大学毕业,前往美国学习生物工程。
后来转向人工智能,就读于斯坦福大学,师从 Dan Jurafsky(斯坦福大学计算机科学系和语言学系主任教授),Dan 是香农的学生。
年初,李纪为回国,与北大老同学一起创业NLP(自然语言分析)领域。
这家公司就是香农科技。
对于公司名称的由来,李纪为表示,源于对信息论和创始人香农的信仰。
在攻读博士学位期间,他仔细阅读了香农里程碑式的研究论文《印刷英语的预测与熵》,这是许多现代NLP理论的来源和基础。
出于对这位 NLP 先驱的敬佩,公司以他的名字命名。
也正是在这一年,香农科技迁移到阿里云,选择用数字技术来陪伴公司的成长。
和所有创业者一样,香农科技的创始团队心中怀揣着梦想,希望有一天,当人们提到香农时,除了是“信息论之父”之外,还能想到一家利用技术连接世界的科技公司。
世界——香农科技。
02 专注前沿AI技术,创造文字社会价值。
人类历史上以语言文字形式记录和传播的知识占知识总量的80%以上。
就计算机应用而言,约85%用于语言和文本信息处理。
自然语言处理是利用计算机处理自然语言的形式、声音、意义等信息,对字符、单词、句子和章节进行输入、输出、识别、分析、理解、生成和处理。
自然语言处理如何应用在我们的生活中?事实上,NLP随处可见,在我们的日常生活和工作中发挥着重要作用。
小到我们常用的翻译软件、搜索引擎、聊天机器人,NLP技术都是用来让机器理解我们的需求,然后通过计算处理,反馈给我们我们想要的答案;大到金融、司法、政务、工业、媒体等行业也都在利用该技术处理复杂的文档和文件,从海量文本中更加方便快捷地获取准确信息。
那么,NLP技术是如何实现这些应用的呢?香农科技创始人和李纪为打了一个形象的比喻:就像小学生通过学习基础知识、训练学习方法达到了大学生的水平。
掌握了这些理论和操作技能后,他投身于各行各业的工作。
通过一定时间的工作实践和刻苦学习,他已经成长为某个垂直领域的“小专家”。
过硬的技术和行业经验的积累,让他在自己的行业里游刃有余。
从技术角度简单概括一下,就是用算法构建“大学生”模型。
通过垂直领域小样本数据的持续训练,掌握相关知识和能力,成为高效、优质的生产工具。
李纪为用香农智能写作产品——火龙果写作进行演示:网络小说作者完成基本框架和初步内容准备后,系统可以根据当前写作内容理解和分析文章类型和主题,并自动推荐相关内容文具;小说完成后,还可以帮助作者进行100多种纠错检查,如语法纠错、事实检查、上下文一致性检查、标点格式检查等,不漏掉任何错误;当创作遇到瓶颈时,可以根据当前内容自动生成原始剧情以供继续。
除了文学创作之外,该产品还可以根据关键信息描述辅助创作不同风格的文字,比如学术风格、公文风格、社交媒体风格等,简直就是文字写作的全能手。
据悉,火龙果写作已成为不少学生党和文学工作者首选的“智能助手”。
短短一年时间,注册用户就实现了10%的快速增长。
此外,香农科技也将科技广泛应用到各行各业。
其自主研发的微数据、舆情监测系统、智能公文处理平台、智能问答引擎、智能数据管理平台广泛应用于金融、司法、政务、新闻出版、教育等行业,遍地开花。
以金融行业为例,金融信息智能服务平台“简微数据”可以分析资本市场信息和事件知识图谱,提供高效便捷的A股、三板、港股、美股、债券信息等信息公开检索服务、HTML格式在线阅读比对、表格修复等信息服务;舆情数据平台可以依靠自主研发的爬虫系统,每天24小时抓取网络新闻,同时利用分词算法、命名实体识别、文本分类、情感分析等,对抓取到的新闻进行各种行业标签标签,从数据采集到知识分析,满足客户不同的舆情分析需求,为企业、金融机构、政府等行业提供一站式舆情数据知识处理服务。
香农科技业务负责人告诉我们,在实际应用过程中,一个商业模式或者一个解决方案可以帮助客户企业降低至少70%到80%的人力成本。
以司法部门的文件为例。
司法机构一年会拥有数十万份文件。
传统的工作模式是人工阅读、组织和分发系统提案。
由于学科门类多、涉及多个领域、人员知识背景不同,效率低下且容易出错。
这几乎是一项大量的工作。
针对人工神经网络计算的连续、大规模深度学习场景,Shannon使用了阿里云推荐的GPU实例和AMD实例。
采用对象存储OSS,数据层面互联互通,满足海量训练数据的低成本存储和访问需求;利用EMR服务对数据进行预处理,提高分析效率;云监控服务用于监控GPU资源。
报警,整个过程更加安全稳定;在ECS、负载均衡、弹性伸缩、资源编排资源的支持下,香农科技在云端快速构建了完整的AI深度学习业务体系。
2020年7月,香农科技为杭州市余杭区人大办公室开发了“余杭区人大建议智能分发平台”。
原本人工需要3分钟的信息处理工作只用了0.35秒就完成了,总时间比原来的人工处理8个小时减少了。
工作时间缩短至5分钟,准确率达到90%以上,极大提升了余杭区人大票据处理效率和服务能力。
这种利用“AI提速”的场景,在银行、券商、媒体等行业也能看到。
在这条“AI加速”的道路上,香农科技也获得了国内外行业的广泛认可。
2017年,香农科技荣获达沃斯世界经济论坛“全球科技先锋”、IDC中国金融科技50强、德勤高科技高成长中国50强、福布斯中国企业科技50强等多项荣誉,并于1月荣获当年,获得北京首批专精特新资格。
这些成果都是基于香农科技多年来在NLP技术上不断的自研和创新。
2017年至今,发表顶级会议论文50余篇,核心专利70余项;仿照汉语独特的特点,整合汉字字形和拼音信息;提出了基于机器阅读理解的实体关系联合抽取方法,并取得了国际最好的结果;基于机器阅读理解的命名实体识别方法,大大超越了此前的世界最好成绩;基于大规模图神经网络的语义理解模型,将图结构与预训练相结合,大大提高了模型的语义理解能力。
在自然语言处理、深度学习、知识图谱等领域……香农依托多项拥有自主知识产权的领先技术,打造以自然语言处理为核心的全流程智能计算平台。
03 云上创新,助力中国NLP做强 谈起最初的创业选择,用李纪为自己的话说:将自己的代码变成实际应用,是每个技术人的理想。
“要将研究模型转化为实用工具,科学不仅仅是纸上谈兵,它必须应用于实际过程。
”近年来,自然语言处理发展迅速。
2009年,Google提出了一种新的自然语言处理模型架构——Transformer;从2000年到2016年,大规模预训练模型BERT和GPT相继被提出。
大规模预训练模型基于Transformer模型架构构建,可以利用海量无限数据。
带注释的语料库完成了预训练,建立了语料库的文本感知和知识提取,在几乎所有自然语言处理下游任务上都取得了显着的提升。
大规模预训练已经成为提升深度学习模型性能的必要模块,也是当前AI领域最热门的研究对象。
但针对中文的自然语言处理研究还很薄弱。
“与英语相比,中文的理解要复杂得多。
同一个词、词、句子在不同的语境、不同的表达方式下可能有不同的含义。
过去人工智能自然语言处理算法使用的是西方技术汉字是一种象形文字,经过长期的历史发展,每个汉字的形、音、义都可能蕴藏着深刻的含义。
” “我们之所以开始做这件事,是因为我们既然在中国做这件事,就必须推进汉语领域的研究!汉语作为世界第二大语言资源,有着更加光明的未来。
”何李纪为认为,NLP是一个广阔的市场和空间,需要更多的开发和合作来构建生态系统。
谈及未来计划,李纪为表示,未来希望进一步推进“更懂汉语”的新一代自然语言处理基础研究,打破理论与实践的壁垒,不断钻研更多原创、创新的内容。
和现实问题,加强人才培养和产学研生态系统建设,提升中文自然语言处理研究在国际话语体系中的地位做更多工作。
2017年,刚刚诞生的香农科技选择了“在云上成长”。
香农科技CTO王思宽谈到企业上云的过程,“2009年,作为一家初创公司,运营机房的成本非常高,所以我们采取了选择云厂商的方式现在看来,阿里云是一个最简单、最正确的选择,从简单的云服务器的灵活使用,到后来香农科技在ECS上自己的K8,一切都进展得很顺利。
” Cloud的架构师提议道。
为了进一步降低IT运维成本,香农科技直接采用了阿里云的AKS。
王思宽表示,“在我看来,阿里云的优势在于服务——响应非常及时,技术交流也比较完善。
阿里云能够快速为我们的需求提供答案;其次是云功能的学习支持非常省心,随着云服务不断升级完善,功能越来越强大,企业学习使用云的时间成本给了我们很大的帮助。
支持。
”04 永不止步,未来可期。
近年来,随着深度学习的广泛应用,关于即将到来的“下一代人工智能”的讨论从未停止。
但在李纪为看来,这样的讨论似乎还为时过早。
。
“下一代是如何定义的? ”他提出了这样的问题。
在他看来,我们还处于科技的“窄域时代”。
人工智能正在我们规定的内容内被拉伸、布局、打磨。
但未来的某一天,我们最终会突破窄域,进入“宽域时代”,这是一个值得期待的场景。
从三人到数百人,李纪为坦言。
困难不是开始,而是现在和未来,从“一个人吃饱,一家人不饿”,到团队和客户越来越多,每一小步都是退一步,也是一大步。
是对未来趋势、风险与机遇的预测,肩负着全体员工和客户的信任,这个“困难”是每个创业者共同的心路历程,无论是“元界”还是“下一代人工智能”。
“聪明”,他们没想那么多。

选择赛道不仅关乎自己的兴趣,也关乎其业务能力。
Shannon更关心的是专注于自己行业的一些顶尖技术并依靠团队的力量研究一代技术或者推广一代技术,为最新的研究成果找到实现突破的场景,并真正造福社会。
数字技术伴随着企业的成长。
至此,阿里云的底层技术和产品一直在与香农一起前进。
现在,这条路还将继续走下去。
点击了解更多关于专精特新资助计划的信息。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-08
06-17
06-17
06-18
06-17
06-18
06-17
06-17
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态