全球最大生物医药股权投资诞生!高瓴认购百济神州逾10亿美元股份
06-17
虽然AI的概念早在20世纪60年代就已经出现,但直到2000年Geoffery Hinton提出“深度学习”后,它才逐渐被科技巨头重视。
十年后,围棋中人与机器的世纪之战以及百度世界大会拉开帷幕的“第三幕”之战,再次将人工智能创业推向风口浪尖。
好莱坞科幻电影中描绘的人工智能主导的世界不仅带来了威胁,也让我们看到了人工智能技术巨大的发展空间。
无论是科技巨头还是创业者,在人工智能领域,人类还处于起点。
第一个实现重大技术突破的领域是语音识别。
科大讯飞是该市场的主导者,办公环境下语音机器识别准确率可达95%以上;百度紧随其后,李彦宏今年百度世界排名第一,会议声称其语音识别准确率达到97%。
第二个取得重大突破的领域来自图像识别。
例如,面部识别技术已经通过安全、支付等工具渗透到生活的各个方面。
关于第三个领域,押注对话的科技巨头,如百度的“度秘”和微软的双胞胎“小冰”和“小娜”,目前仍处于改进技术和构建使用场景的阶段。
未来三五年,对话领域会不会有重大突破?在其他领域还有胜算吗?思考这个问题的是AI语音语义领域的创业者马雷、专家,他们曾就职于微软研究院和微软搜索技术中心。
Winphone自带的中文(简体、繁体)、日文、韩文手写识别是他从头写的代码;在Techfest上大放异彩的基于运动传感器和视觉识别的“空中手写”就是由他主导的;他也是前微软员工“小娜”及相关产品的架构师。
和马磊一样,北极光创投董事总经理杨磊也在寻找人工智能领域的下一个重大技术突破。
在已经过热的AI创业中,他希望找到更直接的技术转化和更可靠的创业团队。
当两人相遇时,这个问题就有了答案。
于是,2018年6月18日,马雷成立了AI创业公司ATMAN,两个月之内,立即获得了北极光创投的数千万天使投资。
机器翻译是他们从对方那里得到的答案。
十年技术荒漠 “如果人工智能在未来三到五年内要在任何领域实现重大技术突破,那一定是翻译。
”马雷说,因为距离谷歌机器翻译上一次实现技术突破,已经过去十多年了。
机器翻译的第一阶段是提前向机器灌输大量的语法和词汇,然后根据句子进行对比翻译,也就是所谓的“分词算法”,与早期的分词类似语音识别中的音节。
2008年,谷歌开发了“语义相似度算法”。
它首先将大量的文本输入机器,然后与并行句库进行比较,找出无数的相互关系,然后通过穷举的方法得到最佳的翻译结果。
这一技术突破极大地提高了谷歌翻译的准确性。
大多数中国大学生都有过使用谷歌翻译毕业论文的经历。
然而,由于中文是世界上最难的语言,无论是分词算法还是语义相似度算法都无法产生令人满意的翻译结果。
直到深度学习的出现,机器翻译的准确性才得以突飞猛进。
2008年,人工神经元网络的出现让人们明白,并不是给计算机喂更多的数据,而是选择“天才学生”进行数据学习。
这些“天才学生”就是那些拥有模拟人脑神经元网络的学生。
计算机模型。
自从确定了机器翻译创业领域后,马磊就开始搭建初始模型,从1万句话的数据量开始训练,三个月的时间就取得了骄人的成绩。
根据国际通行的机器翻译质量指标BLEU评估,ATMAN的翻译技术已经超越垂直领域(如新闻、政治)的主要翻译服务提供商。
“如果目前机器翻译的准确率是50%,剩下的50%需要人工修改,我们只需要将人工修改工作减少到10%,这就是价值。
”马磊说道。
当负责浇水的机器人老师有了一个天生丽质的学生后,马磊开始有计划地训练,三个月内做出了十多项技术改进。
他给这些训练起了各种有趣的名字。
例如,“外部记忆”让ATMAN在处理长句子时首先像人脑一样形成印象,然后过滤掉语义核心进行翻译。
更复杂的专有名称和修辞可以先记录在外部存储器中。
然后在词库中查找后填写核心句子。
另一个例子是“饱和度”(saturation)。
当神经元达到饱和状态并且不再响应时,需要重新分配任务以再次激活神经元。
每天,马磊都沉浸在发现问题、解决问题的兴奋之中。
“要知道,人工智能的增长并不是线性的,每一次技术的进步都会让模型突飞猛进。
”机器人教师的概念是马磊两年前做出的预言,现在他正源源不断地从事这项工作。
,为ATMAN选择垂直领域的知识,组织课程,回顾学习成果。
“就像种下一颗种子,只要每天浇水,就会得到意想不到的结果。
”马磊开玩笑说,他给公司的CTO浇水。
经历了第一次创业因缺乏人才而失败后,加入微软搜索技术中心的马磊经常向同事刘伟灌输创业理念,如今他们已成为创业伙伴。
目前,马磊的开发团队全部来自微软,让公司带有微软的气质。
“微软有一种文化,人可以随时停止工作,自由思考,但机器却无法停止。
所以从技术选型开始,我们就提倡零人力成本,在学习过程中自行迭代。
“就像ATMAN的初衷是人类的自我意识一样,马磊希望能够实现机器的自我意识。
即使产品不上线也能获得投资。
至于未来的产品会是什么样子,马磊表示坦言:“如果我说三个月后你真的看清楚这个商业模式,我就算告诉你你也不会相信。
“不过,马磊对于ATMAN的应用场景已经有了初步的想法。
对于B端客户来说,ATMAN针对特定垂直领域的进入周期为两周,可以为媒体、科研院所、工程院以及高要求的企业提供服务。
”为有高频需求的企业提供高速翻译服务,同时,马磊还计划开发智能CAT软件,协助B端客户进行最终的人工校对。
一个以门户形式的“量子镜像”计划,用户推送精选的国外内容网站。
“按照我们目前的单机翻译速度,镜像一个100万篇的内容网站需要一个月的时间。
”利用翻译技术首先满足用户的信息获取需求。
对于这样一家还没有产品的初创公司,自成立以来一直陪伴在他身边的北极光杨雷给予了极大的肯定和希望。
一个人工智能技术通常需要三到五年才能成熟,杨雷表示他愿意等待。
“我给他(马磊)读了很多AI领域的学术论文,我还好学,别说三五年,我都会陪他。
”他已经好10年了! 》对话投资人北极光创投NewSeed董事总经理杨雷:押注机器翻译领域的原因是什么? 杨雷:我们也考虑过其他领域,比如AI教育,但我们总觉得有中间环节太多了。
翻译是我一直关注的领域之一,原因有几个:第一,翻译比较容易制定相对客观的标准,第二,翻译本身可以计算。
是一个非常非常巨大的市场,无论是2B还是2C;第三,虽然有一些巨头在做,但都是万能翻译机,马磊的团队在垂直领域一一做差异化;第四,翻译是相对的;低风险领域,而自动驾驶等其他人工智能应用领域的容错率很低 NewSeed:目前人工智能创业是否过热? 杨磊:我认为肯定是过热了。
事实上,找到一个好的团队和一个好的方向是很难的。
将两个领域很好地结合起来并不容易。

小公司只能靠两件事,一是速度,二是创新。
马磊选择的方向和道路与其他人截然不同。
当人们关注这个领域时,他们就会这么做。
在此之前,他和球队的基因也非常匹配。
尤其是2B创业公司,自身基础必须非常扎实,壁垒必须足够深。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-06
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态