联系我们
  • 电子邮箱:

    business@idata.cn

  • 客服电话:400-996-7687
  • 点击这里给我发消息客服 点击这里给我发消息客服2
返回顶部

在阿里 AI Lab 做 NLP 高级算法专家是一种什么样的体验?

来源 : 人工智能头条 发布 : 2017-10-24 11:32:17 访问数 : 2939 点赞数 : 9 文章分类 : 查看原文

记者 | 鸽子


最近应届生的拼抢大战的号角已经吹响。正如近几天在朋友圈疯传的一篇雄文,年薪25万也只是个白菜价......这让营长真心羞愧啊.....同样敲键盘的...不说也罢


绝不将小小的忧桑带入工作。


这几天,群里一直有很多小伙伴在打听在不同的热门公司工作,都有啥不一样的体验。


为了能帮助各位还在象牙塔的程序员哥哥们提前了解,营长决心不遗余力地多多走访一些业内的热门公司,跟每天在里面工作的资深大牛们聊一聊,扒一扒,看看在这些公司工作,到底是个肿么样的体验。


这次带来的是在阿里人工智能实验室工作的高级算法专家姜飞俊,还是先上个帅照吧。



姜飞俊(齐桓),阿里集团人工智能实验室高级算法专家,本科和博士先后毕业于浙江大学和香港科技大学,2012年博士毕业后加入阿里集团,目前带领团队负责天猫精灵语音助手的自然语言理解技术。


在本周六,姜飞俊将在 SDCC 2017「人工智能技术实战线上峰会」 上带来题为 《自然语言处理在“天猫精灵”的实践应用》 的分享,更多峰会嘉宾和议题请查看文末。


搬好小马扎坐好了,废话少说,问答开始~


1. 自从来到阿里做NLP高级算法专家,睡眠时间还能保证吗?


在阿里挺多年了,已经习惯了这种工作节奏,一般我们在项目关键节点的时候会比较忙,别的时候其实还好的,所以正常情况下每天的睡眠时间还是有保证的。


2. 每天睁开眼后,最大的压力是什么?


现在线上每天有非常多的用户在使用我们的NLP服务:第一,在阿里的技术体系里,服务的可用性是底线,所以一部分压力来自担心我们服务会不会出故障;第二,用户对自然语言理解的要求是比较高的,我们每天都会收到用户的反馈,然后我们让机器去优化语言理解的能力。


3. 作为一个阿里人工智能实验室的高级算法专家,您每天的工作日程,包括休息日,您会做些什么呢?


我们每天早上会开一个晨会,汇总过去24小时收集到的用户反馈,然后讨论解决方案,接下来就会安排相应同学去解决这些问题。同时我们自然语言理解模型的优化也是一个持续的过程,这里面涉及到我们对深度学习网络结构的调整还有训练方法的优化,所以我们每天会有一定的时间去跟踪最新的技术动态和论文,同时我们也会按照制定的研发计划做实验,逐步推进技术的进步。


4. 您喜欢阿里实验室里面的工作氛围吗?跟您一起在实验室工作的有多少人呢?都有哪些方向?


目前人工智能实验室研究的方向包括了自然语言理解、知识图谱、语音识别、声音信号处理、计算机视觉、机器人控制、硬件研发、云端技术研发。同时我们还有市场部和产品部门的同学,来自各种背景的同学聚集在一起,有很多可以彼此分享的内容,对大家的知识和阅历都是一个很好的扩展。


5. 有人说,自然语言理解是AI领域排名第一的难题和挑战,您认同吗?


确实自然语言理解是目前非常难的问题,相比语音和图像的感知智能,语言是认知智能,人类的知识乃至我们的文明都是通过文字来记载的,所以如果机器可以实现完善的自然语言理解,那么这个和科幻片中的人工智能就很接近了。


所以我认为自然语言理解也是可以分层来看的,目前我们在天猫精灵里做的大量的任务型的理解,是第一个层次的理解能力,我们认为基于目前的技术,这部分已经可以做得比较好了,换句话说,接下来大量的任务可以通过语言来指挥机器去完成。再往深入一点,就是信息获取和问答的能力,这涉及到对人类知识的大规模建模,以及对用户问题的深度理解,所以还是目前非常有挑战的问题。第三个层面,就是让机器和人进行自然的交流,机器能有情商,可以感知到用户的情绪,机器也能有一定的性格,目前来看,这是非常困难的工作,目前有挺多类似的demo,但是往往做出来都给人一种智障的感觉。


所以总结来讲,对机器自然语言理解能力的提升,还有非常漫长的路要走,甚至需要基础科学的突破。


6. 在自然语言理解这个领域,您最欣赏和佩服的人是谁?


在这里领域我最佩服和欣赏的是深度学习四大天王之一的Prof. Yoshua Bengio。Bengio教授带领的团队在自然语言理解领域的深度网络上做了很多大胆的创新,也取得了很不错的成果,始终走在自然语言理解探索的最前沿。


7. 在天猫精灵这款产品的开发中,您在里面具体会承担哪些方面的工作呢?


我及我的团队主要负责天猫精灵的自然语言理解技术,在这里我主要承担三部分的工作:

第一个是模型的设计及优化,选择合适的算法方案来实现最优的效果;

第二个是设计这套自然语言理解系统,从无到有,经历了多代的演进,我们搭建了这套我们认为是比较适合目前的语音交互的自然语言理解系统;

第三个是解决问题,当遇到具体的问题时,我需要去分析这个问题在哪个模块去解决是最合适的。同时我也会跟进团队同学的工作,并且review code。


8. 您来实验室之前,以及工作了这么久之后,对自然语言理解用于解决实际问题上,会不会有一些不同的新的认知和感悟?


我是人工智能实验室创始团队成员,之前一直在阿里集团大数据部门从事图像识别、推荐系统等算法工作。


在人工智能实验室一直从事自然语言理解领域的工作,在解决实际问题的时候,可以分享下最大的感悟吧,就是细节是魔鬼,整个算法系统涉及到大量的算法子模块,我们在进行效果优化的过程中,发现一些容易被我们忽略的细节,如果进行了优化,会对整体效果带来明显的提升,感悟就是要严谨的分析问题然后要去怀疑细节。


9. 在您解决实际问题中,会综合用到其他哪些技能呢?比如,知识图谱?


在解决实际问题的时候,我们会去尝试各种文本的技术,当然知识图谱对我们的自然语言理解是非常重要的。知识图谱可以给我们很多先验知识,它包含了对这个世界的认知信息,是我们进行意图判断很重要的参考。


10. 对于对自然语言处理非常感兴趣的,正在努力学习,希望未来从事这个领域相关工作的同学,从您自身出发,有没有想要分享的一些心得感悟?


自然语言理解需要两方面的能力,机器学习的能力,当然也包括目前炙手可热的深度学习方法,和对语言本身特点的理解,所以我觉得这两部分的内容的学习和实践都很重要。


11.如果让您给未来会从事自然语言理解实战相关工作的同学提三个中肯的建议,您觉得是什么?


第一个,对机器学习和深度学习方法能有很扎实的掌握,更深入一点,比如凸优化等数学理论能有所掌握。


第二个,语音本身是很有魅力的,是一种人类创造出来的符号语言,所以对语言本身的理解,是我们目前发现自然语言理解技术进一步前进很需要去思考的。


第三个,其实和所有的算法工作是一样的,就是要养成思辨的思维习惯(critical thinking)和独立的思考能力(independent thinking)。


12. 目前NLP领域,大致会分为哪些具体的工作,一般来说,不同的工种,不同的工作年限,不同的学历,工资待遇大致会是什么范围?


我们这边,大致会有三种类型的工作,一种是做算法模型的,包括深度学习模型还是传统的模型,第二种是做自然语言理解系统的搭建的,第三种是利用自然语言理解技术去实现业务逻辑和产品功能的。目前来讲这部分工程师的待遇还是相当有竞争力的。


13. 如果想加入您的团队,您会有哪些要求呢?


对技术的热爱,也就是对做的技术有热情,会用心去思考所做技术的每个细节。有扎实的技术基础,算法的基础和代码的基础。


14. 如果重新选择,还会选择NLP吗?


是的,还会选择NLP,因为这部分的技术是我们走向真正的智能所需要去突破的核心技术。这是这几年发展速度会非常快的领域。


15. 从技术上,以及个人理解上,您会将NLP的发展分为几个阶段?下一个阶段NLP将会是一个怎样的趋势?


我其实在回答第5个问题的时候已经回答了这个问题:


我认为自然语言理解也是可以分层来看的,目前我们在天猫精灵里做的大量的任务型的理解,是第一个层次的理解能力,我们认为基于目前的技术,这部分已经可以做得比较好了,换句话说,接下来大量的任务可以通过语言来指挥机器去完成。再往深入一点,就是信息获取和问答的能力,这涉及到对人类知识的大规模建模,以及对用户问题的深度理解,所以还是目前非常有挑战的问题。第三个层面,就是让机器和人进行自然的连续交流,机器能有情商,可以感知到用户的情绪,机器也能有一定的性格,目前来看,这是非常困难的工作,目前有挺多类似的demo,但是往往做出来都给人一种智障的感觉。


目前来看,第一个阶段,任务型的NLP已经可以比较好的达成了,第二个阶段,知识库的建设和知识应用于自然语言交互,会是接下来很重要的趋势。


16. 如果用一句话总结您所做的工作,用一句非常走心的话,别太套路,您觉得是什么?


用最前沿的技术,让人可以直接用语言与机器进行自然交流,让内容和服务变得随口既来,让更多的人能享受到智能时代所带来的便捷。




10 月 28 日(本周六),姜飞俊将在 SDCC 2017「人工智能技术实战线上峰会」 上带来题为 《自然语言处理在“天猫精灵”的实践应用》 的分享。


同时商汤科技、微软、第四范式、微博、出门问问、菱歌科技的 AI 专家,也将针对机器学习平台、系统架构、对话机器人、芯片、推荐系统、Keras、分布式系统、NLP 等热点话题进行分享。

先行者们正在关注哪些关键技术?如何从理论跨越到企业创新实践?你将从本次峰会找到答案每个演讲时段均设有答疑交流环节,与会者和讲师可零距离互动。