内容简介:雷锋网近日,在雷锋网 AI 研习社第 4 期职播间上,中国最高估值自动驾驶创业公司 Momenta M4U 技术负责人陈凯深度分享了自动驾驶独角兽 Momenta 如何「打造自动驾驶大脑」,并解读实现 L4 级别的自动驾驶需要怎样的技术与人才。陈凯:Momenta M4U 技术负责人,中国科学技术大学博士,RoboCup@Home League 2014 世界冠军,多年从事机器人研究和相关工作。
雷锋网 (公众号:雷锋网) AI 科技评论按:目前全球汽车行业公认由美国高速公路安全管理局(NHTSA)和国际自动机工程师学会(SAE)提出的的分级制度,把自动驾驶分成 L0 到 L5 级,分别承担相应的职责,而 L4 作为级别第二高的无人驾驶,是指在特定场景下(如高速公路)可以在完全没有人干预时进行全自动无人驾驶,到现在为止,实现 L4 无人驾驶依旧是人工智能领域最具挑战性、最复杂的难题之一。
近日,在雷锋网 AI 研习社第 4 期职播间上,中国最高估值自动驾驶创业公司 Momenta M4U 技术负责人陈凯深度分享了自动驾驶独角兽 Momenta 如何「打造自动驾驶大脑」,并解读实现 L4 级别的自动驾驶需要怎样的技术与人才。
陈凯:Momenta M4U 技术负责人,中国科学技术大学博士,RoboCup@Home League 2014 世界冠军,多年从事机器人研究和相关工作。
分享主题: 从人才角度看 L4 无人驾驶的实现(附 Momenta 招聘解读)
分享提纲:
1、Momenta 团队介绍:打造自动驾驶大脑
2、三大平台实现大数据与 AI 算法的反馈闭环
3、Momenta 核心技术的实现:基于深度学习的环境感知、高精度地图、驾驶决策算法
4、实现 L4 级别的自动驾驶需要怎样的技术与人才
雷锋网 AI 研习社将其分享内容整理如下:
今天主要在这里跟大家分享一下 Momenta 的技术路线,另外会重点介绍一下 L4 级别无人驾驶的人才需求。
Momenta 团队介绍:打造自动驾驶大脑
Momenta 的公司定位是打造自动驾驶大脑,简单来说,大脑就是跑在无人驾驶系统中的软件。下图是公司的核心团队:
-
CEO 曹旭东,清华大学毕业,在人工智能行业积攒了近 10 年的研发和管理经验。他曾在 CVPR/ICCV/ECCV 等计算机视觉顶级会议发表论文数十篇,并曾在美国 National Data Science Bowl 比赛拿下全球亚军。在创办 Momenta 之前,曹旭东曾任商汤科技执行研发总监,率领百人研发团队,具有丰富的管理经验及产品落地经验。在加入商汤科技之前,曹旭东任职微软亚研研究员,其研发技术广泛用于 Xbox、Bing、How-old 等知名产品,其中现象级产品 How-Old 有着数亿用户。
-
研发总监任少卿,中国科技大学和微软亚洲研究院联合培养博士。任少卿先生是当前最流行的物体检测框架 Faster-RCNN 的第一作者、当前最有影响力的深度学习网络结构 ResNet 的第三作者,同时也曾获得 ImageNet 2015 物体检测、图像分类、物体定位冠军,MS COCO 2015 多项比赛冠军,及 CVPR 2016 最佳论文等众多荣誉。
-
研发总监夏炎,中国科技大学和微软亚洲研究院联合培养博士,深度学习和大数据领域专家。在 Bing 等知名产品中,都有应用夏博士的研发成果。
-
研发总监孙刚,中国科学院计算机视觉博士,高性能并行计算系统专家,大规模图像识别专家。孙刚先生曾获 ImageNet 2016 场景分类亚军、ImageNet 2017 图像分类冠军,并曾参与设计世界上首个针对深度学习的 GPU 训练集群。
此外,Momenta 的团队成员主要来源于 MIT、CMU、清华大学、北京大学、中国科学技术大学等国内外高校及研究机构,以及 Google、Amazon、Facebook、微软亚洲研究院、腾讯等知名高科技公司,拥有深厚的技术积累、极强的技术原创力和丰富的行业经验。
Momenta 是一家拥有世界级研发能力的公司。下面是深度学习领域中比较有名的三项成果,都出自于 Momenta 的核心团队成员。
第一个是 SENet,它是业界性能最好的深度学习网络单元,Momenta 也凭借 SENet 获得 2017 年 ImageNet 图像分类世界冠军。
第二个是 Faster R-CNN,任少卿是其作者,它是引用频率最高的物体检测框架,Momenta 在此基础上做了很多改进。
第三个是 ResNet,它是当前最有影响力的深度学习网络结构,这篇论文也获得了 2016 年 CVPR 的 Best Paper。
这 3 项研究成果相关的论文引用数已经超过 17000 次;同时,团队还拿下 ImageNet 2015 物体检测、图像分类、物体定位冠军,MS COCO Challenge 2015 冠军,ImageNet 2017 图像分类冠军等一系列国际顶级赛事的奖项。
Momenta 的定位是打造自动驾驶大脑,始终专注于在人工智能方面的软件和算法的实现上。
Momenta 的技术包括三大模块:
基于深度学习的环境感知。它主要解决的问题就是,无人驾驶车辆可以感知它身边的一些物体,包括静态的路面、路牌以及动态的车辆、行人、自行车等等。
高精度地图。不同于人类司机,无人驾驶汽车在道路上运行时非常依赖于高精度地图,这样它才能知道其正处于什么样的位置、要到达的位置与当前位置有什么样的关系,并根据定位和信息去做较为精准的导航,最终自动前往目的地。
驾驶决策算法。驾驶决策由数据推动,类似于建立一个拥有 1000 亿公里驾驶经验的智能司机。通过众包路测,Momenta 获得了高精度语义地图中海量的驾驶轨迹。通过对海量驾驶轨迹的学习,Momenta 的算法可以根据当前环境感知和高精度地图信息,做出驾驶决策规划。
基于这些技术,Momenta 开发了不同级别的自动驾驶方案,而底层技术之前是有很强的通用性的,后面我再具体介绍。
底层平台实现大数据与 AI 算法的反馈闭环
接下来介绍一下如何运用大数据和大计算平台实现大数据与 AI 算法的反馈闭环。
1. 大计算平台,它是支撑 Momenta 去训练得到一个比较好的模型所需要的基础能力,主要是针对深度学习的 GPU 训练系统。在创立以来的两年多时间里,团队不断优化训练平台,在 2018 年上半年,Momenta 的自有平台已有数千块的 GPU,这个数量在创业公司以及大公司内部都是一个非常大的规模。不过仅拥有这么多数量的 GPU 是远远不够的,团队也设计了一种分布式深度学习训练系统 ROCS,它针对深度学习做了很多优化,包括跨服务器间高速信息传输、优秀的存储优化,其基于该系统和 SENet,助力了加速产品迭代过程。这一训练系统的几大特点是:稳定、高效、软硬件协同优化、易用。
2. 大数据平台,指的是百亿公里数据采集能力。Momenta 利用众包的思路积累驾驶相关的数据。不同车辆所面临的路况、天气和光照情况在不同的城市千差万别,积累下来的数据能更好地助力感知算法的研发。数据来源于产品,通过多渠道收集来的数据,能让技术得到更好的迭代,有助于提升产品的质量和性能,最后形成良性的闭环。
拿到这么多数据后,并不能直接接到大数据平台,中间会有一些步骤:
第一步是数据采集,通过产品采集数据;
第二步是数据筛选,数据回收后,其中有一些数据是没用的,所以需要将一些没用的、模糊的数据挑选出来去掉;
第三步是对有效数据的数据标注,数据系统实际已经使用了 Momenta 精准的算法去进行检测,而这些算法能大大提高标注效率,不需要从 0 开始进行标注;
第四步,数据接入到 Momenta 的大数据平台上,进行模型训练。
训练过程其实是非常需要消耗存储和计算资源的,因此内部也有一套在线远程众包数据标注系统,能利用训练结果模型帮助数据筛选,并用算法辅助数据半自动化标注。加入 Momenta 的同学也有机会接触到这些项目,自己的一些想法也有机会去实践并验证。
另外值得一提的是深度学习算法模型,Momenta 能将性能好的模型更好地集成到产品中。在模型精度几乎不受损的情况下,让模型计算速度提升 10-100 倍,同时将模型尺寸压缩 100 倍,让模型在时间和空间上都有两个数量级的提升,并让训练出来的模型更好地放入车载嵌入式平台等低计算、低功耗的平台上,从而更易于产品化。
此外,公司内部还有仿真平台,用到了非常专业的物理仿真引擎,可对车辆动力进行真实仿真,也可以对在道路上添加动态和静态障碍物进行仿真,能帮助高级别无人驾驶进行在线测试。
Momenta 核心技术的实现
具体介绍一下 Momenta 的环境感知能力,它对不同类型障碍物进行检测和识别。
道路上最常见的障碍物就是车辆,Momenta 现在可以识别多种车型,而且检测的不仅仅是外边框,还能通过一些方法去还原出车辆本身接近 3D 的姿态、轮胎位置等,有了这些信息,就能对障碍物的相对速度、离相机的位置进行一个比较好的估计,从而更好地判断车与周围其他车辆的相对关系。
除了车辆,人也是道路上非常常见的障碍物。环境感知能对人体的 17 个关节点进行追踪检测,识别每个路人的姿态和动作,例如识别人是在骑车还是走路,人如果走路的话,就要检测其是否走到车道等与车辆行驶相关的位置上了;人如果在骑车的话,就会检测其速度和 3D 姿态。
除了这些动态障碍物,静态障碍物对于车辆也非常重要,包括车道线、路口引导线、交通标识牌、红绿灯等。例如一些竖着的路灯杆,由于遮挡可能只被识别出一部分,但是环境感知算法会估计出它们的长度,并利用一些先验信息确定路灯杆的 3D 位置。另外,车道线也是非常有帮助的语义信息,在这些信息基础上,再加上交通牌等信息,它可以构建基于视觉的语义地图。
Momenta 也针对中国场景,对感知算法进行了优化,对有国内特色的车辆采集了一些数据,并对这些数据进行针对性的训练,以更好适应路况、道路上不同类型的障碍物等。
基于车道线、标识牌等信息,Momenta 可以构建一个高精度语义地图。为什么要构建一个高精度语义地图?相对于传统的地图而言,Momenta 高精度语义地图具有如下优势:
第一个是支持更快的更新。对于同类型道路,车辆只需要使用众包设备上的相机进行道路采集,就可以更新当前所面临的情况。另外,如果因为道路维修以及发生了一些变化情况,车辆也能通过摄像头采集相关信息,对其进行很好的维护;
第二个是高度压缩。高精度语义地图的空间存储占用非常小,此外,还具有更好的鲁棒性。一些比较底层的特征,势必由于受到光线、观测角度等因素,对 2D 特征的提取产生不利影响,而高精度语义地图就能减少这些因素的影响;
第三个是建图精度和定位精度,高精度语义地图从不同视角、不同时间、多摄像头采集到数据,能最大化地保证地图的精度,天时能实现定位精度误差小于 10 cm。
实现 L4 级别的自动驾驶需要怎样的技术与人才
目前 Momenta 累计完成融资超过 2 亿美金,估值超过 10 亿美金。Momenta 的技术领先性及产品落地能力除了为资本市场广泛认可外,也深受行业合作方的认可。
接下来针对想加入的小伙伴,介绍一下 Momenta 的成长空间。
Momenta 是一家非常开放、具有分享精神的公司,大家加入公司后都有机会参加国际顶级会议,聆听行业专家的分享。另外 Momenta 的培养机制也非常健全,包括:
以下是 Momenta 的热招岗位,感兴趣的话可以直接扫描右下方二维码投递简历。
首先,Momenta 非常通用的岗位就是无人驾驶软件开发工程师(C++)。不同于一般的软件开发,无人驾驶系统方向的算法和软件开发对数据结构、算法优化能力的要求非常高,需求量非常大但是要求也非常高。不过这个岗位有很多机会接触到系统架构、算法优化的实践,而在这些项目中,大家都需要去跟同事进行深入的沟通和交流,才能将相关工作做得非常出色。
Planning 算法工程师也是需求量比较大的岗位,负责无人驾驶汽车的行为预测、路径的决策与规划,因此需要用到自动化和规划学习的一些方法。不同的优化和算法都有各自的优势和局限性,因此,这个岗位需要很好地去运用策略,使得驾驶系统对不同场景能进行更好地处理。
传感器融合与环境建模算法工程师,需要利用感知来构建精确的车辆周围动态和环境信息。该岗位需要对多相机、毫米波雷达、超声和激光物体检测的数据进行融合,以提高静态、动态障碍物位置、速度的估计精度,从而构建环境感知模型。
无人驾驶仿真系统工程师,这个岗位除了仿真器相关工作,还有很多数据方面的工作,另外还需要使无人驾驶系统在仿真器上更好地还原所看到的情景,对强化学习和机器学习方面的能力都有一些要求。这个岗位会与仿真开发的同事进行协作,一起去实现更真实的仿真系统开发。
除了研发相关的岗位,Momenta 还有一些测试岗位——无人驾驶测试工程师,我希望任职这一岗位的人有相应的背景知识,从而更好地了解无人驾驶产品怎样更好地进行系统层面的测试,分析不同的测试结构,并定位模块,更好地推动开发团队去改善相关问题。
欢迎大家加入 Momenta,一同在最好的时间,跟一群对的人,做一件对的事。
以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网AI研习社社区( https://club.leiphone.com/ )观看。关注微信公众号:AI 研习社(okweiwu),可获取最新公开课直播时间预告。
雷锋网原创文章,未经授权禁止转载。详情见 转载须知 。
以上所述就是小编给大家介绍的《Momenta 陈凯:Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期(附 Momenta 招聘解读)》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 思科新技能应对数字化经济人才需求
- 思科新技能应对数字化经济人才需求
- 区块链人才需求猛增 算法工程师走俏
- 思科成功推出新技能框架 应对数字化经济人才需求
- 全球AI人才需求两年暴增35倍 中国机器人部署量涨500%
- 斯坦福全球AI报告:清华AI课程人数增16倍,人才需求暴增 35 倍
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Blockchain Basics
Daniel Drescher / Apress / 2017-3-16 / USD 20.99
In 25 concise steps, you will learn the basics of blockchain technology. No mathematical formulas, program code, or computer science jargon are used. No previous knowledge in computer science, mathema......一起来看看 《Blockchain Basics》 这本书的介绍吧!