文/程一祥
如今,我们每个人都在谈论“数据科学”,哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学领域的科学家、从业者们又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学从业者,希望能让你们了解这些神奇的人和他们神秘事儿,为你们一窥数据科学的未来与未知。
在人工智能这股大潮中,没有任何一个领域像“无人驾驶”一样,能够如此的复杂,综合地集成各类前沿科技,引起行业的广泛讨论与变革。 DT君近日独家专访了驭势科技CEO、前英特尔中国研究院院长吴甘沙,为你揭开无人驾驶的秘密。
数据科学的布道者
“当看到方向盘自己在转动,车辆的减速加速都非常平稳,你会慢慢对这种全新的事物产生一种熟悉感,建立起一种信任。”回忆起第一次乘坐无人驾驶汽车的情形,吴甘沙还记忆尤新。
虽然起初有些紧张,但是当他逐渐适应了无人驾驶的节奏,看到汽车非常自然地奔驰在道路上时,他说,“就感觉这个(无人驾驶)是完全有底气的” 。对于吴甘沙来说,选择all in无人驾驶,是“原力觉醒”的过程——就像苏醒后的绝地武士,这次,他想要“干一票大的”。
在进军无人驾驶领域之前,吴甘沙更广为人知的另一个身份,是英特尔中国研究院的院长。
还在复旦大学计算机系念书的时候,吴甘沙就拿到了英特尔奖学金,毕业后顺理成章地进入了这家全球最大的芯片公司。凭借在并行编程、嵌入式系统等技术领域内的突出贡献,2011年,他成为了英特尔中国研究院的第一位“首席工程师”,后来又成为了第一位非美籍华人院长。
从并行编程,到嵌入式系统;从大数据,到物联网;从机器人,再到如今的无人驾驶……在18年的职业生涯里,吴甘沙的研究领域横跨了多个不同的技术方向,不过不变的是,他始终在与数据科学打交道。
在2007年,图灵奖得主、关系型数据库的鼻祖吉姆·格雷(Jim Gray) 曾经提出了科学方法的“第四范式”概念。他认为与以往的科学方法不同,人类经历实验归纳、模型推演、仿真模拟的科学阶段,如今已经进入到了“数据密集型科学发现”时代,也就是我们的俗称的“科学大数据”时代。
“最早的‘大数据’可以追溯的16世纪中期的天文学的研究上。丹麦天文学家第谷喜欢观测星星,用二十多年的时间积累了大量精确的天文数据。虽然他的理论最终是错的,但是他采集数据,通过数据计算这些过程,已经涉及到了数据科学。第谷是一个非常好的数据采集者,后来,他的弟子开普勒就根据这些数据,计算出了行星运动的椭圆方程,佐证了哥白尼的日心说。开普勒比第谷擅长的,是数学计算能力。”回顾数据科学的发展史,吴甘沙认为最早可以追溯到第谷的天文学研究。
(图片说明:第谷的观测绘图。正是得益于这些数据,开普勒才提出了开普勒三定律,成为了“天空立法者”;图片来源:维基百科)
吴甘沙认为,要成为一个数据科学家,从历史的眼光看,不仅要有数据采集能力,还要有扎实的数学计算功底。到了现代,计算技术、业务知识以及沟通等软实力也都是数据科学家的必备条件。虽然已经在数据科学领域浸染了这么久,但吴甘沙并不觉得自己是一位“数据科学家”,他更喜欢把自己定义为一位数据科学的“布道者” 。
“我只是告诉大家大数据的价值,以及一些技术发展的趋势。”
在与DT君的交流中,吴甘沙始终保持着一种对大数据科学的谨慎态度。十几年来,他经历了大数据从曲高和寡,风靡一时,再到回归理性的过程,对数据科学的潜力和局限性有着更加清晰的认知。
舍恩伯格在《大数据时代》中提出的“数据要全集不要采样、拥抱混杂性无需精确性、相关性大于因果性”等理念已经逐渐被证明是“吹牛专用”;Google经典的流感预测则在2013年1月大大失准,被《科学》杂志称为“大数据的傲慢”。
“但是不可否认,是大数据带动了这一波人工智能的发展。”因为了解数据科学的发展规律,吴甘沙选择无人驾驶作为自己的新起点,这正是从他过去的经验中,看到了这次智能化变革的机会。
数据科学家庭中的叛逆小孩
如果把数据科学比喻成人工智能的“家长”,智能物流、智能营销、智能运维等智能化概念就是它孕育的“孩子”。无人驾驶也是其中之一,但是它是最叛逆的一位——因为它并不怎么依赖它的“大数据家长”。
无人驾驶,通俗来讲就是用机器取代人的驾驶行为,由车辆自己控制。“我们可以回想一下,一个人从去驾校学习到拿到驾照上路的过程,并不是一个大数据的过程。”吴甘沙告诉DT君,人类感知道路环境,然后用肢体操作汽车,最后根据日积月累的经验和知识判断不同场景下的操作行为,这更多的是强化学习、迁移学习和逻辑推理判断的过程,并非大数据。
“可以说,无人驾驶是一个不完全基于大数据的人工智能领域”,吴甘沙说到。 不过他也补充说,无人驾驶其实也用了大数据,但它们主要集中在汽车的感知层面。然而,大数据目前在可靠性上的缺陷,则一直没有出现有效的解决方法。
无人驾驶系统,主要包括感知、计算和决策三部分。其中感知层面会通过激光雷达、视觉传感器等装置来探测路况环境,而视觉传感器的核心技术——图像识别,以及其所使用的深度学习,是与大数据最紧密相关的部分之一。
深度学习是科学家模仿人类神经元的信息传递模式,对信息进行响应学习的过程。但是问题在于,机器能做出识别,但是并不能解释这个识别的过程。
(图片说明:卷积深度神经网络CNN作为深度学习的一种主要结构,在计算机视觉层面已经得到广泛应用;图片来源:维基百科)
“比如我们在国内训练机器去识别各种交通信号,可是到了美国,如果它碰到一个Stop Sign(停止标识),它没见过可能就识别不出来了。或者你在上面贴个胶带,有一点变化,机器可能就会看错,因为它不是真正理解这个意思。”吴甘沙告诉DT君,他们在与加州伯克利大学的合作研究也表明,基于大数据的深度学习如今并不能真正理解识别的过程。
这是一个“黑盒子”(black box)状态。
“我们是不可能把自己的生命安全交付到这样一个说不清道不明的东西上。”与其他人工智能行业不同,无人驾驶对安全性的要求极高。如果这个问题不解决,无人驾驶的适应能力不足,没有像人类一样的强认知能力,就无法处理复杂的开放环境。“如果针对开放环境,一个场景没有在它的数据中出现过,它的鲁棒性上(容错能力)是存在问题的。”
所以,吴甘沙认为,无人驾驶绝不能只依靠现阶段的“大数据”,提升鲁棒性是一个从算法到系统的全面工程。
(图片说明:谷歌的Waymo无人驾驶汽车。自2009年以来,谷歌的无人驾驶汽车已经达成了超过640万公里的真实路测,平均每5000英里才需要一次人为干预,但如今依然没有商业化;图片来源:Waymo官方网站)
不过,孩子虽然“叛逆”,离开了家长也是万万不行的。在如今的无人驾驶市场上,引领着行业发展的多是谷歌、百度、特斯拉、Uber等数据科技类公司,他们熟悉数据科学的历史和方法,也看到了这个叛逆期孩子身上,未来的巨大潜力。
吴甘沙也是如此。离开英特尔,创立无人驾驶公司驭势科技,他形容自己加入无人驾驶大军,是因为它触动了自己的“根本利益”——彻底解决城市交通的拥堵和安全问题。
“中国合伙人”
其实吴甘沙早有离开英特尔的打算。
从2000年至今,围绕数据科学的发展,整个世界是躁动的。大数据、云计算、移动互联网等浪潮一波接着一波,新出现的科技名词和概念让人应接不暇。十几年间,每一波技术浪潮都诞生了伟大的公司,他们重新定义了搜索、支付、购物、广告、金融、出租车等各种传统领域。
吴甘沙显然不满足于在英特尔的“岁月静好”,只不过前几次机会,他始终没有说服自己作出选择。直到2015年,当格灵深瞳的创始人赵勇用“无人驾驶”敲开了他的心门。
赵勇之前任职于Google X,是谷歌眼镜的核心团队成员之一。回国后,他创立了格灵深瞳,专注于计算机视觉和人工智能领域的研究。他与吴甘沙同是复旦校友,两人最初相识于2013年一场共同好友的饭局中。
2015年9月,赵勇找到吴甘沙,跟他聊了希望创办一家无人驾驶企业的想法,但当时却被吴甘沙婉转拒绝了。赵勇后来回忆,觉得可能是自己当时的想法太突然了,但正是这次谈话让吴甘沙在心里种下了要做无人驾驶的种子。一个月后,他却主动跟赵勇写了一封很长的邮件,最终决定要一起做这件事儿。
赵勇后来说,“我并没有说服吴甘沙,只是点了一颗火种,划了一根火柴,而这在他心里起了化学反应。”
有了基于人工智能的感知力,和对复杂系统的驾驭力,吴甘沙和赵勇觉得他们还缺了另外一个关键——基于自动驾驶本身的探索。于是他们俩在同年11月一个阴冷的下午,来到北京理工大学,找到了当时国内无人驾驶落地最好的姜岩。
姜岩博士毕业后一直留在学校研究无人驾驶,曾经获得2013年“中国智能车未来挑战赛”全国总冠军,在国内率先实现真实交通场景下的无人驾驶。由于常年在北京三环上测试自己的无人车,人送绰号“三环郎”。
(图片说明:驭势科技的初创人员,从左到右分别是彭进展、吴甘沙、周鑫、姜岩和赵勇;图片来源:驭势科技)
当时姜岩正在折腾自己的无人驾驶汽车。吴甘沙也是在那天第一次真正体验无人驾驶汽车,也就有了文章开头说的那种感受。
2016年1月吴甘沙、赵勇、姜岩等人正式成立了无人驾驶解决方案公司驭势科技。李开复的创新工场等领投,迅速完成了Pre-A轮融资。
然后他们“十月造车”,仅用时十个月就造出了第一辆无人车。2017年1月,他们在CES北展馆高调展出“城市移动空间”,一时间引起媒体高度关注。
(图片说明:驭势科技在2017年展出的“城市移动空间”无人车,内部已经没有方向盘等传统车辆控制元件;图片来源:驭势科技)
据吴甘沙介绍,“十月造车”对于他们来说仅仅只是开始。驭势科技接下来马不停蹄要做的,是实现无人车的量产化和商业落地。
不过,谷歌做了十几年还没有做成的事,驭势科技现在就能做么?
在杭州来福士广场的停车场里,吴甘沙已经用他的无人车开始了自动摆渡服务。这辆经过改装的高尔夫球小车,全身装了2个激光雷达,5个摄像头,能够自动帮助顾客找到自己的停放车辆。
(图片说明:驭势科技的无人驾驶车辆在杭州来福士广场停车场为顾客提供摆渡服务;图片来源:驭势科技)
吴甘沙的无人驾驶商业化策略,并非直接与巨头们硬碰硬,而是选择从L2级自动驾驶(DT君注:根据美国交通部下属的国家高速路安全管理局和国际汽车工程师协会的标准下的自动驾驶分类,从L0-L5分别对应人工驾驶、辅助驾驶、半自动驾驶、高度自动驾驶、超高度自动驾驶和全自动驾驶)入手,在高频、刚需、可量产的一些特定场景下,率先实现无人驾驶的商业化落地,例如机场摆渡、快递运输、园区微循环等,并非针对开放场景的通用型无人驾驶。
“无人驾驶如今在商业化上的困难主要有两个,一个是算法。它是弱人工智能,遇到没有见过的情形无法处理;另一个是系统,一台奔驰S级的轿车上面的代码行数是一家波音787代码行数的16倍。在这么一套复杂的系统,不能确保它没有BUG,不出危险。”吴甘沙认为,解决这两个难题的方法,就是“在有边界的场景和中低速的车速限制下开始商业化”。
而实现商业量产化的时间,吴甘沙说:“就是现在。”
无人驾驶的忧虑
3月20日,据美国有线电视新闻网CNN报道,在美国亚利桑那州,49岁的 Elaine Herzberg在过马路时被一辆Uber自动驾驶SUV撞倒并最终身亡。这是由全自动驾驶汽车导致的首起致人死亡的事故。目前Uber已经暂停其在美国和加拿大境内的所有自动驾驶测试项目。
DT君又联想到前两年特斯拉的“Autopilot”驾驶事故,这些再次唤醒了人们对机器的忧虑——无人驾驶真的安全么?一切被电脑控制后,我们的数据安全该如何保护?
“根据美国兰德公司的咨询报告,无人驾驶汽车至少要积累100亿英里的数据,才有足够统计学意义上的置信度,去判断它给人开是安全的。这相当于让一辆车连续不停地开500年。”吴甘沙说到,数据的积累并非一朝一夕的事情。在现阶段的无人驾驶研究中,尚未出现能够确保足够安全的通用型无人驾驶汽车。
(图片说明:吴甘沙在向媒体介绍无人驾驶的相关技术和概念:图片来源:驭势科技)
作为创业公司,驭势科技的战略是在特定环境下、限定中低车速来确保安全,率先实现商业化。同时,在L3级及以上的无人驾驶技术上持续研究,将“特定场景”的范围不断扩大,逐步接近通用领域。
针对Uber等无人驾驶的安全事故,吴甘沙认为,企业在无人驾驶商业化的过程中不能过于激进,既要拥抱科技创业,也要对汽车产业的原有规律具备敬畏之心。
另一方面,在数据安全上,无人驾驶天然地会收集用户出行数据,那要如何避免出现诸如《速度与激情》中出现的场景——黑客鼠标一点,成千上万的汽车就会失控上路?
“这要从正向和反向同时来设计系统,确保数据安全。”吴甘沙表示,他们的无人驾驶的正向的设计流程包括:Validation(系统规范正确性)、Verification(系统实现准确性)、Security(传统系统安全,足够冗余)和Control(控制权掌握)等四个部分。另一方面,他们还会和一些“白帽子”等黑客社区进行生态合作,不断模拟黑客行为修复系统漏洞,从反向提升数据安全。
在高科技领域中,存在一条横跨在早期市场和主流市场之间的巨大“鸿沟”。吴甘沙熟知杰佛里·摩尔的鸿沟定律,说服市场接受“无人驾驶”的到来,跨越这条鸿沟曲线,还需要让更多的人去熟悉“无人驾驶”,利用心理学的曝光效应等规律,让市场逐渐接受。
(图片说明:杰佛里·摩尔提出可科技“鸿沟”概念曲线:图片来源:维基百科)
在吴甘沙的设想中,未来城市将不再需要私家车、停车场,所有的汽车都是自动驾驶,乘客随坐随走;数据控制车流,再也不会发生拥堵或者车祸;每天会为人类节约出价值连城的时间成本,释放更多的土地面积……无人驾驶将从根本上改变人类的生活方式——这就是吴甘沙all in无人驾驶的“根本利益”。
DT君在读吴晓波的《激荡三十年》时,常常觉得那是一个群雄并起、风起云涌的商业时代。又过了十年,用那种豪情万丈的文字来形容这股“无人驾驶”的浪潮,依然妥帖:
当这个时代到来的时候,锐不可当。万物肆意生长,尘埃与曙光升腾,江河汇聚成川,无名山丘崛起为风,天地一时无比开阔。
2018年,这些“无名山丘”正在一步一步,悄然影响着我们的未来生活。
题图 | 站酷海洛
关于数据科学50人
数据科学50人项目是DT财经旗下数据侠计划重点内容产品,旨在与数据科学领域KOL共同挖掘数据内容的价值。我们从商业数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。
数据侠门派
吴甘沙,驭势科技联合创始人、CEO,致力于研发最先进的自动驾驶技术,以改变这个世界的出行。创业前为英特尔中国研究院院长,英特尔首席工程师,领导了英特尔的大数据技术战略长期规划,并为中国研究院确立5G通讯、智能计算和机器人三大方向。个人定位:略通商业智慧的资深工程师,尝试破坏式组织变革的技术管理者,用技术推动社会创新的赶潮人。
加入数据侠
“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系datahero@dtcj.com。
举报/反馈

DT商业观察

10.1万获赞 8.8万粉丝
「 DT] 是 第 一 财 经 旗 下 传 播 与 研 究 机 构 , 关 汪 互 联 网 、 消 费 、 文 娱 、 科 技 等 领 域 , 致 力 于 通 过 洞 察 人 群 趋 势 和 商 业 逻 辑 的 内 容 和 服 务 , 帮 助 读 者 更 洁 晰 地 认 识 世 界 , 助 力 品 牌 、 企 业 更 好 地 决 策 、 沟 通 和 连 接 。
鲲鹏计划获奖作者
关注
0
0
收藏
分享