猎聘网CDO单艺:大数据很热,钱很多,但你真的喜欢它么?

DT财经 2017-08-04 10:22 阅读:99
摘要:文/程一祥大数据如今像一个科技圈的“万人迷”,人人趋之若鹜。而有数据显示,大数据人才的短缺指数,比其他行业要高出2~3倍。在这股数据潮面前,你是想当看客,还是也想入场?DT君最近采访了一位大数据行业的

文/程一祥

大数据如今像一个科技圈的“万人迷”,人人趋之若鹜。而有数据显示,大数据人才的短缺指数,比其他行业要高出2~3倍。在这股数据潮面前,你是想当看客,还是也想入场?DT君最近采访了一位大数据行业的“内参”——猎聘网首席数据官单艺,他从自身职业经历说起,结合猎聘网的内部数据告诉你:大数据有钱途,高门槛,但请三思而后行。

这股数据风,从20年前的硅谷就开始刮起来了

1999年的美国硅谷,互联网行业正是一片欣欣向荣的景象。

在此之前的几年,Mosaic网页浏览器的出现正式点燃了美国互联网的热潮。(DT君注:Mosaic是最早的网页浏览器之一,支持多种互联网协议,是微软Internet Explorer浏览器的前身。)给自己的公司建一个网站,迅速成为上市公司们的必选动作。突然间,大家开始意识到:互联网这种高效、双向、即时的通讯模式正在变革原有的商业社会。

广告、销售、制造等各行各业的人们,开始涌入互联网这个新兴行业。一时间,各路科技公司遍地开花,股票市场上的科技股们各个涨势凶猛。

对于很多在学校读计算机科学的学生们来说,那是他们投身这场科技革命的原点——因为当时在硅谷,到处都是工作机会。

(图片说明:旧金山的硅谷路标。作为互联网科技的“革命圣地”,硅谷聚集了全球最优秀的科技公司和人才。虽然2000年的互联网经历了一波泡沫经济的破裂,但是包括互联网基建、互联网工具、还有门户网站等在内的科技行业却也因此而得益,最终发展了起来。图片来源:视觉中国)

如今猎聘网的首席数据官单艺,就是在那个时候加入到了互联网的大潮。当时单艺刚来到美国,在亚利桑那大学攻读管理信息系统的博士学位。“比起为发表论文而做研究,我感觉自己对解决业界的实际问题更感兴趣”,单艺说当时美国热烈的科技氛围,让他最终决定提前离开象牙塔。

告别了亚利桑那炙热的沙漠和学院派宁静的科研生活,他从学校转身进入硅谷,开始了自己的大数据职业生涯。今天,活跃在各行各业的数据专家们,大多都经历了那个时代,走在了数据腾飞的风口浪尖。

“当时还没有什么大数据的概念。在我学习《运筹学》、《数据挖掘》等专业课时,课程会要求我们用信息(数据)去作决策。所以在读书的时候,我就逐渐感受到了数据的重要性。”学生时代培养的数据直觉,潜移默化中影响着单艺的职业选择和判断。

“我在硅谷的第一份工作,是负责客户关系管理(CRM)领域的数据挖掘。”数据分析师职位,可以算是单艺在数据界的“出道”。

当年的数据挖掘还没有Hadoop等分布式系统架构,也没有完善的工具和语言。单艺他们当时做数据分析,都是用的Excel,不够用的时候也会用C++/Java自己写一些程序。那个时候数据挖掘的目的也非常实际,不是人工智能,也无关人类未来,“就是解决实际业务问题,那一单单的数据可都是钱呐。” 17年过去了,虽然如今大数据行业与当时已经截然不同,但单艺谈论起刚工作那会儿的事儿,依然兴趣盎然。

“我当时每天思考的,都是如何根据业务从简单的统计做起,怎么建模,怎么打通数据,最终解决实际问题。”虽然之后单艺从事了很多不同的工作,但“用数据解决问题”一直是他做选择时的核心观点。这也是为什么他放弃了继续留在学校读博,转而投身更接地气的数据界的主要原因。

从数据分析师到CDO,他把大数据的“坑”都踩了一遍

虽然第一份工作做的是数据分析师,但是单艺骨子里却一直有一颗程序员的心。

他一直喜欢自己写程序,在工作之余还保持着高昂的写代码热情。后来他甚至为公司开发了一个日均处理百万条信息的、高可靠性的信息总线系统,用于打通公司内部的数据传输,然后顺便走上了系统开发的程序员道路。

从分析师到程序员的转型跨度,不亚于重新换了个职业。

“其实,到现在来看,这也是区分大数据行业两种不同人才的重要标准。”单艺认为,数据分析师其实更偏咨询,它要求与人沟通的能力和解决实际业务的能力;而程序员,或者说数据工程师,则更偏实践,要求的是编程、算法等技术攻关能力。

“不过我自己转型的时候还是蛮顺利的,这可能跟我之前一直比较喜欢编程有关吧。”单艺腼腆地笑了笑。他现在仍然每天都在写代码,顺手写个模型或者脚本解决一些业务问题,对他来说仍是日常生活的一部分。

随着技术和计算能力的不断发展,数据的应用开始迅速超越传统行业,向数据量更大、计算更复杂、应用价值更超前的互联网领域迈进。传统的描述性统计(方法)和Excel(工具)已经越来越力不从心。于是,单艺接下来从程序员又变成了算法工程师,完成了从商业数据挖掘,到真正“大数据”业务的转型。

“当时离大数据最近的行业:一个是搜索,后来是广告。” 单艺接下来选择了搜索领域,加入了搜索业巨头雅虎。基于搜索的海量数据,他终于有机会在最前线去探索大数据的价值。

(图片说明:雅虎搜索是美国第三大搜索引擎,仅次于Google和微软的Being;根据Alexa网站流量排名,雅虎如今依然处于世界第六的位置。)

误判了移动搜索的业务前景,算是单艺在大数据路上踩过的一个坑。随着智能手机的普及,他起初认为如日中天的互联网搜索业务将来也会成为移动端的一大特点。但是移动端的搜索入口最终被海量APP占领,单艺坦言,这是他当初没有想到的。

后来他又陆续工作了几家公司,担任过VP、CTO,也创过业,一直到今天出任猎聘网的CDO(首席数据官),管理一个数十人的数据科学团队。这么多年来,可以说数据圈里的“坑”,单艺多多少少都踩过一遍了。

数据是用来解决问题的。”这是他多次职业选择中始终坚持不变的原则。

大数据是为了实践,不是搞场实验

一身Polo衫,穿着休闲短裤,如今已经是CDO的单艺还保留着当年程序员的那种质朴,实诚的感觉。

访谈中他一直强调自己是“做技术的”,是“要解决问题的”。DT君觉得,这可能是如今那些“十天掌握Python、零门槛机器学习实践、一个月速成全栈工程师”等满天飞的大数据广告,所欠缺的一份态度。

其实从行业中看,“数据”的口号虽然叫得很火,但是“CDO首席数据官”这个职位对于很多公司来说还是非常超前,它并不是一个常设岗位。DT君有些好奇,CDO平常的工作内容都是什么呢 ?

单艺说,CDO的职责核心是:如何让数据在公司里产生最大价值和竞争优势。

“在实际中,CDO的工作内容是分阶段的。开始的时候,我要负责搭建一个数据团队;后来就根据问题、业务驱动来做项目;当团队比较大、项目较为成熟后,我就要负责战略方向的创新,人才的培养和数据产品化等。”

是骡子是马,拉出来溜溜。CDO到底在做什么,本质上还是要看一个公司的数据产品。在今天的大数据产品中,最核心的关键词一定是“智能化”。

(图片说明:Google Trends显示的最近五年大数据(Big Data)与人工智能(Artificial Intelligence)在中国区域内的搜索指数。从2014年底开始,大数据和人工智能开始逐渐受到人们关注,2015年迅速升温。2016年初,AlphaGo的横空出世带动了人工智能的持续火爆。到今天,人工智能作为大数据应用的一个主要载体,依然活跃在公众的搜索视野中。)

单艺这两年交的答卷,是机器伯乐和薪酬数据库。

在互联网招聘领域,最核心的问题在于:人岗匹配。猎聘做的是全行业招聘,但是360行的每个行业都有不同的技能组,如何让计算机能够理解职位、职能和简历?并且做到智能匹配岗位和人才呢?

“比如招聘程序员和记者,程序员相对好定义一些,你可以说他需要会Hadoop,会Python,会R;但是记者又要怎么数字化呢?你说他会写文章?什么叫‘会写文章’?对程序员的职能定义也一样有很多细节方面的挑战,比如如何判断这是一个熟练的Python工程师?什么叫‘熟练’?设想有数千个职能要定义,这个是非常有挑战的任务。”

这就需要一套机器学习的模型。整体逻辑就是针对不同行业、职位、职能和简历,做简历相应的数学画像体系,然后用历史数据不断去训练机器,学习HR、用户的使用偏好,从而进行合理的推荐。

这有点像淘宝的推荐系统。公司的HR就是购物的人,一份份的简历就是淘宝页面的商品,当HR不断去在上面选择简历的时候,机器就会越来越懂公司选人的偏好,给HR推荐更加合适的简历。反过来也是一样,当求职者不断投递简历的时候,机器也会根据你的投递偏好、简历和职位的内容推荐更合适的单位。

“从指标上说,新算法的上线让网站推荐系统的满意率和业务量,比以前高了很多。”这是用数据创造的价值。

单艺还表示,未来猎聘还在考虑将求职者性格和公司文化这些因素也纳入机器运算的范畴。从技术上来说,这会涉及更多心理学、社会学的内容,以及大量的标注数据。这是之后人工智能发展的方向之一。

谈钱不伤感情。所谓求职,形式上是人岗的匹配,本质上是一个利益关系的交换。那钱的问题就不能不谈。

“猎聘制作了一个内部的薪酬数据库用来服务市场对薪酬数据的需求。”目前,这是一个主要服务于企业的数据产品。猎聘的数据来源包括线上采集和线下调研两个方面。在确保数据准确性上,单艺表示数据库大部分数据都是通过算法来矫正,清理的。他们会经常把数据库的分析结论制作成报告,发挥数据产品的社会价值。

比如,他们最近发布的报告就称:中国大数据行业正在蓬勃发展,但是人才难觅,行业薪资普遍较高。

21世纪最贵的是什么?人才!

于是DT君问了单艺一个很关键的问题:为什么这个大数据行业会如此火爆呢?

DT君:“是不是因为它赚得多?”

单艺:“前提是你要考虑自己的兴趣,你要真正喜欢。”

DT君:“但是它确实赚得多?”

单艺:“如果硬上弓,很容易触摸到天花板。”

DT君:“但是它确实赚得多?”

单艺:“它确实赚得多。”

那到底赚的有多多呢?单艺说,根据猎聘的统计数据,大数据的核心职能如算法工程师、大数据工程师和数据分析师缺口很大。不同的职能方向、年龄等因素,都会成为影响薪酬的因素。“整体来讲,比同工龄的的其他职位,薪酬水平要高出20%~50%。”

DT君在猎聘网上随便找了两个职位,你感受一下:一个3年工作经验的记者的年薪在10-18w;同样的,3年工作经验的大数据系统工程师的年薪则在24-48w。

(图片说明:猎聘网上随机搜索“记者”与“大数据工程师”职位的公开招聘信息对比)

当然,从数据分析的角度看,这么比较薪酬并不科学,但是数据行业的火热可见一斑。

另一方面,这个行业也确实很缺人。根据猎聘网内部的人才短缺指数,大数据人才的短缺指数,相较于其他行业,要高出2~3倍。原因主要有两个方面:第一,历史上没有积累;第二,对人才的综合素质要求高。这个岗位普遍要求人们掌握复杂的技能,算法、编程、架构设计和业务理解等。

“但是归根结底,对于每个人来说,这是一次重要的职业选择。你要真正喜欢它才行,薪酬和人才指数,并不是关键。”

单艺接下来讲了一个他在美国工作时候的故事。

大概十年前,互联网开始流行网络博客的产品。当时他住在斯坦福的大学校园里,在工作之余,他很喜欢上博客浏览博主们分享各种有趣的事情。当博客文章越来越多后,他在寻找某些博客时,开始变得非常困难。

“我发现中文的博客上竟然没有搜索功能,我想,为什么我不自己写一个博客搜索引擎呢?”于是,他就从斯坦福的校园里拉了一根网线,建了个服务器,不声不响地把自己闷在家里一个月,hack了一个中文的博客搜索引擎。

“当时我就在想:啊!斯坦福的网是真快啊,哈哈。”

这个小产品当时在国内的博客圈里还引起了一阵骚动。“每天都会有几千人来访问,我当时就觉得,嘿,还蛮好玩儿的。”

这个故事不仅要告诉你,兴趣是最好的老师;还要告诉你:兴趣也是最好的财神爷。

“当时我是出于个人爱好,做了这么个小产品。后来一个在雅虎工作的朋友看到了,感觉:哎呦不错。他就找到我说:我们正在雅虎做搜索引擎,你要不要来一起做做看?”

于是,单艺就加入了当时的搜索行业巨头雅虎。时间一晃,就到了现在的位置。

“做大数据,最重要的是:你要做的东西,是有价值的,这是最关键的。”回顾过去,单艺坦言自己也走过弯路,比如误判了移动搜索的业务前景;也经历过低潮,但是每当遇到岔路的时候,他总会问自己:这个东西能不能产生价值?你是不是真的喜欢?

没错,这个行业很热,这个行业钱很多,但当你也想当弄潮儿的时候,DT君建议你不妨先问问自己:我真的喜欢么?如果答案是Yes,那就不要犹豫。

再多的坑,也怕有心人一个一个地踩。踩实的路,回头看,就是一条康庄大道。

数据侠门派

单艺,毕业于清华大学和美国亚利桑那大学,分别获得了管理信息系统专业的学士和硕士学位。 目前担任猎聘网首席数据官,负责机器学习技术和产品研发、商业数据分析以及大数据基础设施建设。他具有17年的数据挖掘和系统研发经验,曾经入选“影响中国大数据产业进程100人”。

如何加入数据侠

“数据侠”栏目网罗全球最IN的数据侠客,利用人工智能、机器学习等各种前瞻算法,从数据的视角洞察消费生活的方方面面,打造理性酷炫、活泼有趣的数据分析盛宴。用大数据,阐述事实及其背后的故事和逻辑趋势。

DT时代超级英雄正在组队!你也想要成为数据侠吗?请将你脑洞大开的数据作品,联系我们发送吧~


版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 99
0