一个华人数学博士,16年前如何押准中国大数据变革?

DT财经 2018-01-12 17:46 阅读:6061
摘要:文/胡世龙如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎样的一群人?他们在创造着什

文/胡世龙

如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学家,希望能让你们了解这些神奇的人和他们的神秘事儿,为你们一窥数据科学的未来与未知。


1990年的一天,一位即将博士毕业的华人学生站在加州大学伯克利分校的萨瑟塔(Sather Tower)上向远方眺望。这所出过近百位诺奖得主的顶尖学府的标志性建筑于1914年建成,见证了近一个世纪的潮起潮落。而将同样被见证的,还有20年后横跨太平洋的一场大数据变革。


这是个满城尽谈大数据的时代,各种大数据的创业公司多如牛毛。


但如果时间倒转回16年前,情况可就不同了。当时,美国互联网泡沫(Dot-com Bubble)刚刚结束,刘强东的京东还在中关村做着光磁产品代理,马云还在构思一个叫做淘宝的个人网络购物网站。


这时候要是有人说要在中国做一家数据公司,你会怎么看?


有个人就这么做了,而且理由是“我想办的公司要和数学相关,除了数据挖掘想不到什么更合适的”。


说出这话的是那个曾经站在萨瑟塔上的华人学生,他叫宣晓华,一个押对了这场中国大数据变革的人。


(图片说明:加州大学伯克利分校标志性建筑萨瑟塔 | 图片来源:Hui Hui)


他2002年创立的华院数据,16年间,从几人发展到近1000人,并且在公司体系内成功孵化了20多家各垂直领域的大数据创业公司。


在成立的前10年,公司没有融资,却成功度过了大数据的“萌芽期”。这背后,宣晓华是怎样的一个人?华院又是怎样的一家公司?


因为数学,爱上数据


上海中心城区东北角的杨浦五角场地区,一直以来都以高校众多、创新氛围浓厚著称。12月初的一个午后,在离杨浦创新地标创智天地一路之隔的一幢大厦内,DT君见到了刚刚开完会的华院数据创始人宣晓华。他的另一个身份是中国工业和应用数学学会副理事长。


待人谦和、偶尔微笑、略带浙江口音的普通话,是他给DT君的第一印象。而在DT君接触的华院几位员工看来,低调、爱给员工讲数学,则是宣晓华的另外两个“标签”。


宣晓华对数学的喜好,从小就开始了,后来一直延续到大学、硕士。再后来他又赴美国加州大学伯克利分校攻读数学博士。这所名校曾经走出了国际数学大师、微分几何之父、沃尔夫数学奖(数学界的诺贝尔奖)得主陈省身等华人数学家。


一切都顺理成章,宣晓华走得原本是一条外人看来极为学术的路线,但因为在博士期间跟着导师接触了相对偏向应用的计算数学(Computational Mathematics),跟美国工业界有了更多接触,这条路线发生了转变。


当时,计算数学虽然研究的主要是算法相关理论,与各种方程、算法打交道,但却是当时美国工业界的大企业所迫切需要的。这门学科在电路仿真、航天航空、机械设计、金融等环节,都十分重要,在当时算是热门的专业方向。


等到毕业后,宣晓华顺利进入了当时如日中天的惠普公司,从事电路仿真方面的算法研究和大型软件开发。


“当时惠普公司内部也有一些人在做类似数据分析的工作,但相对简单。而我们做的事是怎么样通过计算,帮助工程师更快更好地做产品设计,有点像现在的机器学习中的一种底层的支撑。”宣晓华解释道。


1997年香港回归了祖国,在惠普工作了7年的宣晓华也做出了相同的决定——回国。


谈及原因,宣晓华坦承,90年代中国蓬勃发展的形象已经让他颇有感受。“当时,中国发展很快,我就想回去经历一下,但说实话,在回国前其实并没有什么大的计划。也许工作一段时间后,又回去(美国)了。”


在他看来,也许在惠普工作可以让自己生活地很好,但却少了些价值。“计算数学在美国的应用、电路仿真方面的人才相对较多,是个很成熟的领域。而在中国,这个领域一直很少人愿意做。”


我们应该都听说过百度李彦宏放弃美国的生活、被妻子逼回国创业的故事。


宣晓华的故事则是另外一个版本:他是主动回的国,而且一开始也没想过要创业。


直到在国内企业做了几年技术总监后,2002年,宣晓华才下定决心牵头做些事情。他们在上海创办了华院数据,员工一开始只有几个人,办公室也不大,但宣晓华却始终觉得,数据这件事,有未来。


在创业之前,对于做什么,他其实也有过思考,但想来想去,还是要符合两点:一是要和数学有关,因为自己的专业是数学,这也是自己希望继续从事的;二是要有市场。


当时能同时符合这两点的选择很窄,最直接的就是数据挖掘(Data Mining),既能用到算法,也有一定的市场。


“那时,互联网还不算是一个数据的主要来源,但信息化却是很多企业都有了的。银行、证券业的核心业务系统等,都会产生一些数据。”


(图片说明:宣晓华在一个签约仪式上分享其对数据及人工智能的看法。)


宣晓华当时对中国大数据的未来很有信心。“我觉得数据量级趋势是越来越大,不仅是公司里面,在政府、企业、金融体系里面,数据量越来越多。而这个时候,如果有一家公司能够帮助企业把数据变成价值、增加收入,还能帮助决策,这样的生意应该是可以做的。”


16年前为何无风来?


2002年,国内很少有人有大数据的意识。以现在的眼光看,当时要做一家数据公司肯定很难,但机会往往就在你认为最艰难的地方。


有数据意识的公司少,意味着你更不容易找到你的客户。宣晓华找了两个行业作为切入口,一个是金融,一个是电信。这两个行业当时在国外已经有了相对成熟的数据挖掘经验,而国内的企业也许会有通过数据分析服务营销、扩大市场份额的需求。


但进一步接触后,宣晓华发现,当时的金融企业如银行等,对数据的分析处理需求并不大,没有这些“好像大家仍然活得很好”。而当时在国外,银行对数据分析处理的意识已经很强烈了。


在服务过少量的金融客户后,华院快速调整了业务方向,将主要突破口转向电信行业,这一次,果然找对了路。


2000年之后,中国电信行业发展很快,这体现在用户数的节节攀升。而其中,中国移动恰巧又是一家“好学”的公司,愿意尝试各种新的方法,最重要的是,这家公司也肯投入资金。这给华院这样做数据分析的初创公司提供了很大的机会。


大的全国性业务难以拿下,那就从省级公司做起,“各个击破”。新疆移动是华院的突破口,基于对方的内部经营分析系统留存的数据,做数据的整合分析,并分析用户的消费行为、使用偏好等,进而给出营销的具体建议。后来这样的合作又扩展到几乎所有的省级移动公司。


具体会给移动运营商提出哪些建议呢?宣晓华略有思索,回忆了两个他觉得可能跟每个手机用户都相关的业务:“比如会基于数据分析,向运营商提供资费套餐的建议,另外还推出了一种叫做“信用评分”的业务——也就是现在大家日常接触到的话费授信额度。”


这样的服务,华院一直做了7、8年。也正是靠着在电信行业的持续耕耘和稳定的业务来源,公司度过了大数据“萌芽期”,不仅稳定了下来,业务规模也越来越大,也开始进入新的业务领域,并且有能力孵化新的公司。


直到2010年,公司才真正意义上涉足第二个领域——电商。一来,当时中国电商开始起步,发展迅速,二来,曾经的移动业务也越来越不足以满足公司发展的需求。


“电商和移动运营商不同,运营商可以一次性付100万让你做一个项目,但电商的付费能力相对较弱,可能只是付几万块钱。”对此华院有着不同的应对战术。“你会发现这些电商商家的学习能力非常强,他们的竞争非常激烈。因此只要我们能推出好的解决方法,只要能对他们的业务有意义,他们就会很乐意去使用。”宣晓华点出了电商商家的特点。


华院推了一些针对中小网商的数据分析产品服务,希望靠“长尾效应”在电商领域打开一片新天地。


不仅仅是电商,按照华院方面的资料,后来公司的业务陆续扩展到了金融、电信、医疗、零售、电商等多领域,到2016年,实施的各种项目总计已超过600个。


( 图片说明:2012年,华院完成A轮融资,红杉资本参与其中)


一般而言,创业公司对外部资金的渴求往往都十分强烈。但在华院数据的发展过程中,有一点值得一提:成立的前10年内,公司没有对外融过资。


直到2012年,才有红杉资本的A轮资金注入。


对此,宣晓华的回答很直接:“公司成立后的前些年也没有人太关注数据这个领域,我们也没有去积极找投资。”


“另一方面...”宣晓华稍有停顿,这也是他态度严谨的一面,“是自己对外部投资也有一些顾虑,拿了别人的钱,对方肯定希望你发展得很快,但我们当时觉得,并没有那么多的行业愿意接受数据相关的产品服务。”


在DT君看来,围绕自己兴趣,不盲从接受外部资本的“指挥”,而是坚持自己的发展方向,这些特质和宣晓华的个性不无关系。


即便是公司规模越做越大、并且有了外部资本的助力,宣晓华对公司的发展仍旧有着坚持,并且做了一些独特的尝试。


2014年,华院数据开始深度孵化垂直领域的大数据公司,除了为创业者提供方向、资金、辅导外,华院顾问和技术团队也参与孵化,与创业者探索商业模式和新技术。


到目前为止,在这套模式下,公司已经成功孵化了华院分析、杭州数云、数尊等近20多家大数据应用公司,涉足互联网金融、医疗、风控征信、智能教育、时尚文化等多个领域。


“这种模式可以说是我们独创的,是一种新的企业管理模式,过去传统的企业内部大多都是事业部的形式,我们打破了这种模式,采用的是成立许多独立的公司,这是一种新的企业生态。”宣晓华曾经接受媒体采访时如此说道。


下一步:数据+智能


在交谈中,宣晓华毫不掩饰自己的数学情结。在他看来,数学本身是一个非常基础的学科,也是更深层次的应用的基础。包括人工智能等,都离不开基础的算法理论支撑。


(图片说明:宣晓华在中英开放数据与大数据论坛上演讲)


他这样想,也这么做了。


他跟自己博士时的导师史蒂文·斯梅尔(Stephen Smale,1996年美国国家科学奖、数学菲尔兹奖和沃尔夫奖得主)合作,发起成立了斯梅尔数学和计算研究院(Smale Institute of Mathematics and Computation)。


研究院研究的是偏基础理论的课题,但也是相对长远的。“虽然是基础的研究,不一定有经济上的效益,但也许未来有一天,就可能在特定领域孵化出新的业务。”他补充道:“做这件事更多还是自己的兴趣,我也希望我自己的员工能够在做技术开发的同时,也能接触一些更长远的研究。”


(图片说明:宣晓华(左)与导师史蒂文·斯梅尔(中),后者是1966年菲尔兹奖及2007年沃尔夫奖得主。)


一方面是加强基础的研究,另一方面则是在最前沿的领域谋求突破。


宣晓华表示,“数据+智能”会是公司未来最重要的方向。目前,公司已开始着力研发一些相对前沿的产品,比如分维(Fra+)智能画像引擎,通过小数据输入,跨学科模型智能分析,刻画立体的人,这已在金融、保险、营销广告、HR等领域实现应用。


另外,公司还开发了一款叫做华院智影的产品。这是一套基于人工智能的医学影像辅助诊断系统,目前已和上海的一些知名医院如上海胸科医院、仁济医院等有了合作,希望能帮助医生提升决策效率。


在宣晓华看来,如果人工智能技术真的能做到大规模的应用,那么无疑是颇有意义的一件事。


他也表示,公司还将持续推动孵化生态的发展,孵化出更多垂直行业应用的大数据、人工智能方面的创新公司。


回顾过去16年在大数据挖掘和人工智能领域的经验,宣晓华觉得,大数据是一种思维和方法,要有量化的思维。但是,数据有时候不够成熟,在必要时候还需要加入人的判断。


这不是他第一次提出这样的思考,他进一步解释:“我们不应该老是去关注到底有多少数据,大数据不是目标,怎么样去分析应用,让决策更好、做事更有效率、世界更美好才是目标。换句话说,也就是更加智能。”

题图 | 视觉中国


期待更多数据侠干货分享、话题讨论、福利发放?在公众号DT数据侠(ID:DTdatahero)后台回复“数据社群”,可申请加入DT数据社群。

关于数据科学50人

数据科技50人项目是DT财经旗下数据侠计划重点内容产品,旨在与数据科学领域KOL共同挖掘数据内容的价值。我们从商业数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。


数据侠门派


本文数据侠宣晓华,加州大学伯克利分校数学博士,中国工业和应用数学学会副理事长,复旦大学大数据学院外聘教授。2002年创办华院数据,在此之前曾在美国加州惠普公司从事七年多的建模/仿真的算法研究和大型软件开发,也曾参与创办易保网络技术有限公司,兼任公司技术顾问。



加入数据侠


“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请与我们联系。


版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 6061
0