学会在数据中找出“黑马”消费品牌,你也能秒变投资达人

DT财经 2017-12-27 10:38 阅读:299
摘要:文/数据侠水瓜品牌的出现并非无迹可寻,除了广告的投放外,供应链、品质与服务、信任成本、资源优势等参数,都能够成为品牌出现的决定条件。来自华盖资本的数据侠水瓜,就尝试通过数据分析为“独立大品牌”的出现机

文/数据侠 水瓜

品牌的出现并非无迹可寻,除了广告的投放外,供应链、品质与服务、信任成本、资源优势等参数,都能够成为品牌出现的决定条件。来自华盖资本的数据侠水瓜,就尝试通过数据分析为“独立大品牌”的出现机会构建一个通用的量化决策模型,并通过研究具体品类的特征,总结出更加细分的“投资策略”,希望对大家有所启发。

用大数据挖掘的方法,我们尝试通过111个品类23个维度的数据为“独立大品牌”的出现机会构建一个通用的量化决策模型(不同于以往的研究,我们不进行Case Study分析),去帮助我们在充分考虑当前产业特点和竞争环境的情况下,如何去判断一个品类的独立品牌机会,以及如何去发现背后的关键因素。我们通过逻辑回归和随机森林方法得到了不少有意思的结论,比如:

1. 广告推广是影响最大、显著性最高的参数,没有恰当广告策略、没有大量有效广告覆盖,几乎很难成为品牌。

2. 在广告的基础之上,信任难度大、产品化程度高、供应链成熟的品类,出现品牌的机会更多。

3. 需求变化或者技术进步导致某些因素的改变将非线性的改变一个品类的品牌机会,比如需求的产品化或者供应链的成熟

数据准备

为了尽量避免特征选取过程中的主观偏见和逆向选择,我从产业结构、产业特点、产品和需求属性、核心能力和竞争策略这5个角度选择了23个最基础的特征维度,具体名字和解释如下表所示。其中“是否有独立大品牌”是我们本次研究的目标特征。

(图片说明:特征维度选择)

基于上图,我们就可以对111个细分品类进行标注,最终形成如下图的111*24的大表。

(图片说明:品类及特征数据,后台回复“大品牌特征”,获取清晰大图)

分析方法

下图是两个模型对数据进行5次交叉验证的结果(80%的数据训练模型,20%的数据进行验证,共5次)。

相对于随机方法50%的正确率,线性回归平均正确率87%,随机森林平均正确率75%,可见本文的特征选择确实有助于我们提高判断能力,品牌的出现也并非无迹可寻。

(图片说明:算法分类准确度,5次交叉验证)

算法结果及特征分析

1 线性回归

我们使用Stata对数据进行了线性回归分析,得到结果如图2所示。

(图片说明:线性回归结果及各参数相关性)

我们重点关注置信度大于90%(P>|t|小于10%)的参数:

+ 大规模广告(正相关):广告是相关度最高、显著水平最高的参数,当然这里说的广告并不局限于传统广告,也包括社交网络等数字营销。这一点有些出乎意料,但似乎又是最容易被忽略的一个事实:再好的产品也需要让用户知道、需要教育用户、需要触及用户

+ 供应链成熟程度(正相关):供应链越成熟,出现品牌的机会越大。最典型的例子是家具,设备和信息化技术的进步大幅提高了家具定制化生产的效率,从而在极度分散的家具市场中产生了尚品宅配、索菲亚等优秀企业。可以预见这个市场的集中度还会进一步提高。同样的,随着供应链的不断成熟,手机、冰箱、洗衣机、电视机等行业的集中度已经得到了极大的提高。当然,供应链的成熟是一个与品牌成长相辅相成的过程,但这为我们寻找1到100的投资时点提供了线索。

+ 强供应链/强品质/强服务(正相关):都是为了用户价值,建立情感连接。这个特征其实囊括了本次研究并未具体提出的品牌定位等。

+ 信任成本(正相关):信任成本越高的品类,越有机会产生大品牌。比如汽车、家电、手机、奶粉等,建立信任的门槛高,也因此容易形成门槛。

+ 产品化程度(正相关):越能够贴近用户最终需求的产品,越容易形成品牌。比如食材很难形成大品牌,除了供应链的原因之外,还在于用户最终端的需求是方便的迟到安全健康美味的食品。反之我们看到方便面、火腿肠、速冻汤圆等品类由于能够满足用户随时果腹的需求,都产生了大品牌。从这一点看,国内即烹美食会有很大的品牌机会。

+ 历史传承、配方、IP(正相关):这是历史和文化的沉淀,是品牌简历的重要因素。

+ 所属上级行业是否有巨型公司(负相关):同行业的巨头公司,不利于该行业细分市场独立品牌的出现,除非你又不一样的供应链(这一点下一节可以看到),比如电商、奶制品、零食行业等

+ 上游资源优势(负相关):需要上游资源优势的品类往往比较难在市场化的竞争环境下规模化,所以是显著性最高的负相关参数。

其它参数虽然没有足够高的显著性,但由于特征之间并非完全正交独立,可能导致其特征权重被叠加到其它特征之上。比如我们剔除大规模广告特征后再做一次线性回归,“资本进入门槛/固定资产投入”的要重要性就凸显出来了。

(图片说明:剔除广告特征后的线性回归结果)

2 随机森林

通过线性回归算法我们可以看到单一特征的重要性,那么通过随机森林构建决策树,我们可以看到不同特征参数之间的关系与互动。下图是算法的结果。

(图片说明:随机森林算法结果,后台回复“大品牌特征”,获取清晰大图)

在决策树中,越上游的节点,包含信息量越大(对应格子中gini系数越大),比如特征“大规模广告”是所有特征中信息量最大的。根据样本是否满足这个特征(比如“大规模广告<0.5”),样本被分成左右两个子集,基于同样的过程,这两个子集会分别被信息含量最高(或者分类效果最好的)特征(比如左侧子集的“强供应链/强品质/强服务”和右侧子集的“信任成本”)的进行分类。这个分类过程将一直持续下去,直到最终的叶子节点只包含同一种类的样本,那么就形成图4所示的决策树。

我们可以得到如下一些观察:

+ 如果满足“大规模广告”+“信任成本-高(>0.75)”,那么这个品类基本上可以出现大品牌,除非“供应链成熟度差”+“供应链与上级品类的差异性小”+“资本进入门槛低”(典型如装修行业),或者除非“所属上级行业有巨型公司”+“供应链与上级品类差异小”(典型如饮料、零食行业)。

+ “信任成本-中”的行业同样有一定的机会品牌,但情况更加复杂,但总体看满足“供应链与上级品类的差异性-高”、“功能性>个性的需求”、“有用历史传承、配方门槛、IP”将有助于品牌的建立

+ 而对于不满足“大规模广告”特征的行业来说,品牌出现的机会会小很多,但仍然有一些转机,如果品类满足“强供应链/强品质/强服务”、“拥有历史传承、配方门槛、IP”、“供应链成熟度高”、“信任成本高”和“产品化程度高”中的一样或者多样条件

从单个特征的角度来分析,两个算法结论基本一致,但随机森林给了我们不一样的分析视角。

投资启示

回到我们研究的初衷,除了我们可以通过这些特征维度对品类、品牌进行判断之外,还能给我们投资方向的选择带来哪些启发呢?

我觉得至少有两点:

  1. 选择1->100的机会。互联网和科技类的投资更多是0->1,但品牌的建立永远是1->100的过程,而某些特征的改变将会加速这个过程,比如供应链的成熟(手机、家电)、产品化的加强(定制家具)、资本进入门槛的提高(汽车)等等,都将为我们提供10->100的投资机会。

  2. 选择逆境反转、老树新芽的机会。对于满足 “拥有历史传承、配方门槛、IP”、“供应链成熟度高”、“信任成本高”和“产品化程度高”的品类和行业,如果加上合适的产品定位和广告策略,有机会出现大的独立品牌。比如王老吉/加多宝,比如白酒

具体品类分析

在上面一部分中我们并没有把构建的决策模型用来测试任何具体品类,所以在下面的分析中,我们将把无人货架、酸奶、沙拉、曲奇/糖果、坚果、果汁、酒类、化妆品/洗护用品、家具、服饰/鞋、3C电器这11个品类各23个维度的数据的数据应用到我们建立的逻辑回归模型中,来看看它们的独立品类机会和背后的原因(我们并没有选择任何有品类特殊色彩的维度,主要是为了构建的模型具备更好的通用性,当然同时也会牺牲一些准确度)。

总体上我们可以得到三类结论,同时也能得到三类投资策略:

1. 基本无机会:如无人货架、酸奶、沙拉、曲奇/糖果、果汁这5个品类。

2. 存在较大机会:如化妆品/洗护用品、服饰/鞋、3C电器这3个品类,但竞争也最为激烈

3. 存在条件机会:如坚果、酒类和家具这个3个品类,独立品牌的出现需要某些行业条件

测试数据准备

如下图所示,我们按照之前的数据维度和同样的标准,列出了无人货架、酸奶、沙拉、曲奇/糖果、坚果、果汁、酒类、化妆品/洗护用品、家具、服饰/鞋、3C电器这11个品类的数据。为了看到一些核心参数变化对结果的影响,我们为每个品类准备了三组数据:

第一组数据反应了基础的行业特性、竞争格局和竞争策略,但是并没有大规模广告(因为广告是最重要的维度之一)。

第二组数据在第一组数据的基础上加入了大规模广告策略的影响,以及部分参数的提高(比如品质/供应链/服务等),以反映在品质或服务上的特殊提高。

第三组数据在第二组数据的基础上进一步加强了竞争策略的假设(比如线下渠道和线上渠道策略的加强),但更重要的是我们也反映了某些行业参数和需求的变化,比如产品化程度、供应链成熟程度、IP等等,我们可以看到这些参数的变化对品牌成功概率的影响。

(图片说明:11个品类的测试数据)

测试结果

下图第二列是我们通过线性回归模型得到的“概率”,概率越大反应该品类出现独立大品牌的机会越大。我们将75%的概率设定为“成功出现独立品牌”的判断标准(毕竟随机判断得到概率是50%,所以不能用50%作为判断的准则),并将其用红色标注了出来。

(图片说明:测试结果,11个品类的独立品牌机会)

通过对结果的分析,我们可以将我们的测试结果分为三类:

1. 基本无机会:无人货架、酸奶、沙拉、曲奇/糖果、果汁这几个品类出现独立大品牌的机会很小,即便是在广告、渠道、服务等方面做到很好;所以这些品类要么是巨头的战场,要么被分散的渠道把控:

+ 无人货架:无人货架是最近最火热的品类之一了,在几乎没人看好其竞争格局的情况下,依然有大量资金看好其在终端连接消费者的能力。从我们的3组测试结果来看,无人货架品牌突围的机会堪忧,主要还是因为过低的竞争门槛和不利的行业格局。

+ 酸奶:在3组数据下酸奶的独立品牌机会都未超过我们设定的门槛,其核心问题还是行业存在乳业巨头公司,同时供应链和上游资源也存在一定瓶颈。

+ 沙拉:沙拉面临更加复杂的品牌挑战,无人货架存在的问题以及酸奶存在的问题沙拉都有,即便是在没有行业巨头的情况下,沙拉 3组数据的测试结果都未达到品牌门槛。

+ 曲奇/糖果:面临和酸奶类似的问题,在供应链上略有优势,核心的问题是未生逢其时,行业已存在巨头公司(技术和模式颠覆并不在本文所考虑范围之内)。

+ 果汁/饮料:面临和沙拉类似的问题,虽然供应链相比之下更加成熟,但行业已存在大型公司

2. 存在较大机会:在产品和定位没有问题的情况下,化妆品/洗护用品、服饰/鞋、3C电器这3个品类最容易出现独立品牌,即便行业已经有大型公司、即便没有大规模广告的协助下依然存在相当的机会,这与一定的进入门槛、成熟的产业链、产品化的需求、较高的信任门槛不无关系。但是由于独立品牌和行业巨头基本在同一起跑线上,所以面临非常激烈的行业竞争。

3. 存在条件机会:坚果、酒类和家具品类在广告的协助下,还需要一些因素的辅助才有出现独立大品牌的更大可能:

+ 比如坚果品牌的出现关键在于行业没有出现过大品牌,这点是坚果与曲奇/糖果最大的区别(提升11%概率,虽然只是帮助坚果略微高于75%的门槛)。

+ 酒类新独立品牌的出现最好有历史传承或者IP的辅助(提高20%概率),所以老酒厂发新芽的机会远大于纯粹的新品牌。江小白是否能成功现在还很难看清楚,但它确实在IP化方面做得不错。

+ 而家具品牌出现的关键在于更加产品化和生产效率的提升(共提高40+%概率,比如定制家具和对应的模块化生产技术)。

投资启示

面对这三类结果,我们能得到哪些投资思考?无机会的品类就不适合投资,或者有机会的品类就一定适合投资?

我倒是认为这三种品类都有投资机会,但适合不同的阶段和不同的投资策略。

第一类“基本无机会”的品类更适合产业投资者。

这其中比较特殊的产业投资者其实是美元基金,因为他们作为早期互联网产业的推动者,已享受到了中国互联网发展带来的红利,也与互联网产业有着特殊的联系,所以他们敢为了潜在的价值和想象空间投类似“无人货架”的品类,这是因为美元基金有特殊的产业联系和安全感,而正是所有人民币基金所缺失的。

第二类“存在较大机会”的品类更适合早期投资和二级市场。

品类的机会并不代表个体公司的机会,由于竞争激烈,该类公司的成功概率其实并不高,所以适合早期投资人进行系统布局;反之也适合在品牌初步建立之后,通过后期投资甚至二级市场投资获得公司规模扩张的收益。

第三类“存在条件机会”的品类需要独特的眼光和产业理解。

这类行业非常适合快速成长,又需要建立差异化能力的新基金。我个人也更加喜欢这类投资机会,因为有一定的判断门槛,同时在研究清楚后能够得到足够多的确定性,这一点也正好在最近完成的几个项目中得到了很好的实践,有机会再和大家分享。

最后,需要声明的是本文所用的数据以及模型参数的选择都存在一定主观判断,所以得到的结论肯定会有所偏差;另外本文所有得出的判断本质上只是一个概率,并不意味概率小就一定没有品牌机会。

但如果我们建立的决策框架能从某些方面帮助我们思考亦或带来一些启发,那么创作这篇文章的初衷也算是实现了。

注里写:本文根据数据侠水瓜发布在水小瓜投资笔记(ID:guaxiaoshui)的文章《深度消费:111个品类 * 23个维度,大数据挖掘揭示如何成为大品牌 | 投资瓜》,《深度消费:大数据量化11个品牌机会与3类投资策略 | 投资瓜》编辑整合而成,已获作者授权。本文仅为作者观点,不代表DT财经立场。

编辑 | 赵楠

题图 | 视觉中国

期待更多数据侠干货分享、话题讨论、福利发放?在公众号DT数据侠(ID:DTdatahero)后台回复“数据社群”,可申请加入DT数据社群。

数据侠门派

本文数据侠水瓜,华盖资本TMT基金副总裁,主要关注电商/零售/消费,大数据/Fintech/企业服务。

加入数据侠

“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请与我们联系。

版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 299
0