第4章数据与营销

书籍名:《奔跑吧，程序员》作者：叶夫根尼.布里克曼

    《奔跑吧，程序员》章节:第4章数据与营销,宠文网网友提供全文无弹窗免费在线阅读。!

我们在上一章学习了如何根据自己的创业点子设计出MVP。在本章，我们将学习如何利用数据与营销去完善MVP。

数据就是如何把一些假设和猜测转变为具体、可操作的行为。我会讲讲为什么测量总是比不测量更好，也会详细介绍在所有创业过程中都应该跟踪的度量指标，谈谈如何应用数据驱动开发的方法，利用这些指标更好地做出决定。

营销就是如何让用户找到你的产品。如果你创造了一款不可思议的产品，却没有人真正知道它的存在，那这一切就没有意义了。我会逐一介绍创业公司可以使用的绝大多数常见的营销策略，包括口碑营销、市场推广、促销和品牌化。

4.1  数据

产品经理的工作就是要把两件简单的事情说清楚：

·  我们正在进行什么比赛？

·  我们怎么得分？

把这两件事情做对，就可以不经意间聚集一批在技术、运维、质量、设计和市场推广上具备天赋的杰出人才，在同一个方向上聚力前行。没有这两点，无论做多少优化和执行管理，都拯救不了你。

——Adam  Nash，Wealthfont主席、CEO

如果想要构建成功的产品，就必须知道你在进行的是什么比赛，如何得分。对公司来说，“比赛”其实就是“使命”的另一种说法，9.2节将做详细介绍。现在，我想先关注如何得分。尽管有时候我们唯一有意义的测量手段就是直觉——比如在可用性研究中观察用户的愉悦程度。但在多数情况下，更好的记分方法是收集、分析数据。

现代软件创业公司的强项之一就是可以非常方便地收集业务方方面面的数据。使用Google  Analytics、KISSmetrics和New  Relic这样的工具（阅读8.5节了解更多信息），你可以追踪到用户来自哪里、他们是如何使用产品的、哪个功能会带来最大的收益、技术栈的哪些部分拥有最好的性能，等等。我们可以借助这些数据，充分考虑后再决定做什么产品、使用什么销售渠道、技术如何进化，而不是盲目地猜测。在做决策时利用好数据，主要玩的就是测量的游戏。

测量：基于一个或多个观察结果定量地降低不确定性。

——Douglas  W.  Hubbard，《数据化决策》

从它的定义中可以发现，测量并不是要消除不确定性，而仅仅是要降低不确定性。我们永远不可能消除不确定性，不论是商业还是生活，任何地方都不可能是完全确定的。没有一种测量是完美的，但我们不能仅仅因为测量是不精确的，或者还存在一些不确定，就认为它是毫无价值的。不完美的测量通常比没有测量或者按自己的意见（哪怕是专家的意见）行事要更好。密歇根大学的研究人员收集的数百个研究结果表明，基本的测量和定量的分析通常比人类专家有更出色的表现。

·  在预测大学新生的GPA时，对高中排名和能力测试做个简单的线性模型，就能胜过经验丰富的管理人员。

·  在预测罪犯再次犯罪的可能性时，基于犯罪记录和监禁记录的预测就能好于犯罪学家的推测。

·  在预测医学院学生的学习成绩时，基于过去的学习成绩所建立的简单模型比对教授进行访谈得到的预测效果更出色。

·  在二战时，对海军新兵在训练营中的表现情况进行预测的研究表明，根据高中档案建立的能力测试模型比专业的面试官的效果更好。即便为面试官提供了相同的数据，当他们的专业意见被忽略的时候，预测的结果才是最好的。

——Douglas  W.  Hubbard，《数据化决策》

人类，即便是专家，都会非常非常频繁地犯错。数据和测量就是我们把事情做好的最好的工具。如果你不是数据分析专家，也不用担心。在创业公司中，需要测量的大多数东西都不需要用到复杂的工具或方法。我们的目的并不是要在科学期刊上发表什么，而是要收集一些数据，提高我们做出好决定的概率。要实现这一目标，简单、不完美的方法对我们来说一般已经足够好了。

此外，正如本书经常提到的，测量也是一个迭代的过程。我们不一定从第一天开始就要建立起完美的跟踪和分析系统，也不一定为了获得测量的价值就去测量所有东西。事实上，我们从最初几次测量中得到的回报通常是最多的，随着越来越多地使用精心设计的方法，我们得到的回报反而越来越小。可以先从小的测量开始，哪怕先跟踪一个单独的指标（阅读4.1.1节了解更多信息），然后再逐步改进方法，测量更多的内容。

当然，并不是所有东西都可以测量，或者都应该被测量。对于每一种数据X，我们要问自己两个问题。

（1）如果我可以测量X，它至少会影响一个具体的决定吗？

（2）该决定的价值超过测量X的成本吗？

如果这两个问题都无法回答“是的”，那么就不值得去测量X。话虽这么说，大部分人并不清楚能够以最小成本、付出最少努力去测量什么东西。《数据化决策》一书介绍了如何对各种各样的概念进行量化，包括一些看似模糊和不可测量的概念，比如产品质量、品牌认知、安全以及风险。

一切东西都可以测量。不管以什么样的方式，如果一种东西能够被观察到，它本身就提供了某种类型的测量方法。不管这样的测量是多么“模糊”，只要它可以让你知晓更多的东西，它就是一种测量。而正是那些最可能被认为是不可测量的东西，几乎都可以用相对简单的测量方法去解决。

——Douglas  W.  Hubbard，《数据化决策》

接下来看看几乎所有的创业公司都需要跟踪的一些指标。

4.1.1  需要跟踪的指标

创业公司应当关注的数字对每家公司来说都是不一样的，但是有几种类型的指标是所有公司都需要跟踪的：

·  获取（acquisition）；

·  激活（activation）；

·  留存（retention）；

·  推荐（referral）；

·  收益（revenue）；

·  神奇数字（the  magic  number）。

前五个指标——获取、激活、留存、推荐和收益来自于Dave  McClure所著的Startup  Metrics  for  Pirates一书，这5个词的字母缩写“AARRR”也很好记。最后一个指标——神奇数字，是从前5个数字得来的。这个数字可以为我们提供一个很好的全局视角，了解创业公司的发展情况。

1.  获取

我们应该关注的第一个指标是获取，或者说是用户如何找到你的产品。4.2节将介绍，如果没有人能找到你的产品，那无论它多么出色都没有意义。为了帮助人们找到它，我们可以使用搜索引擎、广告、博客、email、TV和社交网络这样的营销渠道。因为用户的获取是在漏斗的顶端，是我们实现用户增长最先要面临的问题，所以通常也是最难突破的瓶颈。唯一可行的方法就是针对不同的用户获取渠道进行不同的试验，仔细跟踪哪些渠道是可行的，哪些又不可行。

2.  激活

在用户发现了产品之后，接下来要跟踪的就是激活这一指标，这是测量有多少用户被你的产品所吸引，进行了账号注册、邀请朋友、执行搜索或者支付等动作。如果你传递了错误的消息，或者你的设计没有清楚地让用户知道要做什么，又或者你的用户获取渠道带来了错误的受众，用户也许会反弹，即在看到产品之后立即离开，不执行任何操作。

通常情况下，随着我们对产品的改进以及更有针对性地获得用户，产品的激活率也会随之上升，反弹率会随之下降。这是可以通过深度的A/B测试（阅读4.1.2节了解更多信息）去提升的一个指标。此外，我们也一定要根据用户获取的渠道对激活数进行分解，了解是否有某些渠道能够产生较高的激活率。也许通过Facebook广告带来的用户有80%的反弹率，而通过Google搜索带来的用户只有50%的反弹率。这样的话，你就知道需要调整Facebook的广告定位，或者完全停止使用广告，加倍投入去提高搜索排名。

3.  留存

下一个阶段就是让激活的用户回来并再次使用你的产品。在某种程度上，这也是一种获取，但是用户的留存通常利用的是不同的渠道，所以应该分别进行跟踪。大多数用户都会被许多事情分散注意力，所以他们记不起要继续使用你的应用或者回到你的网站，除非你特地提醒他们。这就是为什么所有产品都要你订阅他们的邮件新闻；每一家公司都要维护一个博客，提供有用的提示和建议；所有移动应用都要给你发送通知；许多游戏还设定了一定的时效性，要求你不断回到游戏中，否则就会丢失进度。已经激活的用户甚至也需要多次看到产品，才能坚持使用并把它作为日常习惯。

我们还要跟踪在一个星期、一个月和一年之后有多少访问者会回来。就像部分用户获取渠道会有更好的表现一样，我们也要跟踪哪些用户留存渠道是最有效的。最后，请务必根据激活用户和获取用户的方式对用户留存数字进行分解。例如，如果你在做一个具有社交功能的产品，也许会发现被朋友邀请过来的用户比直接注册进来的用户留存度要更高一些。这就是为什么大多数社交应用程序都会努力让你邀请自己的朋友，并让你在初始激活流程中与用户进行联系。

4.  推荐

顺着邀请朋友这一话题，我们来介绍用户推荐这一指标。在某种意义上，这也是另一种形式的用户获取，但我们关注的是一个确定的渠道：在产品现有用户的帮助下获取新的用户。这是值得单独拿出来说的，因为世界上的每一种产品，无论使用的是什么营销渠道，在很大程度上都还是依赖于口碑的（阅读4.2.1节了解更多信息）。这就是为什么许多公司都会向用户提供向朋友推荐产品的奖励，比如你每推荐一个朋友去注册DropBox，DropBox就会提供500MB的免费空间。

用户推荐指标的重要性不仅仅在于它是我们获得用户的一个来源，也是衡量产品质量的一个指标。除非你真的喜欢一个产品，否则是不会把它推荐给朋友的，所以用户推荐数的增长通常是衡量产品是否改善的一个好方法。因此，了解用户从什么渠道被推荐过来是至关重要的，这也解释了为什么“你是怎么知道我们的”是注册页面上一个非常常见的问题。

5.  收益

我们也应该跟踪一下我们到底赚了多少钱，这些钱是通过什么渠道获得的，比如销售、订购、广告、业务拓展。你可能要用你的收益数字去计算客户生命周期价值（customer  lifetime  value，CLV），这是估量一个客户在与你产生关系的整个生命周期中，你可以从他身上赚到多少钱的方法（如果用Google搜索一下，可以找到一些计算CLV的简单公式）。为了让商业模式取得成功，CLV必须大于获得用户的成本，所以我们要认真地跟踪这两个指标。

另外，也别忘记根据其他指标对我们的收益数值进行分解。例如，如果研究Zynga这样的公司制作的手机游戏，会发现其一半收益来自于0.15%的玩家，这些玩家被称为“鲸鱼玩家”。在这样的商业模式中，弄清楚是怎样的用户获取策略，激活、留存和推荐策略吸引到了更多的鲸鱼玩家，是这种公司获得成功的唯一方式。

6.  神奇数字

每一个公司都有一个“神奇数字”。这个指标就是，一旦用户突破了这个指标，他们就会遇到“惊喜”时刻，最终“粘”上产品。例如，对Facebook而言，表示新用户成为高度参与的用户先行指标就是“在他注册的10天内联系7个朋友”的神奇数字；对于Twitter，一名新用户只要关注了30人之后就很可能成为一名活跃用户；在Slack，只要一个团队交换了2000条消息，他们中的93%就会一直成为Slack的用户。找出你的神奇数字，就可以让你的团队关注一个清晰、具体、容易测量的目标，简化公司的决策制定。对于一个项目，我们可以看看它是否会显著影响我们的神奇数字。如果是的话，就进行；不是的话，先放一放再说。

Andrew  Chen在Quora上发表了一篇关于如何找出公司神奇数字的优秀教程，其中的第一步就是找出衡量公司成功的指标是什么。当成功指标增长的时候，你的业务也会取得成功；当指标下降的时候，你的业务会随之失败。这个指标对于每个公司而言有很大差别，但应该是相当明显的。比如Facebook和Twitter的大部分收益来自于广告，所以它们的成功指标和用户参与度结合得非常紧密（例如用户在过去28天的周期内会回到网站多少次）；Slack是一个订购产品，所以它的成功可能和有百分之多少的用户会成为付费用户有紧密关系；Etsy是一家电商公司，所以它的成功指标可能和网站的交易数有紧密关系。

一旦找到衡量成功的指标，第二个步骤就是判断用户的哪些行为与成功指标的增长是有关联的。抓取一部分有代表性的用户，把他们的全部数据（例如获取指标、激活指标等）放入一张巨大的表格中。如果幸运的话，把用户的活动指标和公司的成功指标放在一起绘制出图表之后，会发现它们之间有非常明显的相关性。例如，如果把Twitter用户的关注人数和他们连续登录的天数放在一起对比做图，可以得到图4-1所示的图表，临界点大概就在y轴的30~40。有时的结果并不会很明显，这就需要进行回归分析，找到理想的相关性。

图4-1：Twitter用户关注人数与用户连续登录天数的对比

我们并不需要找到完美的相关性，也不需要把神奇数字定义为25个不同因素的集合——你的神奇数字只要能让你受到启发并且能帮你找到成功的原因就可以了。所以，我们更应该找出简单的指标。对于大部分变化，可以用这样一个能够解释多种变化的指标去解释，而不是要弄得很复杂才解释得了。无论你选择什么指标作为神奇数字，最后一个步骤就是对它进行测试，确保它可以照预期影响你的成功指标。换句话说，我们要把原因和效果揭示出来，而不仅仅只是相关性。通常来说，我们可以通过A/B测试来得到这些数据，这是数据驱动开发的一个关键内容。

4.1.2  数据驱动开发

当你第一次开始收集业务指标的时候，其实就是一次大开眼界的经历。哪怕只是把Google  Analytics挂到网站上，你也可以很清楚地了解有多少用户访问了网站，他们查看了什么页面，从哪里来，等等。关注数据一段时间之后，你会想要知道你所实现的产品和特性有哪些是成功的，如何通过数据提高成功的概率，而这就是数据驱动开发可以发挥作用的地方。

数据驱动开发有许许多多的内容，但我们最常用的就是A/B测试。A/B测试是一个营销学术语，表示一种受控制的实验，在实验中测试者被随机分成两组，即A组和B组，除了一个变量之外，两组之间其他所有变量都保持一致。这样就可以对这个独立的变量试验两个不同的值，一组一个，看看该变量对每一组行为在统计学上是否存在有意义的影响。当然，你可以对独立变量两个以上的值进行测试，但我们必须使用所谓的对比测试或分桶测试，那就不再是两个组，而是要把用户分成许多组（或者“桶”），然后测试独立变量的不同值对每一组的影响。

例如，大概在2009年的时候，LinkedIn就在尝试订阅页面的新设计，让用户可以注册高级账户。这个设计要在右上角放一个快乐的人的大幅照片，但应该用什么样的人呢？我们可以让设计师根据直觉去挑选，但最终还是决定先进行分桶测试。我们准备了4种人的照片供选择，所以随机地把LinkedIn的会员分成了A、B、C、D四组，并分别向用户展示其中一张图片，如图4-2所示，你认为哪一组的表现最好呢？

图4-2：LinkedIn订阅页面的分桶测试

结果表明，C桶的效果明显胜过其他的分组。灰白头发男士的照片肯定让用户对我们建立了信心，因为当这幅照片出现在屏幕上时，订阅的用户远比其他分组多。不妨这样想：我们仅使用分桶测试来代替我们的直觉，就让我们赚到更多的钱。

一旦你尝到了A/B测试的甜头，就不愿再回去了。你会意识到，借助数据的力量，我们做出的决定将更加有效，你也会考虑把数据引入产品开发过程的方方面面。

1.  把数据引入产品开发过程

以下是Etsy开发产品的方式：

（1）实现功能；

（2）租用仓库准备发布派对；

（3）发布功能；

（4）举办发布派对；

（5）等待20个月；

（6）删除无用功能。

——Dan  Mckinely，Etsy和Stripe软件工程师

根据我的经验，这种过程不单单发生在Etsy身上，也发生在绝大多数公司身上。图4-3展示了这种产品开发过程的大致流程。

图4-3：典型的产品发布过程，图片根据Dan  McKinely的演讲而绘制

用这种方式做出成功产品的概率是很低的。更糟糕的是，有时候你甚至无法判断产品究竟是成功还是失败。假设你对网站进行了重新设计，一个星期后，激活用户就多了10%，这一现象的原因可能是重新设计，但也可能是一些完全不相关的因素在起作用，比如网站的Google搜索的排名发生了变化。在这样的产品发布过程下，我们是无法找到确切原因的。

解决这种问题的方法之一就是进行A/B测试。和把新功能发布给所有用户不同，我们随机把用户分成A组和B组，其中A组是无法看到新功能的受控组，B组是能够看到新功能的实验组。经过一段时间之后（这取决于花多长时间才能获得足够多的网站访问者，使得结果具备统计意义），我们就可以关注B组的指标是否和A组有所不同。如果不同的话，很可能就是新功能发挥了作用，因为它应该是两组之间唯一的变量。

如果发现新功能可以改善指标，我们就可以把它铺开提供给所有用户；否则就得抛弃它，重新开始。这样你就进入了一个产品的改善开发过程，如图4-4所示。

图4-4：在后期使用A/B测试的典型产品发布过程。图标根据Dan  McKinely演讲内容绘制

显而易见的是，如果我们在产品发布之前使用了这样的过程和A/B测试，很可能会发现产品的大部分功能要么对指标是有害的，要么就没有效果，这正是Etsy在开始进行A/B测试时发现的。我从LinkedIn和为本书去访谈的几乎所有创业公司身上都看到了一种产品开发模式。这些公司会花数月或数年的时间，耗资数百万美元去开发新产品，但很多产品做出来却无人问津，一两年之后就被抛弃了。

令产品失败的原因有许多，但其中之一就是Tim  Harford所说的上帝情结（以为自己无所不能）。许多人，特别是专家，都相信自己只需要深入思考，就可以解决几乎所有问题。他们可以在纸上画出周密的产品点子、聪明的工程设计又或者是精美的图表和等式，然后等待成功的到来。只可惜，在大多数情况下，成功永远不会到来。那是因为我们所生活的世界无比复杂，通常我们面对的系统已经超出了任何个体的理解能力，比如自由市场经济、人的思想或者分布式计算机系统，影响这些系统的问题太过复杂，从单一原因入手无法得到解决。

我并不是想表达我们身处复杂的世界就无法解决复杂的问题。我们肯定是可以做到的，但我们应该谦逊地解决问题——抛弃上帝情结，采用实际可行的解决手段，我们也有具备了这种可行性的解决手段。现在，只要给我一个成功的复杂系统，我就可以给你一个通过尝试和犯错而得以进化的系统。

——Tim  Harford，经济学家

我们需要的是进化，而不是聪明的设计。这意味着不要有上帝情结，要承认自己并不知道正确答案是什么。这也许是困难的，因为学校教育使我们习惯认为所有问题都有正确答案，只要深入思考就可以找到它。虽然我们在学校里遇到的简单、有约束条件、量身定做的问题确实是这样，但在商业领域遇到的问题是不会有简单、显而易见的解决方案的。一家又一家的公司已经发现，在这样的世界生存下来的唯一方法就是尽可能多地尝试，看看哪种方法可行。

在审视一些有远见的公司的发展历程时，我们总是惊讶于他们并不是依靠详尽的战略规划去做出最佳选择，往往都是依靠试验、尝试与犯错、投机主义以及——一点也不夸张地说——就是偶然。那些事后看似英明的策略，通常都是投机取巧地试验和“刻意的偶然事件”所产生的结果。

——Jim  Collins、Jerry  I.  Porras，《基业长青》

要注意的是，尝试与犯错和盲目地猜测并不是一回事。我们仍然要尝试尽最大努力找出问题的原因，但也要承认有些假设可能是错误的，而找出那些错误的唯一方法就是反复试验。几个世纪以来，科学家们已经知道，进行反复试验的正确方法就是受控试验。

2.  通过受控试验实现数据驱动开发

做出了完整的功能或产品，但在进行了A/B测试之后才知道它其实没什么作用，这样的过程代价高昂且让人痛苦。那么，是否有方法可以避免这样的努力白白浪费呢？是的，就像我们无法消除测量中的各种不确定性，我们在做产品的时候也无法完全避免工作中的浪费——但我们可以减少这样的浪费。为此，需要在整个开发过程中利用数据和受控试验，如图4-5所示，应用迭代的方法论，而不是一开始就投入精力把整个产品做出来。

（1）做一个MVP。

（2）对其进行A/B测试。

（3）分析结果并做出下面三个决定中的一个。

a.  改善：测试得出的数字不错，足以证明我们能够进一步完善MVP，回到步骤1。

b.  发布：测试得出的数字非常好，并且产品已经完成，可以向所有人发布。

c.  放弃：测试得出的数字并不好，不足以证明应该继续工作，可以转到下一个点子上。

图4-5：数据驱动开发，图表根据Dan  McKinely演讲内容而绘制

我们应该迭代式地对MVP进行一些小投入以测试假设，从每次试验中收集数据。如果得到的数字印证了假设，就可以进一步投入，而不是在一开始就对产品进行大量投入。例如，在第一次迭代时，MVP也许只是一个纸面上的原型，我们应用客户验证过程与真正的客户聊天，确定原型能否与客户产生共鸣（阅读2.2.2节了解更多信息）。如果客户的反馈不错，下一次迭代就可以是绿野仙踪式的MVP（阅读3.2.1节了解更多信息）和A/B测试。如果A/B测试表明该MVP对我们的指标（特别是神奇数字）有正面影响，就可以做出更完整的原型，再运行一次A/B测试。可以持续这样的“实现  -  验证”循环，直至产品完成；或者，如果弄清楚了想法不可行，则放弃开发。但即便想法是行不通的，有了数据驱动过程，我们也可以更早得出结论，显著减少浪费的精力，实现所谓的速度制胜。

3.  数据驱动开发的优缺点

“开发设计的时候要坚定你在做正确的事，阅读数据的时候要提醒自己可能会出错。”

——John  Lilly，Greylock合作人

数据驱动开发可以告诉我们所做的东西是否可行，但这取决于我们对数据的解读，只有深入解读才能理解可行或不可行的原因。数据驱动开发在比较不同选择时有极佳的表现，但前提是你要先想出这些选择。数据驱动开发是增量式地改进产品的完美方式，但也需要你尽巨大的努力，避免陷入局部瓶颈中。简而言之，数据驱动开发只有在我们把人的优势（例如创造力和洞察力）和计算机的优势（例如数据收集和测量）结合起来之后才有最佳的表现。我们使用数据是为决策制定的过程提供信息，而不是替代这样的过程。

除了为产品开发过程提供信息，我们也可以将数据作为构建数据类产品的要素。例如，LinkedIn最被认可的功能之一就是“你可能认识的人”（People  You  May  Know，PYMK），这是一个尝试预测用户在网站中还认识谁的推荐系统。PYMK通过处理大量数据产生推荐信息，这些数据包括关系数据（例如，如果Alice认识Bob，Bob又认识Carole，那么Alice可能也认识Carole）、教育和工作数据（例如，如果Alice和Bob同一时间在同一学校或公司，他们就很可能相互认识）以及地理数据（例如，如果Alice和Bob都在同一个城市，他们就有可能相互认识）。该系统也会将用户的行为数据（例如用户是否点击了某一封推荐信）作为反馈提供给推荐引擎（即强化学习）。

数据类的产品也可能会有强大的独特作用，例如LinkedIn上超过一半的联系都是由PYMK带来的；Amazon宣称它们有35%的产品销售来自它的推荐系统；Netflix以其电影推荐系统而著称，部分因为它有很出色的推荐，部分因为它们举办了一个竞赛，该竞赛会对任何能够实现出更好系统的人提供一百万美元的奖励。

宠文网

第4章 数据与营销

第4章数据与营销