YC合伙人David Lee提出衡量初创公司是否"做出人们想要的东西"的最佳量化方法是追踪群组留存率,并通过5个关键要点教你优化用户留存。
👤 WHO: YC合伙人David Lee,曾是Bump应用的创始人
🎯 WHAT: 深入讲解如何用群组留存率衡量创业成功,并分享5个优化用户留存的要点
⏰ WHEN: 源自David在2009年带Bump加入YC后多年创业经验的总结
🌐 WHERE: 适用于所有初创公司和互联网产品的场景
❓ WHY: 因为很多创始人不会正确解读留存率数据,导致在融资路演时回答不上来,最终错失机会
🔧 HOW: 通过按首次使用时间、国家、设备或渠道分组用户,追踪关键行为(如全屏查看照片),并观察留存曲线是否变平缓
💡 SO WHAT: 对普通人来说,学会这5点能帮你避免产品不断流失用户,真正做到留住用户;如果你的留存曲线不平缓,就必须主动与客户沟通了解真实需求
"做出人们想要的东西" —— YC座右铭
"祝愿各位未来都能拥有平缓的用户留存曲线。" —— David Lee
[音乐] 大家好,我是David Lee,YC的合伙人之一。YC有一条著名的简洁座右铭:做出人们想要的东西。我认为这是对初创公司创始人工作最纯粹的定义,我们经常讨论这一点,但很少被提及的是:你如何知道自己是否真的做到了?我们是否做出了人们想要的东西?今天,我想深入探讨我找到的解答这个问题的最佳方法,并且用一种非常量化的方式来实现,那就是群组留存率。简单来说,群组留存率是追踪你的新用户中有多少比例在一段时间内持续使用你的产品。这并非一个新概念,实际上互联网上关于群组留存率的内容非常多,甚至你使用的多数分析工具都内置了这项功能,但我敢打赌——
你并不完全理解它衡量的是什么,以及如何解读这些数字。我之所以怀疑你不理解,是因为我自己在创业初期也一直没弄明白,直到很多很多年后——那时几乎已经太迟了。我记得有一个特别的时刻:我在为A轮融资向一家非常知名的风投公司做路演,他们问我:“戴夫,你们的用户群留存率怎么样?”我给了他们一个非常含糊的回答。会后我回到电脑前,查了一下用户群留存率,才意识到自己当时说的话肯定毫无意义。所以我希望这个视频能帮你避免犯同样的错误。在深入讲解之前,先简单介绍一下我的背景:2009年夏天,我带着我的创业项目Bump参加了YC。Bump这款应用可以让你分享联系信息和照片。
只需通过碰触手机就能与其他人互动。Bump是最早达到超过1亿用户的移动应用之一,但最终作为一项业务并未成功。幸运的是,我们进行了几次转型,进入了照片分享和照片管理领域,最终被T117收购。我们的最后一个应用,一个照片管理应用,为T117 Photos奠定了基础,之后我在这款应用上工作了近十年。如今,T117 Photos拥有超过10亿用户。因此,我做出了一些很多人想要的东西,但也通过艰难的方式学会了如何判断自己尚未做出人们想要的东西。好的,关键洞察以及它被称为“群组留存率”的原因是,我们将随着时间的推移追踪单个新用户群组或群组。
与其试图观察混杂在一起的用户群或所有客户并从中得出一些推论,这种方法能让你更清晰地了解个体用户随时间推移是持续使用你的产品还是不再使用。为此,我们首先需要定义三件事:如何划分用户群组,然后需要讨论用什么行为来判定用户是否为活跃用户,最后要选择衡量后续使用情况的时间段。接下来我们逐一深入探讨。对于用户群组,我们需要选择一种方式将新用户分组到各个群体中。最常见的方法就是根据他们首次使用产品的时间来分组。例如,你可以观察每周获取的新用户,比如第一周、第二周。
或者按月来看,一月份所有新用户构成一个群组,二月份所有新用户构成另一个群组。这通常是最基础的切入点。但随着分析深入和进阶,你还可以按其他维度进行细分,比如国家或地区、用户获取渠道、使用的设备类型,或者其他客户特征。接下来我们讨论行为定义。行为是用来界定用户在后续每个时间段内是否算作活跃用户的标准。最简单的定义是用户是否打开了我们的应用或访问了我们的网站。但更好的方式是选择某个与你实际目标更相关的具体功能进行追踪。
比如使用你的产品,可能是在社交网络上发布照片,或者在你的B2B工具中使用特定工作流程。我们来看看一些知名公司可能会如何选择。假设你运营的是Instagram,你可能会选择与用户实际浏览内容相关的行为,比如“在Instagram上查看3篇或更多帖子”。选择3篇的原因是,有些用户打开Instagram后完全不滑动屏幕、未获得任何价值就立刻离开,你可能希望将这些用户从活跃用户中过滤掉。如果你是优步,可能会选择“完成一次行程”,即实际乘车并到达目的地,作为优步的活跃用户。对于Google照片而言。
对于我们的产品,我们选择以用户是否真正点击并全屏查看照片作为衡量活跃用户的最佳标准,因为我们知道,如果你全屏查看了某张照片——无论是你自己的还是别人分享给你的——你实际上是从产品中获得了价值。因此,最佳的行为指标应当与用户从产品中获得真实价值高度相关,同时要尽量过滤掉那些用户可能以某种方式接触产品但并未获得实际价值的情况。最后,你还需要定义衡量这一指标的时间周期。我的意思是,在统计用户是否执行了我们刚才讨论的行为时,你需要确定时间粒度的具体范围。
通常来说,这个时间段应该与用户对产品的预期使用频率最相关。举个例子,如果你在开发社交或娱乐类应用,比如Instagram、TikTok或YouTube,你可能希望用户每天使用你的产品,因此衡量用户留存的时间段应该以天为单位。如果你在开发工具类产品,比如Google照片或Uber,用户可能不会每天使用,那么以周为单位来衡量可能更合适。如果你在开发旅行类应用,比如Airbnb,用户一年通常只旅行三四次,因此Airbnb可能需要以更大的时间粒度来追踪数据。
我的周期可能是季度性的,甚至可能是半年或年度性的。关键在于,你需要选择一个与你产品预期相匹配的时间周期。我们稍后可以讨论你可能搞砸这一点的方式。好了,现在让我们通过一个实际例子来详细讲解如何具体衡量。你面前看到的是一个我们称之为三角图表的表格。每一行代表一个月,因此我们按月划分用户群组。例如,我们将一月份的所有新用户单独列出,二月份的所有新用户也单独列出,以此类推。然后,我们要做的是在接下来的每个月追踪这些用户的行为。在第一行第一列中,你可以看到一月份有12名新用户。
现在我们要看的是,一个月后的二月份,这12名用户中有多少人回来并执行了我们的操作。我们看到是6人。接着看两个月后的三月份,有四人在三月份回来了。关键在于,我们在这个时间段内每人只统计一次,无论他们一个月内回来一次还是十次,每位用户只被计数一次。你还可以看到,如果到了下一个月,实际上有五人从最初的那12人组中回来了。所以关键是,这个数字可以上升或下降,但永远不会超过队列第一个月的初始人数,因为那是我们要考察的总人数。然后我们
对2月也做同样的处理,2月我们有27名新用户。在随后的月份中,你可以看到每个月有多少人回来。我喜欢把这个过程想象成一场派对:假设你在举办派对,房间里来了人,你会给他们贴上一个小标签,标明他们是哪个月份来到派对的。所有1月加入的人会在衬衫上贴一个“1月”标签,2月加入的人则贴“2月”标签。然后每个月,我们都会看看派对里的人,数一数有多少人来自1月群体,有多少人来自2月群体。这就是我们划分用户群的方式。
逐个追踪这些用户群体随时间的变化。最后需要说明的是,在这个三角形图表中,我用黄色高亮标出了这条对角线。在这类图表中,对角线实际上代表一个自然月。例如,这条黄色线代表12月。你可以看到所有在12月使用我们产品的用户,他们最初来自哪个用户群体。如果将这条对角线上的所有数字相加,就能得到12月使用我们产品的总用户数。这只是一个关于我们如何实际衡量这些数据的说明。这些数字本身很有价值,但我们真正关心的是相对于初始用户群体的趋势变化。
排序大小,所以在这张图中,我们只是将前一张图的数据除以初始群组的大小,进行归一化处理并得到百分比。因此,你可以看到第一列,即初始月份,按定义是100%。然后,在接下来的每个月,我们衡量的是初始群组中在该月返回的比例。这是一种很好的可视化方式,你可以通过横向查看每一行,了解每个群组随时间推移的表现——这是我们真正关心的。同时,你也可以纵向查看某一列中的所有行,看看随着时间推移,后续群组的表现是否总体在改善,或者总体在恶化。但我认为,查看这张图的最佳方式,实际上是将其绘制成折线图,而这就是你接下来会看到的。
所以,当我们讨论用户群留存曲线时,通常会看到这样的图表。图中的每条线代表一个用户群,比如12月用户群、11月用户群、7月用户群。最早的用户群(1月开始的)有完整的11个月数据,而最新的用户群(11月和12月开始的)只有顶部几个数据点。可以看到,这是一种典型的用户群留存曲线分析方式。我知道你心里在想:什么才算好?怎么判断我的用户群留存曲线是好是坏?在揭晓答案之前,我们先看一个夸张的例子,或许你就能自己判断出正确答案了。假设我们有两个产品。
产品A和产品B,A是黑色线,B是橙色线。我们将展示这两个产品随时间推移的留存曲线,每月收集更多数据。起初,看起来产品A明显胜出——它在头一两个月留存了更多用户。让我们再揭示一些数据,现在可以看到产品B持续下降——它在头几个月就流失了超过一半的用户,而产品A表现相当不错,数字仍远高于50%,非常棒。让我们继续揭示更多数据,也许现在你改变了想法。如果你是产品B的负责人,你可能会感觉相当不错,因为你不再流失用户,而你的绝对
人数可能下降到初始群体的20%左右,看起来确实趋于稳定和平缓。而如果你是产品A背后的公司,你可能已经开始思考产品出了什么问题,因为看起来它会归零,最终所有用户都会流失。这就是留存曲线背后的核心洞察——唯一重要的事情,我必须强调,唯一重要的事情就是你的留存曲线是否变得平缓。曲线的形状才是关键,而不是绝对数值。绝对数值,即曲线趋于平缓时的高度,当然越高越好,但远不如曲线是否变得平缓来得重要。这就是这里的核心洞察——关键在于曲线是否变得平缓。
用户留存曲线真正重要的原因在于,它让你有机会随着时间的推移积累用户。如果你的曲线每个月都没有趋于平缓,那么你只是在不断获取新用户,同时失去老用户,就像在跑步机上永无止境地追赶。相反,如果你能留住哪怕一小部分初始用户群体,并且长期坚持下去,你最终将积累起庞大的客户基础,并有望获得可观的收益。因此,如果你的曲线没有变平,我认为这很可能是一个信号——你还没有做出人们真正想要的东西。在Instagram早期,我们每周都会测量用户留存曲线,而我们的曲线看起来很像那条橙色线——它们会持续下降。
但很快,这个比例就会稳定在20%到40%之间,具体取决于我们观察的国家和设备。有趣的是,如果你告诉朋友“80%的用户几乎立刻流失”,听起来确实很糟糕——这可不是什么值得炫耀的事。但事实上,在Google照片中,20%的用户在初次使用后立即展现出留存意愿,并且几乎永久性地每周使用这个产品。这让我在Google照片上线六周后充满信心:我确信我们最终能让全球20%的人口使用Google照片。事实证明,四年后我们确实做到了——用户数远超10亿。
现在可能已经接近20亿用户了,所以作为创始人,如果你的用户群留存曲线能够保持平稳,你也会更有信心,认为这确实可以发展成一个非常庞大的事业。接下来,我们来谈谈如何避免自欺欺人地认为用户留存表现良好,而实际上并非如此。我会根据自己的经验来分享,因为这些错误我都犯过。那么,我们来看看这些错误是什么。我发现人们最容易犯的一个错误是,选择的时间周期过长,用来衡量后续的留存率。在我们的例子中,我们选择的是月。如果你选择季度或半年,那么每个用户更有可能被算作活跃用户,因此,从定义上来说,你的用户群留存曲线就会显得更平稳。
你选择的时间周期越长,数据曲线就会越平缓、越好看。谁不想在投资者和员工面前显得更出色?谁不想在夜晚入睡时对自己感觉更好?我们都想。因此,这需要你有意识地觉察,同时也要认识到,你的潜意识会驱使你扩大用户群组的时间跨度——尽管你很可能不该这么做。以Bump为例,这是我犯过的一个错误。我们原本会查看每周的用户留存曲线,因为我们觉得一周是用户使用Bump的合理周期,但数据表现非常糟糕。实际上,我们当时做的是:既然投资者会议快到了,不如把群组周期扩大到一个月,看看曲线会变成什么样。结果,它们看起来……
后来我们说服自己,按季度使用产品其实挺合理的,于是把使用周期拉长到每季度一次。结果一看用户群留存数据,哇,表现真不错。但我们其实在自欺欺人——Bump 这款产品本来就不是设计成每季度用一次的,它需要比较频繁的使用。通过拉长用户群的时间周期,我们只是在蒙蔽自己,看不清产品的真实状况。另一种在用户群留存分析中自欺欺人的方式,是选择过于简单的用户行为。我们之前聊过,比如选择用户打开你的应用或访问你的网站作为行为指标。我建议你不要选这么简单或浅层的产品使用行为,因为这里面有很多陷阱。
操纵指标的方法有很多,一旦你开始记录这些数据,你就会发现自己正在“优化”指标。一个常见的例子是,利用通知或其他提醒来引导用户使用你的产品——这种方式可能有些不自然。你会发现,用户虽然被吸引过来,但会立刻离开,并没有真正从你的产品中获得价值。你不希望将这种使用行为计入你的群组留存曲线中,因为它会误导你。我在Google时曾见过一个很好的例子。我刚加入Google时,它还在开发社交网络Google+。有一段时间,我毫不夸张地说,Google+的活跃使用量取决于用户是否在每个Google产品的右上角看到一个带有红色通知的小铃铛图标。
如果你收到一个 Google+ 通知,比如有人加你为好友、你上传了一张新照片之类的,这样做会让活跃用户数量变得非常大,大家都会感觉很好。但如果你看群体留存率,这其实是个谎言。嗯,这些并不是活跃用户,他们只是恰好点开了Gmail里那个小红铃铛,想看看是什么内容,然后就被计为Go+的活跃用户了。所以不要犯这种错误,这只会导致灾难。这里有一个反直觉的事情:嗯,很多人可能会想,我会用最好的行动衡量标准,那就是用户这个月是否为我付费。当然,这是衡量他们是否活跃的最佳方式,但反直觉的是——
实际上,情况往往并非如此。用户首先停止使用你的产品,然后才停止为产品付费。我想我们大家可能都有类似的经历——比如我们都在为Netflix之类的流媒体服务付费,但回想一下你上次在Netflix上看节目是什么时候?可能已经是一个多月前了,但你大概还没取消订阅。所以,我建议谨慎使用“付费”作为唯一的衡量指标。更好的做法是将“付费”与“活跃用户”结合起来,比如“本月是否实际使用了产品的某些功能”,这是一个值得追踪的组合。要避免选择过于简单的指标,我给创始人的建议是:想象你正坐在一位你的……
顾客们,他们坐在桌前使用你的产品。当你观察他们如何使用你的产品时,你脑海中浮现的是什么?这能帮你判断这个用户是否是你的优质用户,是否真正按照你预期的方式使用产品。无论答案是什么,我建议你将其作为群组留存曲线中的“行为”指标。另一个常见的自欺欺人的方式,是在观察群组留存曲线时,只关注某个时间点,而非整个曲线的形态。这或许看似显而易见,但我几乎每天都会听到创始人这么说。比如,有创始人跑来告诉我:“戴夫,我们做得很好,周留存率达到了80%。”
我稍微想了想,然后问是哪一周,嗯,那个80%的数字中,分子是什么,分母又是什么?而几乎每次,创始人都不清楚这个问题的答案。在我们的例子中,我们可能会看未来一两个月的情况,产品A的第三周留存率是75%,听起来很不错。但你可能会想问,第四周的留存率如何?第二周呢?趋势线是什么样的?在我们的例子中,你会发现产品A的留存率远非平稳,因此尽管第三周留存率有75%,它却是一个表现不佳的产品。最后,关于使用分析工具或分析套件,我想提醒一句:我认为它们的存在很棒,也认为它们能提供留存率和群组分析很棒。
内置留存图表固然方便,但我需要提醒你的是,这些图表往往并不完全按照你设想的方式衡量数据。我见过这样的情况:这些工具在划分用户群组时,并未像创始人以为的那样精确区分。有时它们衡量的是随时间推移的滚动留存率,而非完全分离每个群组;有时它们呈现的图表只是显示用户在某个日期前是否曾返回,而非用户在特定时间段内是否返回。因此,我建议大多数创始人亲自构建这些群组留存曲线——通过脚本或电子表格工具,利用自己的日志数据。先自己动手做一点前期工作,培养对数据实际情况和衡量方式的直觉理解。
然后将它与你的分析工具所显示的结果进行对比。如果两者完全吻合,并且你对此非常有信心,那么完全可以继续使用分析工具。但很多时候,创始人会带着他们的仪表盘来找我,当我问起这些数字实际代表什么时,他们却并不真正了解。所以,不要成为那样的人。在查看群组留存曲线时,你不需要每天多次查看,甚至不需要每天都看。但我建议至少每周或每两周更新一次这些图表,因为当情况变糟时,你会希望尽快知道。更可能的情况是,你会发现你的群组留存从一开始就不理想,这时我们就需要采取行动了。
思考如何改进它,所以我们来谈谈这个。最明显的方法是改进你的产品,提出新的使用场景。也许它应该做一些完全不同的事情,也许你需要加快产品的速度,或者减少某些地方的延迟,让流程变得更加简单。所有这些做法实际上都会改变你的用户群留存曲线,你会看到它们变得更平缓,同时也会在更高的水平上变得更平缓。在我们之前展示的例子中,如果你观察这些用户群组,你可能会发现最老的群组表现最差,它们似乎被吸引到零。但到了年中,比如7月到6月的时间段,我们看到了一些改进,用户群组的表现稍微高了一些,也稍微平缓了一些。
趋于平稳,所以这个产品背后的团队可能做了一些改进,让情况变得好多了。然后最近的一批用户,也就是10月和11月的,似乎更早地趋于平稳。这就是当你真正对产品做出有意义的改进时可能会看到的情况。所以另一种改善用户留存曲线的方法,与改进产品相反,就是获取更好的用户。我认为很多创始人并不经常考虑这一点:你打造了一个很棒的产品,但你的目标客户类型不对。因此,你可以通过以不同的方式获取用户来实际提升你的表现。这是我在Google工作时经常看到的,当时我在做Google照片项目。我记得有一次,嗯,一些……
营销精准化。高层认定Google需要更聚焦年轻用户,认为这对公司至关重要,于是大力推行面向Z世代的营销与广告推广。坦率说,Google的团队确实出色,成功吸引了大批年轻新用户使用Google相册功能。但结果发现这些用户留存率极低——这其实合乎逻辑:Google相册本质是积累人生记忆、供人回味的工具。年轻人一方面尚未积累足够的人生回忆,即便有,也往往不会刻意追忆一两年前的某个瞬间,更倾向于活在当下、享受青春。这正是典型的案例。
用户获取与实际产品功能之间的不匹配,比如你试图让谁使用你的产品,以及你的产品实际能做什么,这两者之间的错位往往是提升用户群表现的最简单途径。我们之前讨论过,在选择用户群时,可以通过不同维度来划分,比如按国家或设备划分。这是一个很好的方法,可以帮助你改进产品并了解实际情况。因此,如果你发现用户群曲线没有趋于平缓,我建议的下一步措施之一就是尝试按不同维度来划分这些用户群,比如按你服务的国家、客户类型(无论是大公司还是小公司,针对你的B2B工具的目标客户),或者根据你认为有意义的任何属性进行划分。
因此,你可能会发现,有些用户群组表现非常平稳且效果很好,而另一些则非常糟糕。这为你提供了一个线索,告诉你应该从何处着手改进产品,或者优化用户获取策略,以吸引更优质的用户。另一种提升群组表现的方法是改善用户的首次体验,即引导和激活新用户。我认为这一点常常被忽视——人们总是急于关注产品本身的功能,但很多时候,你只需要帮助用户进入一个良好的状态,让他们能够以正确的方式使用你的产品。我们在许多为企业开发工具的公司中经常看到这种情况:他们投入大量时间构建工具本身,却忽略了后续的引导。
关于如何真正教会人们使用你的产品,如何融入他们的工作流程——他们昨天在使用你的产品之前做了什么?你希望他们在今天使用你的产品时,生活发生怎样的改变?在这方面进行投入,往往是提升用户群表现最便宜且最有效的方式。最后,还有一个提升用户群留存率的好方法,就是在你的产品中引入某种网络效应。当然,这并非适用于所有产品,但那些每增加一个用户就能让现有用户体验变得更好的产品——比如社交网络、共享平台、即时通讯应用——都是典型的例子。如果你的产品具备这种特性,即使用的人越多,产品体验就越好,那么你应该能看到用户群留存率随时间逐步提升。
随着网络不断扩展并变得更加密集,如果你正在构建一个具有类似特性的产品,你可能会思考如何专注于围绕现有用户建立良好的密集网络。你可能会发现你的用户群组表现有所改善。最后,我想简单谈谈什么是“圣杯”,即最佳中的最佳是什么样的。我认为,最佳中的最佳是群组曲线不仅趋于平缓,而且随着时间的推移实际上会上升。通过我之前提到的所有技巧——优化产品、精准定位更好的用户——你可以实现这一点。如果做到这些,你会发现,那些持续使用你产品的用户实际上会随着时间的推移越来越频繁地使用它。
如果你发现用户群曲线趋于平缓,并且后续的用户群随着时间的推移表现越来越好,那你就应该感到非常乐观。希望现在你已经对如何衡量用户群留存曲线,以及如何判断这些曲线表现的好坏有了清晰的理解。最后,我想把这些内容串联起来,看看它如何与打造一家真正的大公司相关联。让我们回到最初我们看到的那个三角图表,它衡量的是每个用户群在后续月份中使用你产品的人数。现在我们要做的,不是用相对月份来表示,而是将这些行全部滑动到另一边,并按绝对月份对齐。
固定时间点分析。现在我们来观察每个日历月中的所有用户,他们最初来自哪个用户群组。以十二月为例,图表中最后一列展示了十二月所有用户的情况,我们可以清晰看到他们所属的群组来源。接下来,我们将这个图表转化为折线图,这就是所谓的“分层蛋糕图”。每个月的数据代表你的产品活跃用户数量,而蛋糕的每一层则对应他们最初加入的群组。从图中可以看出,以十二月为例,我们的产品已有近600名活跃用户——这些用户并非仅来自最近获取的十二月或十一月,而是由多个群组共同构成。
所有坚持使用我们产品的老用户,如果你看到这样一张分层图——顶部线条增长态势良好,且由来自早期用户群的厚实分层构成——这将是你在创业过程中见过的最漂亮的图表。如果看到这个,恭喜你,你已经成功起步了。这张分层图有望成为价值数十亿美元公司的起点。当我们讨论用户群时,我通常会这样对创始人说:你显然需要亲自与用户交流,倾听他们的反馈。这些定性反馈才能真正让你洞察产品问题。用户留存曲线不会直接告诉你该改变什么,但能帮你判断是否走在正确轨道上、当前策略是否奏效。我想说的是,如果你观察用户留存曲线发现它们没有趋于平缓,那么可以肯定的是:你必须走出去与客户沟通,了解实际情况,并努力打造他们真正想要的产品。非常感谢你花时间与我一起学习用户群分析,祝愿各位未来都能拥有平缓的用户留存曲线。[音乐]