Airbnb从一家提供独特住宿场所的小众网站开始,快速发展到如今引领旅游和住宿潮流的独角兽公司,同时在上升过程中也获得了大量媒体曝光和品牌认知。但要在几年之内达到这样的成就(估值310亿美元),过程绝非易事。 Airbnb这家在共享经济理念下催生出来的旅行房屋租赁服务网站,最开始成立的原因其实很艰难。它的两位创始人布莱恩(Brian Chesky)和乔(Joe Gebbia)因为无法负担旧金山的公寓租金,而在他们自己的客厅里加了几张小床,开始接待三位来参加会议,却因当地宾馆满员而找不到地方住的远方旅客,并为他们提供每日早餐。就是因为这样,后来的公司全名就叫做Airbedandbreakfast(空中食宿)。最初的理念旨在为出行远方却无法预定到当地住宿的人们能提供一个临时居住地,同时带有房东亲手做的早餐与商务社交联系的机会。 自成立以来,Airbnb就毫不掩饰其对于数据的重视——他们使用数据科学来开发新产品,改善服务质量和创新营销策略。今天这篇文章就介绍了他们是如何使用数据来提升自己的产品和市场营销,以及我们可以从中学到些什么? 数据是客户的声音,数据科学是对此声音的最好诠释 Airbnb的前数据科学主管Riley Newman曾这样说过,公司将数据视为客户的声音,而数据科学就是对此声音的最好诠释。更难能可贵的是,Airbnb的数据科学家并没有只是死板地坐在小隔间的桌子前,分析表格里的一个个数字。相反,他们积极地参与到各种团队中去,直接与工程师、设计师、产品经理和各个团队中的其他人交流合作。 使用数据改善搜索 搜索功能是Airbnb网站的核心。经过精心调整,公司希望其搜索功能可以起到在每一个步骤上都能激发、惊喜和取悦客户的作用。但这并不简单, 最初,Airbnb不知道要提供什么样的数据给客户,因此他们决定用一种模型,能根据用户的搜索返回一定半径范围内的最高质量住宿列表。 随着越来越多的用户访问网站,Airbnb便获得了更多的数据,因而就能够用一个受更多用户数据驱动的搜索方式来取代之前那个基本的搜索模型。Newman解释说: “…我们决定让我们的社区和用户来解决我们的问题。通过使用用户和房东之间的互动所产生的丰富的数据,我们可以建立一个模型,该模型估算了当用户搜索城市时,在其中某个地方生成房间预定的概率。这样一来,举个例子,当某用户搜索“旧金山”时,Airbnb会把之前同样搜索过“旧金山”并经常发生预定的几个社区呈现给当前用户,比如旧金山的“教会区”和“下海特区”都是以前热门的房间预订地区。” Airbnb还使用数据来按照人口统计地定制搜索体验。他们在2014年就注意到,某些亚洲国家/地区的用户访问首页时的跳出率通常很高。经过进一步的数据分析,他们发现当这些用户点击“邻里”这个链接,并开始浏览照片后,就再也不会回到之前的页面去预定住宿了。 发现问题的数据科学家向工程团队展示了该问题,工程团队为这些国家的用户重新设计了一个新的版本, 将在这些国家的住房页面上的“邻里链接”替换成了中国、日本、韩国和新加坡等亚洲国家的热门旅行地。 结果,来自这些国家的用户转化率提高了10%。 通过数据确定房东偏好 Airbnb的经营原理很简单:把想找住处的人和想出租房子的人匹配起来。现任Airbnb数据科学家Bar Ifrach是通过一个朋友发现了这个网站。当他在研究生期间进行假期旅行时,他的朋友想把这段时间的空房提供给其他人居住,并且这位朋友想在他离开的1-2周内安排尽可能多的住房申请。因此,他会根据怎样可以最大化这段时间的住宿率来决定是否接受住宿申请。 Ifrach对这一情节始终记忆深刻,因而基于此给自己创建了一个小型研究项目。研究的问题是——什么因素会影响房东接受申请的决定? 虽然并不是所有房东的想法都跟Ifrach的朋友一样,但是希望这样做的房东都会尽量避免租客入住和退房的间隔出现以下情况: Ifrach将他朋友的这一想法应用到了整个Airbnb的房东群体上,然后发现,房东更容易接受符合他们日程安排的租客请求,同时最小化租客入住和退房的间隔: 但这样的安排完全适用于所有市场吗?或者,大市场和小市场会有不同吗?明智的数据科学家需要带有这样的疑问,并且事实证明这个结果相当令人吃惊: 从上图可以看到,在一些大的地区市场,房东倾向一波波住客的住房日期之间没有间隔,然而,对于小市场来说,这些地方的房东更希望能有一些间隔。 这个研究之后从一个小的研究项目变成了一套成熟的机器学习算法。Ifrach与Airbnb的一名工程师合作,创建了一个应用程序,该应用程序会基于房东和租客双方的偏好,对结果进行个性化处理,以确保更准确的匹配。 在这个应用程序里,Airbnb的数据科学家对多方面进行了研究,从房东之前接受与拒绝申请的记录,到某个住宿订单本身的细节。他们没有给算法添加太多的干扰,而是创建了一组过滤器,并通过如下图所示的流程图进行应用: 为了测试这一应用的运作效果如何,他们进行了一个实验,这个实验使用了概率以及一个将其他偏好也考虑在内的排序算法。这个实验的主要目标是测试请求住宿的客户可以获得预订的可能性。由于采用了这些新的筛选条件以及考虑了用户偏好,Airbnb的预订转化率提高了近4%,租客和房东成功匹配的次数也显著增加——这是一种双赢。 创造“Airbnb体验” 数据科学应用在Airbnb的真正核心是提高用户的“Airbnb体验”——租客到房东那里旅行,受到欢迎和招待,安顿下来,开始居住和游玩,这些都是可以通过网站和应用程序来建立或破坏用户体验的方面。对Airbnb本身来说这些数据都非常有价值,因为可以通过他们了解用户旅行的质量。 他们使用净推荐值(NPS,Net Promoter Score)来衡量这种体验,NPS是于2003年引入的一种衡量客户忠诚度的指标。NPS的实质是在问,“你推荐Airbnb的可能性有多大?” 因为Airbnb希望“可能性推荐(LTR)” 指标能尽可能做出准确的预测,他们还控制了其他参数,包括: 总体评价和一些子类别评价(1-5分) 获取客户渠道(非付费搜索或付费营销活动) 旅行目的地 客户初始所在地 客户在Airbnb上的预订记录 旅行时间长度 同行客户数量 每晚价格 结帐月份(考虑到季节性) 房间类型(整套房子、单个房间、共享房间) 房东列出的其他住房 Airbnb承认,其他一些因素也会影响客户忠诚度(比如口碑传播),但这些因素无法衡量。由于评价本身对Airbnb的整体体验如何非常重要,公司想要确定净推荐值(“推荐可能性LTR”)是否相比单纯用评价更能增加用户二次预订的预测准确性。 在这种情况下,数据科学家们对预测准确性的测试加上了“推荐可能性LTR”和“子类别评价”的因素,来看它们在预测用户二次预定的准确性如何。结果如下: 在这项研究的结果中Airbnb发现,旅行后的评价(包括推荐的可能性)只是略微提高了他们对于用户何时会再次预订的预测能力。换句话说,仅凭借用户旅行后的评价和NPS对于数据科学家预测用户何时进行下次预定起到的帮助甚微。 在这种特殊情况下,如果不是因为数据科学家和团队里其他成员进行深入研究,使用评价加上NPS值来研究预测未来预定情况的准确性,Airbnb永远不会知道这一模型是否可以真的应用到提高了用户体验之后的再次预定可能性的预测中,并影响到Airbnb的营收——这就是另一个数据科学帮助企业节省了时间和金钱的例子,尽管事情最终未能按理想的方式进行。 对比测试来调整流程 和所有聪明、前沿的公司一样,Airbnb也大量使用了对比测试。他们称这些为“实验”,并在从概念提出到完成再到优化的每个发展阶段定期进行。然而,在很多情况下,其实很难判断一个特定的产品或产品变化带来的影响有多大。 Airbnb有自己的内部A/B测试框架,而不是使用外部即成的一些解决方案,原因是它在商业模式和客户体验方面,比一般的那种简单改变页面按钮颜色的对比测试并衡量测试效果的需求更为复杂。 例如,无论用户是否登录,他们都可以浏览Airbnb。这使得将操作绑定到特定用户并进行追踪成为一个挑战。用户也可能先在自己的移动设备上浏览,然后回到家再通过家里的电脑完成预订。 […]