来源:TaklkingData数据学堂ID:TDUniversity
拥有有效的数据结构,可以执行不同类型的分析。从总体来看,电子商务的一些传统用例,可以提取5个不同的重点领域:
还可以向图中添加与点击流、转化优化、营销支出、产品推荐相关的数据结构,但这些需要另外单独讨论。
留存研究
留存研究旨在更好地了解客户是否继续或偏离了服务。试图找到客户从平台流失的假设原因,这样可以根据假设在现实条件下测试潜在的优化方法。
留存研究的核心在于群组的概念,通常定义为一组在指定时间点完成了他们的某一次行为的客户。例如,所有年1月在平台上进行了购买的客户。因此,我们必须将群模型作为数据结构的一部分考虑。群模型以用户级别的表为基础,其中包含每个客户的获取日期,例如:
此获客日期可以基于您要考虑的任何活跃指标,无论是注册,购买,网站浏览,等等
正如这个表,我们调用它,可以基于每日加载增量从任何活跃表中填充。例如:
如上所示,聚合事件活动对于连续计算dim_customer表非常有用。对于这些指标来说,通常将事件类型与acquistionDate绑定。这可以获得在获客日期之后,所有事件活动的良好属性。
衰变直方图
例如,假设想要计算衰减曲线/直方图,如右图所示。衰减直方图显示自获客以来给定时间处于活跃状态的用户与基数的百分比。
假设已根据注册构建了如上所示的dim_customer表,并且注册也是首次登录事件。
例如,上述SQLQuery可以计算出此目的所需的数据集。由于我们知道用户群中的每个人都在其获客日期当天都(DaySinceAcquisition=0)处于活跃状态,因此只需将DaySinceAcquisition=0处的D1ActiveCustomers作为为用户活跃的一部分来计算衰减直方图。
三角图是衰变曲线/直方图的演变,加入了群组的概念。由于已经计入获客日期以计算衰减曲线,为了输出三角形图表,唯一要做的就是将这些信息表达出来:
具有其他类型的属性使得可以对重复采购率表所需的数据集进行计算。
为了计算重复购买,需要计算特定用户首次购买后,到第二次购买所花费的天数。在这种情况下,仍然要保持群组的概念,但补充加入购买数量的概念。
为了计算重复购买率,首先针对每个客户计算获客日期与购买数量的关系。在第二步中,计算完成2次购买所需的天数。因此,对于每个客户,汇总计算所有日常购买以获得该估计值。由于每日购买量可能很多(1),因此必须进一步添加逻辑以检查前一天的滚动购买量是否少于2次,以确定回购日期。
假设每天都在计算查询并将结果提供给一个名为dailycohortactivity的表。天对活跃日期进行过滤并查询,将其导出为列:
基于此表,可以计算每日群体活跃:
在此之后,最终可以有效的计算复购率:
以上查询提供了自新注册以来N天后客户回购的时间和数量。为了计算回购率图表,一旦获得该数据集,剩下的所有工作就是将其作为一个运行总和,并将其规范化为总体大小。
基于上述查询,设置一些数据结构有助于更好地了解整个平台的留存行为。最重要的设置是客户等级表,该表包含客户的静态和计算属性、客户事件聚合表和客户队列等级表。有了这些设置,就可以很容易地检索到计算不同留存图表所需的信息,如衰减曲线、三角图到复购直方图。用户参与度研究
有不同的框架用于理解客户参与程度。它们的存在是为了了解客户的不同群体如何与您的平台进行交互。两个最常见的框架是RFM和高级用户曲线。
RFM是一种分群方法,通过计算3个特定维度,最近一次消费,消费频率和消费金额来工作。RFM在每个维度中为每个客户打分,其中越高的值代表的结果越理想。
第一个维度,最近一次消费,可以通过对dim_purchaser表稍作修改并查询以包括最后购买日期来获得。
消费频率和消费金额指标通常被视为跟踪指标,例如跟踪测量过去十二个月(TTM)。可以通过使用值度量和必要的跟踪度量来增强每日群组活跃查询来进行这些计算。
高级用户曲线是用于获取有关客户群在活跃方面趋势信息的不同指标。它依赖于活跃天数的指标,Facebook定义了一个L30度量来定义用户在指定月份内活跃的总天数。高级用户曲线的形状和趋势给出了在该时间段内用户活动和参与程度,允许识别整个客户群中的高级用户。由于计算上的优势,L28度量有时用来代替L30作为用于每月活跃程度的指标,。L28可计算为四个L7周指标之和,L7本身可计算为7个L1之和。
参与度研究只需要对留存研究所需的数据结构进行一些调整。他们的核心是依靠客户层面的信息和跟踪措施,这些措施可以轻松地嫁接到留存研究所需的那些措施上。
增长核算
增长核算试图将您的客户群分成不同的阶段状态,并通过这些状态了解您的活跃客户群的演变。客户可能是处于新客户的阶段,复活,留存,流失或可能潜在流失。
增长核算可以帮助您了解您是否有效地留存或召回您的客户以实现有效增长,或者您是否因为客户流失而面临增长方面的问题。
增长核算中的活跃用户/客户的定义是原始的,它通常是指在过去X天内执行了指定操作的用户。
以下两个等式定义了增长核算是如何在生命阶段进行分割的:
活跃(t)=新(t)+召回(t)+留存(t)
留存(t)=活跃(t-1)-流失(t)
实质上,增长核算根据用户今天和昨天的活跃情况为用户分配状态。假设我们有两个表,一个包含客户的每日Lx值,另一个用于存储客户的增长核算状态,然后我们可以计算新的增长核算状态,如下所示:
增长核算的状态列可能会添加到已存在的任何日期/客户表中以提供该信息。例如,如果dim_customers包含给定日期所有客户情况,则可能会将增长核算状态放置在那里。
定价研究
网站上有各种各样的定价研究,从价格折扣感知(销售价格/推荐零售价格)变化研究,价格弹性,收入拆分等等
对于定价研究,拥有快照表或II型历史表非常重要,该表包含网站上每个项目的定价历史。
快照表包含在指定日期/小时等不同价格的活跃状态。如果价格将在该时间间隔内改变,则只捕获其中一个值。尽管如此,使用快照表来研究定价行为非常有效。它允许运行简单的查询,并查看价格如何影响购买行为。
根据所使用的源系统,可能很难理解价格何时发生变化以及某些价格变化历史。在这些情况下,建议使用快照表,在该表中输入的数据将以特定的重复间隔获取。可以在这些类型的表上运行简单查询,以便了解价格何时发生变化:
快速了解网站上折扣级别的活跃:
价格快照表使这些查询相当容易计算。
另一种对定价研究有用的数据结构是历史或II型表。II型表包含在特定时间范围内有效的定价信息,如下表所示:
由于II型表包含的是一个范围,因此它们可以在不出现任何问题的情况下进行精细的切换,例如,它们可以承载以毫秒为单位的开始时间,以提供有关给定价格有效期的信息。除此之外,与价格快照相比,此数据结构主要的优势是,当价格变化发生在中低频率时,表格的范围明显更小。
例如,II型历史表对定价研究特别有用,以便根据每个定价期了解我们应该每天应该定多少:
总体而言,快照和历史表都有助于阐明不同的定价研究。拥有这两种数据结构有助于提高定价变动分析的效率,但有必要考虑这些分析中快照表的局限性。
库存管理
有效的库存管理有时具有挑战性,具体取决于所提供的数据流。能够运行网店所需的最小值仅依赖于两列SKU和可销售数量。出于分析目的,需要更多属性。
例如,为了处理易腐烂的产品,两者都具有批号和到期日,这样可以了解到可能被废弃的产品。对于库存中有状态的收货和受损货物,可以更好地了解哪些数量的SKU可能会被修理/翻新并重新投入库存或回收备件。
此数据结构的一个潜在用途是计算库存的现有天数(doh)。手头上的天数是一个衡量我们是否可能对特定项目过度或低估的指标。例如,如果我们想使用此数据结构根据7天的销售情况来计算doh:
库存变化是库存管理中的另一个主题,它需要自己的数据结构。了解库存移动的原因有助于了解操作上发生的情况,无论是损坏、跨仓库的库存转移还是入库。数据结构至少应包含SKU信息,状态代码,运动数量和日期:
有了这些信息,我们既可以将库存作为这些事件的总和进行核对,也可以计算关键绩效指标(如损坏率)以及其他运营指标。总结
留存,参与度和增长都是以用户为中心的领域,因此他们需要建立类似的数据结构以满足他们的分析和报告,这一点不足为奇,即:
客户表
客户事件集合表
客户群集合表
定价研究可以依赖于价格快照和价格历史表两种类型的数据结构来帮助进行分析,基本上包含相同的信息,但对其进行某些查询更易于访问。
库存管理反过来也依赖于两种数据结构:库存表和库存变动表。库存表高度依赖于可以从源系统获得的属性数量和粒度,而库存变化表可以解释为多个事件的合并。
电子商务是一个巨大的领域,它能够进行广泛的分析,并具有高效的数据结构,如上面列出的那些有助于提供重要价值的数据结构。
预览时标签不可点收录于话题#个上一篇下一篇