您的位置 首页 干货知识

两分半 | 游戏里的辛普森悖论

每周两分半,增加一个数据小知识~

 

当游戏进入长线运营阶段,项目组为了提高游戏营收,便需要明确哪一个付费部分是玩家们投入最多的模块,以方便后续的付费优化

 

但我们用数据分析锁定的功能,真的是这款游戏的核心付费模块吗?我们先假设某个游戏有 A、B两个含付费系统的主要玩法,当玩家参与其中一个玩法并完成付费后,便达成了该玩法的付费转换在 A、B 两个玩法均有相同人数参与测试的前提下,我们分别统计了中小R玩家及大R玩家的测试数据:

 

两分半 | 游戏里的辛普森悖论

 

无论是中小 R 还是大 R 的百分比数据结论,都指向他们更偏好为 A 玩法付费。但当我们统计全部用户的数据,并附加上具体人数时,结论却发生了逆转——即 B 类玩法付费转化率更高:

 

两分半 | 游戏里的辛普森悖论

 

这种情况下,无论细分结果还是总计结果,两者都无法统一为一个具有指导性意义的数据结论。这种细分总计的偏差现象,便是“辛普森悖论”。

该问题的根源其实可以归于表面数据的掩盖性百分比的特点为可以清晰展示出占比关系,但无法呈现出分组间的数量大小关系。所以不同数据组之间的百分比对比需要基于分组大小的统一。 

案例中,尽管我们 A 、B 两个玩法分组的人数均为 350人,但每个玩法中的中小 R 、大 R 的分组数大小完全不同。此时再采用需要分组数量大小一致的百分比统计,最终的数据结论自然是存在错误的

当有多个数据组或数据组之间的大小存在不一致时,我们更应该采用分层分析或交叉分析获得多维度结论。而不应该为了获得单一结论,而选择简单粗暴的百分比对比以偏概全或以全盖偏,让数据结论出现“辛普森悖论”的指导性错误。

两分半 | 游戏里的辛普森悖论

热门文章