搜索
返回列表 发新帖

[淘宝运营] 推荐模型点击率涨2%转化不变,算好算坏?

[复制链接]

7万

主题

7万

帖子

8万

积分

管理员

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
80274
130vip 发表在  13 小时前  | 显示全部楼层 | 阅读模式
漏斗拆解:认清比率与绝对值,交叉验证如果一个推荐模型把点击率从 6% 提升到了 8%,但用户后续收藏率、加购率和复访率都没有变,你会如何判断这个模型是在 “抓眼球”,还是在 “真推荐”?

遇到这种 “前端指标涨了,后端指标没动” 的面试题,我们先把大方向捋一下。这其实是一道非常经典的漏斗分析和业务常识题,面试官的核心考察意图根本不是让你去猜模型到底行不行,而是看你能不能把指标拆解清楚,能不能分清 “比率” 和 “绝对值” 的关系,以及你有没有多维交叉验证的业务 sense。

我们先给一个从上往下的分析框架。第一步肯定是先对齐口径,把这几个率的分子分母算清楚,看看绝对值到底发生了什么变化。第二步是引入验证性指标,比如停留时长和跳出率,来判断流量的真实质量。第三步就是做人群下钻,看看增量到底是由哪部分用户贡献的。把这三步走完,是抓眼球还是真推荐,自然就水落石出了。

第一部分:先把数字算清楚,搞懂分母是什么
你看这几个数放在一起,其实挺有意思的。点击率从 6% 涨到了 8%,说明在同样的曝光量下,点击的人数实打实地变多了。这时候我们必须搞清楚,题目里说的 “收藏率、加购率、复访率没有变”,这些后端指标的分母到底是什么。

通常在电商或者内容社区的漏斗里,加购率的计算方式是 “加购人数 / 点击人数”。我们带入具体的数字来推演一下。假设大盘有 10000 次曝光,原来的点击率是 6%,那就是 600 个点击。假设原来的加购率是 10%,那么绝对加购人数就是 60 人。

现在点击率涨到了 8%,也就是有了 800 个点击。如果加购率依然保持 10% 没变,那么绝对加购人数就变成了 80 人。看到这里你大概就能意识到一件事,这其实是一个非常巨大的业务利好。因为在漏斗开口扩大的情况下,后端转化率居然没有被稀释,这意味着模型不仅找来了更多的流量,而且这批新流量的质量和老流量一样好。

如果真的是为了 “抓眼球” 搞出来的虚假繁荣,比如用了很夸张的标题党或者擦边球封面,数据表现绝对不是这样的。标题党骗人点进来之后,用户发现货不对板,马上就会退出,根本不可能去加购或者收藏。这时候的分母(点击人数)变大了,但分子(加购人数)没变甚至变少了,加购率一定会暴跌。所以,只要后端比率没掉,大概率说明模型是在 “真推荐”,它成功拓展了目标人群的边界。

第二部分:引入交叉验证指标,看透流量质量
虽然算完绝对值我们心里大概有底了,但在实际业务里,光看漏斗转化率还是不够严谨。为了彻底锤死 “这不是抓眼球” 这个结论,我们需要引入几个关键的交叉验证指标。

首先最直观的就是看页面停留时长和秒退率(跳出率)。用户点进详情页之后,是看了两秒钟就划走,还是完整看完了图文甚至翻了评论区。如果点击率涨了,但平均停留时长大幅缩短,秒退率飙升,那这绝对是抓眼球。可能是 UI 改版导致了误触,比如把点击热区做得特别大,用户不小心点到了,这种流量毫无价值。

其次可以看看用户的互动深度。除了收藏和加购,用户有没有产生其他的微小正向行为。比如在内容场景下,有没有点开大图,有没有滑动查看更多推荐商品。真推荐带来的用户,即使当下没有立刻加购,他在页面里的探索行为也会非常丰富。如果这些深度互动指标都很健康,那说明模型确实把合适的东西推给了合适的人。

第三部分:下钻人群画像,看看增量从哪来
把大盘数据看清楚之后,我们还得往下深挖,看看这 2% 的点击率增量到底是哪些人贡献的。这时候就需要对用户进行分层,比如按新老用户、活跃度或者购买力来切分。

如果这部分增量主要来自平时极少点击的低活跃用户,那就非常厉害了。你想啊平时根本不怎么逛的人,突然开始频繁点击了,而且他们的加购率还能维持住大盘的平均水平,这说明模型真的挖掘到了他们的潜在兴趣。这就是技术带来的真实业务增量。

但如果增量全部来自极度活跃的重度老用户,那我们就得稍微警惕一下了。这可能意味着模型在疯狂榨取老用户的注意力,给他们推了大量高度同质化的内容。老用户本来就容易点,现在推得更密集了,点击率自然高。但长期来看,这会透支老用户的体验,导致信息茧房,这时候复访率虽然现在没变,但拉长到一个月来看可能就会掉。

第四部分:排查边界情况和业务风险
分析到这里,逻辑基本闭环了,但我们还可以多想一步,排查一些特殊的边界情况。比如,有没有可能是推荐策略没变,但是商品本身的供给发生了变化。

假设最近平台刚好在上大促,或者引进了一批极具性价比的爆款商品。这时候不管模型怎么推,用户的点击欲望都会天然变高。这种情况下,点击率提升的功劳就不能全算在推荐模型头上,我们需要对比一下大盘的自然流量点击率,看看是不是整体水位都上涨了。

另外还要确认一下这个数据的观测周期。如果是 A/B 测试刚上线第一天的数据,那参考价值其实有限。很多时候新模型刚上线会有 “新奇效应”,用户看到不一样的推荐结果会好奇多点几下,但过几天就疲软了。所以必须观察至少一个完整的业务周期,比如七天或者十四天,看看指标是不是真的稳定住了。

最后帮你总结归纳一下这道题用到的核心知识点:
漏斗分析与指标定义:明确转化率的分子分母,区分 “比率指标” 和 “绝对值指标” 在业务上的不同含义。
交叉验证思维:不能孤立地看单一指标,要结合停留时长、跳出率等过程指标来评估流量质量。
用户分层与精细化分析:通过拆解新老、活跃度等维度,定位指标变化的真实驱动力。
外部因素与周期排查:考虑业务大盘波动、促销活动以及 A/B 测试的新奇效应。


好了,现在我是面试官。既然你刚才提到,如果加购率没掉,说明绝对加购人数增加了,这是一个巨大的业务利好。那么请问,如果在这次 A/B 测试中,实验组的点击率确实从 6% 涨到了 8%,加购率也维持不变,但是最终实验组的 “实际成交 GMV” 却比对照组跌了 5%,你觉得可能是什么原因导致的?

回复

使用道具 举报

发表回复

 懒得打字嘛,点击右侧快捷回复  
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表