Hive零基础从入门到实战 实战篇(四)计算用户分布

本文介绍了如何使用Hive进行用户分布分析,包括DAU中新老用户、各平台、各渠道、年龄段、性别以及购买次数的用户分布的提取方法。通过聚合计数和处理不同格式的数据,实现对用户行为的全面洞察。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

目录

前言

1. DAU中的新老用户分布

2. 各平台用户分布

3. 各渠道用户分布

4. 各年龄段用户分布

5. 用户性别分布

6. 购买次数的用户分布


前言

在日常提数中,经常会需要各类用户的分布,比如:

  • DAU(日活跃用户)中的新老用户分布
  • 各平台用户分布
  • 各渠道用户分布
  • 各年龄段用户分布
  • 用户性别分布
  • 某种行为的用户分布(购买1次的有多少人,2次的有多少人……)等等等等。

本文就来介绍一下这些分布数据的提取sql。分布听起来高大上,其实就是按照各个维度进行聚合然后计数罢了,没什么难度。下文用到的表字段含义见实战篇(二)

1. DAU中的新老用户分布

因为日活表中没有一个字段可以判断用户是否为新用户,所以不能直接进行聚合计算,这里分别计算后关联到一起即可。

WITH new_user
AS (--新用户数
      SELECT day
            ,count(DISTINCT user_id) new_num
      FROM app.t_wd_new_user
      WHERE day = '
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风影楼前

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值