用户画像和标签体系-《用户画像:方法论与工程化解决方案》读书笔记

本文介绍了用户画像的概念,强调它是大数据应用的基础,用于数据走出数据仓库,支持个性化推荐和精准营销。用户画像主要通过统计类、规则类和机器学习挖掘类标签来构建。文章详细探讨了各类标签的特性和比较,以及用户画像数仓架构,包括数据源、建模环节等。此外,还阐述了用户画像项目流程,包括需求分析、任务分解、场景讨论、特征选取和模型测试等步骤。

目录

0. 概述

1. 用户画像简介

2. 用户画像助力数据走出数据仓库

3. 标签类型

3.1 统计类标签

3.2 规则类标签

3.3 机器学习挖掘类标签

3.4 上述3类标签的比较

4. 用户画像数仓架构

4.1 数据源

4.2 用户画像建模环节

5. 用户画像整体方案需要考虑的几个模块

5.1 数据指标体系

5.2 标签数据存储

5.3 标签数据开发

5.4 作业调度工具

5.5 用户画像产品化

5.6 用户画像应用

6. 用户画像建设项目流程

6.1 画像的需求分析和目标解读

6.2 任务分解和需求调研

6.3 需求场景讨论与明确

6.4 应用场景和数据口径确认

6.5 特征选取和模型数据落表

6.6 线下模型数据验收和测试

6.7 线上模型发布和效果追踪

7. 每阶段的产出物

99. 参考资料


0. 概述

本文是在学习《用户画像:方法论与工程化解决方案》这本书时做的一些笔记


1. 用户画像简介

用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌,如图1-1所示。用户画像可看作企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础

 

 

 

课程简介:  本项目课程是一门极具综合性完整性的大型项目课程;课程项目的业务背景源自各类互联网公司对海量用户浏览行为数据业务数据分析的需求及企业数据管理、数据运营需求。 本课程项目涵盖数据采集预处理、数据仓库体系建设用户画像系统建设、数据治理(元数据管理、数据质量管理)、任务调度系统、数据服务层建设、OLAP即席分析系统建设等大量模块,力求原汁原味重现一个完备的企业级大型数据运营系统。  拒绝demo,拒绝宏观抽象,拒绝只讲不练,本课程高度揉理论实战,并兼顾各层次的学员,真正从0开始,循序渐进,每一个步骤每一个环节,都会带领学员从需求分析开始,到逻辑设计,最后落实到每一行代码,所有流程都采用企业级解决方案,并手把手带领学员一一实现,拒绝复制粘贴,拒绝demo化的实现。并且会穿插大量的原创图解,来帮助学员理解复杂逻辑,掌握关键流程,熟悉核心架构。   跟随项目课程,历经接近100+小时的时间,从需求分析开始,到数据埋点采集,到预处理程序代码编写,到数仓体系搭建......逐渐展开整个项目的宏大视图,构建起整个项目的摩天大厦。  由于本课程不光讲解项目的实现,还会在实现过程中反复揉各种技术细节,各种设计思想,各种最佳实践思维,学完本项目并勤于实践的话,学员的收获将远远超越一个项目的具体实现,更能对大型数据系统开发产生深刻体悟,对很多技术的应用将感觉豁然开朗,并带来融会贯通能力的巨大飞跃。当然,最直接的收获是,学完本课程,你将很容易就拿到大数据数仓建设用户画像建设等岗位的OFFER课程模块: 1. 数据采集:涉及到埋点日志flume采集系统,sqoop业务数据抽取系统等; 2. 数据预处理:涉及到各类字典数据构建,复杂结构数据清洗解析,数据集成,数据修正,以及多渠道数据的用户身份标识打通:ID-MAPPING等;3. 数据仓库:涉及到hive数仓基础设施搭建,数仓分层体系设计,数仓分析主题设计,多维分析实现,ETL任务脚本开发,ETL任务调度,数据生命周期管理等;4. 数据治理:涉及数据资产查询管理,数据质量监控管理,atlas元数据管理系统,atlas数据血缘管理等;5. 用户画像系统:涉及画像标签体系设计,标签体系层级关系设计,各类标签计算实现,兴趣类标签的衰减合并,模型标签的机器学习算法应用及特征提取、模型训练等;6. OLAP即席分析平台:涉及OLAP平台的整体架构设计,技术选型,底层存储实现,Presto查询引擎搭建,数据服务接口开发等;7. 数据服务:涉及数据服务的整体设计理念,架构搭建,各类数据访问需求的restapi开发等;课程所涉及的技术: 整个项目课程中,将涉及到一个大型数据系统中所用到的几乎所有主要技术,具体来说,包含但不限于如下技术组件:l Hadoopl Hivel HBasel SparkCore /SparkSQL/ Spark GRAPHX / Spark Mllibl Sqoopl Azkabanl Flumel lasal Kafkal Zookeeperl Solrl Prestop
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值