- 博客(10)
- 收藏
- 关注
原创 数据分析工具--hadoop(hdfs)
数据分析是指运用适当的统计分析方法或者工具对收集来的大量数据进行整理和归纳**,将它们加以汇总和理解并消化,提取有价值信息,从中发现因果关系、内部联系和业务规律,以求最大化地开发数据的功能,形成有效结论的过程,发挥数据的**作用。
2024-12-18 20:13:58
1390
原创 数据分析工具hive(一)--基础篇
数据仓库之父比尔•恩门(Bill Inmon)在1991年出版的"Building the Data Warehouse"(《建立数据仓库》)一书中所提出的定义被广泛接受。数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
2024-12-18 19:46:57
1231
原创 数据分析工具MySQL(二)--窗口函数篇
defval默认值,当两个函数取上N/下N个值,当在表中从当前行位置向前数N行已经超出了表的范围时,lag()函数将defval这个参数值作为函数的返回值,若没有指定默认值,则返回NULL,那么在数学运算中,总要给一个默认值才不会出错。其中,over是关键字,用来指定函数执行的窗口范围,包含三个分析子句:分组(partition by)子句,排序(order by)子句,窗口(rows)子句,如果后面括号中什么都不写,则意味着窗口包含满足where条件的所有行,窗口函数基于所有行进行计算;
2024-12-05 19:40:59
987
原创 数据分析工具MySQL(一)--基础篇
SQL是数据分析必掌握的技能,其实SQL和Excel的公式有许多融会贯通之处,掌握住每一项技术的基础,是平地高楼必备的素养,任何知识的学习都是一样的,希望我们每天都能保持一颗学习的心。集合表示多个值,使用逗号分隔,例如: name in (悟空,八戒)in中的每个数据都会作为一次条件,只要满足条件就会显示。模糊查询,% 表示匹配任意多个字符串 _ 表示匹配一个字符。查询某一列为NULL的值, 注: 不能写 = NULL。排序、分组、聚合、多表查询、合并查询、子查询。1、DML操作表中数据。
2024-12-05 19:27:58
394
原创 《出发吧麦芬》- 第二篇埋点篇
巧妇难为无米之炊,再厉害的数据分析师没有数据也没办法数据驱动增长,所以数据埋点是发生在项目立项之后,确定要研发这款游戏了,可以和策划共同设计埋点,基础类别的通用点位提前设计,系统玩法的埋点要等策划方案出来后再逐一补充完善,所以数据埋点是一个伴随游戏终身的,只要有新东西加进来就要设计相应的数据埋点;以公会系统为例,每一个事件对应着不同的属性,其他系统设计其实都是类似的,按照事件发生时候会出现的场景以及此事件的流程,来设计埋点,获取我们想要的数据。用的什么角色-装备:使用的是什么角色,射手、治疗、坦克等等;
2024-12-03 16:03:49
468
原创 《出发吧麦芬》- 第一篇游戏体验
麦乐兽养成线通过抽卡获取,麦乐兽包括升级 、升星、技能的携带、升级等对其战力提升;延续传统的放置游戏的核心玩法,离线收益+挂机收菜仍是此游的核心玩法之一,遵循着战力不足就睡一觉的原则,给不氪不争的玩家很轻松的感觉,上线就离线收益,做做日常任务,点点红点,副本能过就过,打不过就只能坐牢,个人体验很难成为大DAU的爆款,如果运营得当,可能会出现《旅行的青蛙》现象级游戏;装备、技能、麦乐兽、天赋、秘宝、转职,每一项都与战力数值挂钩,而玩家要不断推进主线、通关新副本,等级只是门槛,真正需要的是达到对应水平的战力。
2024-12-03 15:21:42
1177
原创 数据分析方法论(二)漏斗分析
AARRR模型是2007年由Dave McClure(500 Startups创始人)提出的一种业务增长模式,是做用户增长和生命周期最常用的漏斗模型,从用户增长各阶段入手,包括Acquisition用户获取,Activation用户激活,Retention用户留存,Revenue用户产生收入,Referral自传播等用户的生命阶段,进行漏斗分析,判断用户流失大致处于哪个阶段,进而对问题阶段的用户进行细分,精细化运营,完成用户向成熟用户和付费用户的引导,实现用户增长。第一步:梳理关键节点,绘制流程与路径。
2024-12-02 19:34:14
1016
原创 数据分析方法论(一)留存分析
遇到这类问题首先需要确定的是整体用户的留存异常还是个别群体用户的留存异常,如果是整体用户的留存异常,我们需要分析我们的产品是否发生异常,可以通过用户的行为路径确定异常产品位置;部分有过从业经验的朋友应该知道,产品的自然新增用户是比较少的,如果我们仅靠产品自然用户增长,那么必然我们的活跃用户量级会非常小,虽然能够获得收益,但是这部分收益很可能养不起我们的公司;所谓沉没成本就是已经发生的不可回收的成本,比如金钱、时间、精力等,他会影响人们的当前决策,人做决策时候不仅仅看当前的利益,也关注以前的付出成本。
2024-12-02 19:20:20
1517
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人