
数据分析
数据分析师的成长之路
敌人派
数据分析,数仓工程师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据分析优质文章
1.电商数据分析的4大思维和8个指标来自-数据分析不是个事儿https://www.toutiao.com/i6811013424147857923/?tt_from=weixin&utm_campaign=client_share&wxshare_count=1×tamp=1627385154&app=news_article&utm_source=weixin&utm_medium=toutiao_android&use_new_st原创 2021-07-29 10:04:40 · 263 阅读 · 0 评论 -
数据分析实战之RMF模型(用户精准运营)
一、什么是RMF模型RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的最近一次消费(Recency)、消费频率(Frequency)以及消费金额(Monetary)三项指标来描述该客户的价值状况。阐述一下什么是R、M及F定义:R:最近一次消费(Recency)最近一次消费意指上一次购买的时候。理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应。营销人员若想业绩有所成长,只能靠偷取竞争对手的市场占有率,而如果要密切地注意消费者的原创 2021-05-24 12:01:56 · 14169 阅读 · 0 评论 -
python批量快速合并excel文件(csv和xls)
需要用到两个.py 分别是excel_NAME.py 和jindong3.py导入excel_NAME.py ,其 作用为批量读取目录文件的csv或者xls的文件名导入excel_NAME.py:import osimport reimport openpyxlimport pandasimport test_wyimport xlrddef get_one_type_file_list(InputFilePath, FileSuffix): # input: 文件夹路径(原创 2021-05-06 17:46:23 · 1196 阅读 · 0 评论 -
SQL索引的创建和使用
建立索引的原则:定义主键的数据列一定要建立索引。定义有外键的数据列一定要建立索引。对于经常查询的数据列最好建立索引。对于需要在指定范围内的快速或频繁查询的数据列;经常用在WHERE子句中的数据列。经常出现在关键字order by、group by、distinct后面的字段,建立索引。如果建立的是复合索引,索引的字段顺序要和这些关键字后面的字段顺序一致,否则索引不会被使用。对于那些查询中很少涉及的列,重复值比较多的列不要建立索引。对于定义为text、imag原创 2021-05-05 13:55:31 · 8800 阅读 · 2 评论 -
Python的读取目录下的excel文件及文件名
在用python处理一个目录的excel时候,发现没有读取整个excel的函数在网上搜索了下,发现有如此函数import osimport reimport openpyxlimport pandasimport test_wyimport xlrddef get_one_type_file_list(InputFilePath, FileSuffix): # input: 文件夹路径(当前路径直接写路径名, # 自动去除路径名 最前面 和 最后面 多个连续的/ or原创 2021-04-25 10:40:57 · 4791 阅读 · 0 评论 -
Pandas把dataframe或series转换成list的方法
一、把dataframe转换为list输入多维dataframe:df = pd.DataFrame({'a':[1,3,5,7,4,5,6,4,7,8,9], 'b':[3,5,6,2,4,6,7,8,7,8,9]})把a列的元素转换成list:方法1 df['a'].values.tolist() # 方法2df['a'].tolist()把a列中不重复的元素转换成list:df['a'].drop_duplicates().values.tolist()输入一维datafram原创 2021-04-25 10:24:13 · 17367 阅读 · 0 评论 -
DataFrame基本操作
1.建立dataframe(1)Dict to Dataframedf = pd.DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.randn(5)})df data1 data2 key1 key20 -0.484486 -1.404184 a one1 -1.541437原创 2021-04-18 14:02:19 · 1545 阅读 · 2 评论 -
股票策略的数据分析
样本及样本数据讨论样本选自上上证50加权(IHL9),上证50 指数是挑选A股市场中最具代表性的50只股票组成,俗称“超级大蓝筹指数”。其中上海证券市场规模大、流动性好的最具代表性的50 只股票组成样本股,以便综合反映上海证券市场最具市场影响力的一批龙头企业的整体状况。上证50 指数自2004 年1 月2 日起正式发布。其目标是建立一个成交活跃、规模较大、主要作为衍生金融工具基础的投资指数。data=name.DATA(150:end);c=name.CLOSE(150:end);h=name.H原创 2021-01-02 20:45:40 · 415 阅读 · 1 评论 -
Python 的excel处理操作
一、创建excel在桌面import pandas as pddf =pd.DataFrame()df.to_excel('C:/Users/Administrator/Desktop/output.xlsx')print("done!")注意要建立pip install openpyxl 包读取excel#在调用read_excel()函数时,添加条件“engine='openpyxl'”,借助openpyxl库来读取xlsx文件。即:read_excel(path,engine原创 2021-01-02 20:19:29 · 1289 阅读 · 1 评论 -
Python 疫情数据的可视化与分析(二)
Python处理数据 疫情词云Python 疫情数据的可视化与分析第二弹来袭。上次通过数据的预处理已经将疫情的数据清洗到excel中,详情见https://blog.csdn.net/qq_42695315/article/details/111411789这次将通过处理得到词云。import openpyxlfrom wordcloud import WordCloud# 读取数据wb = openpyxl.load_workbook('data.xlsx')# 获取工作表ws原创 2020-12-23 01:10:27 · 5551 阅读 · 0 评论 -
Python 疫情数据的可视化与分析(一)
疫情数据的可视化对疫情地图的数据的抓取与可视化词云显示,采用百度地图数据https://voice.baidu.com/act/newpneumonia/newpneumonia第一弹数据获取:可以打印出url网页数据信息import requestsurl = "https://voice.baidu.com/act/newpneumonia/newpneumonia"response = requests.get(url)print(response.text)获取URL的compon原创 2020-12-20 00:27:18 · 12017 阅读 · 6 评论 -
5g手机性能的数据分析,SPSS主成分分析
一、数据前言随着互联网技术的快速发展,5g手机在市场占比越来越大,其市场也逐渐扩大。本文基于国内外主要热销品牌的5g手机,包括有苹果,小米,华为等知名手机50种型号进行性能分析,评价因素包括评分,价格,评论人数,手机内存大小,手机屏幕等因素在网站上爬取相关数据,通过SPSS数据处理软件,先对数据进行处理,在挖掘分析,对手机相关指标进行描述统计,主成分分析,聚类分析,得到手机的影响因子。再对各手机型号进行聚类,得到不同层次的手机,对具体手机在进行评价,本文为广大消费者和手机厂商提供了相关理论依据,对学术界的原创 2020-12-18 23:12:27 · 1915 阅读 · 0 评论 -
数据分析师+前途无忧爬虫分析
首先说明这篇文章的数据来源,为前程无忧中所有“数据分析师”这一职位信息所得来的。并且主要分析了数据分析师在全国不同地区的需求情况、总体薪酬情况、不同城市薪酬分布、不同学历薪酬分布、不同地区学历要求情况、不同经验需求与薪酬分布情况。本文行文思路:数据采取数据清洗数据分析分析结论思考总结1.数据采集定位数据位置首先进入前程无忧首页,然后在职位搜索中检索数据分析师,不加其他限定条件,点击搜索可得到以下结果:可以看到关于数据分析师的岗位信息一共10263条。爬虫代码调试及运行本文代码参照P原创 2020-12-05 23:57:04 · 520 阅读 · 0 评论 -
SQL数据DML(增删改查)
增删表中的数据1.添加数据向db1中的student中插入值一种写法insert into 表名(列1,列2,...列n) values(值1,值2...值n);insert into student(id,name,age) values(1,"张无忌“,18);另一种写法简化insert into 表名 values(值1,值2...值n); -- 写完列名insert ...原创 2020-01-29 17:04:26 · 271 阅读 · 0 评论 -
mysql 登陆与基础增删改查CRUD笔记
mysql远程登陆与本地登陆mysql本地登陆输入指令:mysql -u root -p输出密码: (密码为初始密码)若不知道密码可在mysql的安装文件的目录下my.ini文件最后添加skip-grant-tables然后重启mysql服务1.关闭 net stop mysql2.启动mysql net start mysql在输入passwd:时按回车键跳过mysq...原创 2020-01-29 12:10:12 · 143 阅读 · 0 评论 -
浅谈数据分析、大数据分析和大数据开发的区别
自我介绍在大学期间主要学习一些数据分析的课程例如,统计学,多元统计学,数据挖掘,matalb,R语言统计分析,时间序列分析,也参加了几次数学建模竞赛。对数据分析也有些了解。实习时进了一家大数据公司,实习岗位为数据分析,主要为业务方面的数据分析。工作方面:一、取数机器人,利用程序员开发的大数据平台的接口(一些封装的API)提取数据。二、利用这些数据分析业务的异常点,利用SPSS、R语言和统计...原创 2020-02-26 15:02:31 · 3316 阅读 · 1 评论