- 博客(14)
- 收藏
- 关注
原创 数据分析 SQL 第六课 having&SQL运行逻辑
1、having的表达式与where的表达式基本相同,但是having的表达式可以使用聚合函数,where不可以,因为where是对原表数据进行筛选。c.执行group by语句是依据指定的字段对筛选后的数据进行去重分组,相当于excel建立了一个数据透视表,添加了行标签。having表达式 限定分组聚合后的查询行必须满足的条件,是对group by 分组后的数据进行筛选。d.执行having语句是对分组后的数据,进行满足特定条件的筛选;f.执行limit语句是对排序后的数据限制显示的行;
2025-07-12 17:41:40
248
原创 数据分析 SQL 第五课:聚合函数&group by
将多行数据按照规则聚合为一行,例如:求和(sum)、平均值(average)、最大值(max)、最小值(min)b、sum、average、max、min函数必须指定字段进行聚合运算,无法使用通配符*,并且也会忽略空值行。:a、查看表格一共有多少行时,用count(*)最准确,因为如果count(字段),会忽略字段中的空值。例子:查询2013年至2015年,每年每个科目的获奖人数,年份按照从大到小,人数按照从大到小排列。将字段按照group by后的字段进行分组,然后对分组后的每个组中的数据进行聚合。
2025-07-11 20:20:01
78
原创 数据分析 SQL 第四课:limit
select 字段 from 表格 where 条件 oder by 字段 asc/desc limit 数值:按照某字段升序或降序排列,展示前数值行。where 条件 oder by 字段 asc/desc。where 条件 oder by 字段 asc/desc。查询world表中人口数量第4到第7的国家和人口。例子:查询world表中面积排名前三的国家名称。select 字段 from 表格。select 字段 from 表格。注意:limit x,n意味着。从x+1行开始,返回n行。
2025-07-11 18:20:25
142
原创 数据分析SQL第三课:排序 order by
order by 字段 in (值1,值2) asc/desc:某行若含有值1或值2,则为“1”;若无则为“0”,按照升序,则值1、值2在最后;降序,则值1,值2在最前。查询nobel表格所有获奖者和获奖科目。结果将科目(subject)为化学(Chemistry)和物理(Physics)排在最后,再按照科目排序,然后按照获奖者姓名排序。
2025-07-11 12:30:19
115
原创 数据分析MySQL第二节课:where
查询国家名称含有3个a,且面积大于60万的国家以及面积,或者人口大于13亿,面积大于500万的国家及其面积。b.查询瑞典(Sweden)、挪威(Norway)和丹麦(Denmark)的国家名称和人口。a.查询面积(area)在250000和300000之间的国家名称(name)和面积。,%用来匹配多个字符,可以是0个、1个也可以是多个;b.查询国家名称中含有2个o且被两个字符隔开的国家名称。where 字段 like '通配符+字符'。a.查询国家名称中,第二个字母为't'的国家的名称和人口。
2025-07-10 18:20:32
142
原创 数据分析 MySQL第一节课:SELECT&FROM
MySQL的基本查询语句以及注意事项语句:1.SELECT:选择出需要显示的字段2.FROM:从什么表格中查询。
2025-07-05 18:59:25
518
原创 数据可视化Tableau
步骤:点击右下角'新建仪表盘' ——点击左侧功能栏中的'布局',输入长和宽来确定仪表盘整体的大小——将工作表拖入 仪表盘中,调整各个表的比例——点击表格,在左侧'布局'中,选择'边界'来添加表格的框线——最后调整表格的字体颜色等,使仪表盘整体更美观。要分析的数据为,各门店每日的成本以及盈利的数据,因此以门店ID+日期,作为链接字段,将门店信息与各门店每日/时的成本与营业额合并在一个表格内。点击'双轴',合并两个图,将‘标记’栏中位于下方的选项卡点开,并移除所有字段,颜色选择‘白色’,并调小。
2025-07-03 18:57:10
721
原创 数据分析可视化Tableau
不同用户对于数据可视化的需求是不同的。高层管理者:关注是否完成指标、业务整体分析中层管理者:各个维度的分析 、关于数据的总结报告普通业务人员:和自己切身相关的数据去选择合适的方式来强调内容的重要性和层级。
2025-07-02 17:47:56
181
原创 Python数据分析:数据的预处理:去掉异常值
列表,元素为行或者列的索引。使用data.isnull()方法返回一个大小和data一样的布尔型 DataFrame,并用 True 表示具有 NaN 值的元素,用 False 表示非 NaN 值的元素。data.fillna(method = ‘ffill’, axis = 0) # 将通过前向填充 (ffill) 方法用同一列的前一个数作为填充。data.fillna(method = ‘ffill’, axis = 1) # 将通过前向填充 (ffill) 方法用同一行的前一个数作为填充。
2025-06-04 17:03:47
436
原创 Python 数据分析:.strftime方法处理日期时间的格式化
参考文章:https://www.oryoy.com/news/shi-yong-python-de-strftime-fang-fa-gao-xiao-chu-li-ri-qi-shi-jian-ge-shi-hua.html1..strftime的基本概念:.strftime全称是“string formate time”,模块中、和类的一个方法。它的主要功能是将日期时间对象转换为格式化的字符串。通过使用不同的格式化代码,可以灵活地控制输出字符串的格式。2..strftime的基本用法:(1)导入dat
2025-06-02 11:03:48
217
原创 Python数据分析:df[]、df.loc、df.iloc[]有何区别
利用index的具体位置(所以它只能是整数型参数),来访问DataFrame对象中的一部分数据。df[] 操作可以用来切片DataFrame中的行或列,或具体数据。利用index的名称,来访问DataFrame对象中的一部分数据。具体例子,见上面两篇文章。
2025-05-28 16:46:02
310
原创 学习Python 数据处理第2天
对于一个利用Pandas创建的数据框(dataframe)(以下简称为df),如果想要输出数据框中的某一列,可用print(df["***"]),进一步,若想要输出某一列中,满足某一条件的行,可用print(df["***"][df["***"]==**
2025-05-28 15:51:58
172
原创 Python 自学第5天
我们也可以指定一个特定的分隔符作为split()方法的参数,例如:text.split(",")使用split()方法分割,默认情况下,split()方法会根据空格进行分割。2.python输出结果后面带着一个“None”是因为python函数使用return返回值,1.输入一个句子,如何使句子变成单词。这个函数默认还有一个返回值为None。#pyhon 函数#
2025-05-17 17:44:26
193
原创 自学Python 第4天——元组
2.问题:当输入在某列表、字典、元组中时,输出某值,若不在则输出“Not Found”。答:①利用if True/False 来控制语句是否输出。例如:有一个正方形,定义一个函数,输入边长,输出为周长和面积。1.使用f""输出一串字符。#python 元组#3.定义函数,返回某值。
2025-05-16 16:44:15
132
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人