自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 pandas的分箱操作

我们可以自定义函数通过使用apple进行自定义分箱。一下为例子else:分箱操作的作用数据理解与可视化;将连续数据分成几个离散的箱子可以帮助我们更好地理解数据的分布情况。通过绘制分箱后的数据直方图、柱状图等图表,可以更清楚地看到数据的分布模式,有助于发现数据的特征和异常情况。特征工程;在机器学习和统计建模中,将连续数据分箱可以将数值型特征转换为类别型特征,从而适应某些模型的需求,或者提高模型的性能。例如,某些算法对类别型数据更为敏感,分箱后的特征可以提供更多信息。处理异常值。

2024-08-29 09:39:00 1273

原创 Pandas中map、apply、transform函数

在pandas中,map()函数可以用于根据字典的映射关系转换数据。map()函数是用于Series对象的方法,他将Series中的每个元素根据字典的映射进行转换。参数:na_action:是否忽略NaN,默认为None,可以设置成‘ignore’我们以例子来实现,将dataframe中的性别转换成汉字。map也可以传替函数:随机生成100个成绩,我们将成绩进行评级。

2024-08-28 09:36:33 472

原创 pandas处理异常值

异常值是与其他数据有明显不同的值,它们可能是由于数据收集错误、测量误差、或其他异常情况引起的。处理异常值的目标是使数据更加准确、可靠,并且适合用于后续的数据分析和建模。

2024-08-23 16:04:06 1286

原创 DataFrame多层索引

DataFrame多层索引的几种操作

2024-08-22 19:29:23 1406

原创 DataFrame常见的统计函数

介绍了简单统计函数、复杂统计函数以及相关性统计函数

2024-08-22 18:08:05 1946

原创 DataFrame数据的操作

DataFrame的一些基本操作

2024-08-22 12:48:56 546

原创 Pandas DataFrame 筛选数据方法

DataFrame筛选数据的方法包括:根据字段、标签、位置、布尔索引、通过query进行筛选。

2024-08-22 11:41:40 892

原创 pandas series

series就是pandas中的一维标记数组,是主要数据类型之一其元素包括data、index、dtype、name、copy。

2024-08-21 20:02:18 1062 1

原创 解决跨域问题(从浏览器读取本地文件)from origin ‘null‘ has been blocked by CORS policy

在学习d3.js的过程中,通过d3.csv()读取本地csv文件的过程中出现了跨域错误,错误如下:Access to fetch at 'file:///D:/%E5%AD%A6%E4%B9%A0%E8%B5%84%E6%96%99%EF%BC%88%E7%A1%95%EF%BC%89/htmlcssjsvue/code/d3.js/data222.csv' from origin 'null' has been blocked by CORS policy: Cross origin requests a

2024-04-26 15:38:31 8776 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除