- 博客(4)
- 收藏
- 关注

原创 详解pandas数据分析之groupby分组聚合(基于电商平台数据)
该篇文章基于电商的商品数据信息,详细介绍pandas数据分析之分组聚合的方法与技巧(保密起见,只展示部分数据)。 分组聚合结果展示: 文章目录: 一、导入pandas包并读取数据集 数据 数据字段说明 二、分组 1、生成分组对象 2、查看分组对象类型 3、查看分组对象的方法(函数) 4、查看分组数量 5、查看各分组 6、查看各分组索引 7、查看各分组的唯一识别标签 ...
2018-12-18 22:29:02
2336
1
原创 NLTK文本预处理与文本分析
本文主要介绍Python中NLTK文本分析的内容,咱先来看看文本分析的整个流程: 原始文本 - 分词 - 词性标注 - 词形归一化 - 去除停用词 - 去除特殊字符 - 单词大小写转换 - 文本分析 一、分词 使用DBSCAN聚类算法的英文介绍文本为例: from nltk import word_tokenize sentence = "DBSCAN - Density-Based Spat...
2019-03-22 19:44:47
1401
转载 词性标注的词性说明
1. CC Coordinating conjunction 连接词 2. CD Cardinal number 基数词 3. DT Determiner 限定词(如this,that,these,those,such,不定限定词:no,some,any,each,every,enough,either,neither,all,both,ha...
2019-03-21 22:28:58
884
原创 python连接mysql与sql server数据库及相应的模块封装
一、Python连接MySQL数据库及模块封装 1、连接模块封装 步骤:首先建立名为“db_sql” 的文件夹,在文件夹下再建立名为“db_mysql”的“.py"文件,在改文件下编辑如下代码”: import pymysql import pandas as pd def execute_sql(sql): localhost = "72.106.100.12" us...
2019-02-21 20:50:45
1777
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人