
python
文章平均质量分 87
大屁孩。
世界从来不平等,你有多努力,就有多特殊。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
在无网络的机器上pip安装python模块
一、需要先在有网络的机器上把相应的模块安装好在有网络的机器上安装好模块后,执行命令:pip freeze >requirements.txt会在当前目录下生成一个requirements.txt文件,里面是当前已安装好的模块名称,编辑此文件,只保留想要在没有联网的那台机器安装的模块,这里拿paramiko和pymysql举例:然后将指定的模块下载到文件夹package,执行以下命...原创 2020-01-07 11:34:05 · 1724 阅读 · 0 评论 -
pd.read_csv出现Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098解决方案
在使用pandas的read_csv方法的时候出现了如下错误:Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098错误原因标记化数据时出错,数据的结构不正确,这个文件一行应该有4097个数据,但在第408行出现了4098个数据。解决方案事先处理好数据,让数据的结构统一;如果不能处理数据...原创 2019-07-17 10:27:07 · 4818 阅读 · 0 评论 -
java执行cmd命令返回结果中文乱码解决方案
最近在做一个案例需要用java调用cmd执行python文件,但在获取返回结果的时候,中文出现了乱码。代码及输出结果如下: public static String predictPython(String path, String param) throws IOException, InterruptedException { String exe = "python"; Stri...原创 2019-07-01 00:59:07 · 5882 阅读 · 5 评论 -
BeautifulSoup不能正确解析或找不到特定标签的解决方案
近期在使用BeautifulSoup对网页进行解析,想要获取网页的数据,如下代码:soup = BeautifulSoup( resp.text, 'html.parser' )结果发现根据特定的id找不到对应那个标签,还出现找到了标签,但是标签结构破坏的情况,比如下面这个例子:这是网页内容,我要循环每个tr标签,得到th里的文本,关键代码如下:最终输入出的结果为:可以看到前面输...原创 2019-06-18 13:32:13 · 13888 阅读 · 2 评论 -
python爬取指定歌曲的MV
目标网站音悦Tai:http://www.yinyuetai.com/爬取结果根据指定的歌曲爬取十个相关的mv,存在列表里,十个mv对应十个字典,键为mv名,值为mv的数据。原创 2019-05-06 11:54:40 · 1822 阅读 · 0 评论 -
CART分类回归_对离散型和连续型特征列的选择
CART分类回归树分类与回归树是二叉树,可以用于分类,也可以用于回归问题。区别:分类树输出的是样本的类别, 而回归树输出的是一个实数。对离散型和连续型特征列的选择一、CART分类树(待预测结果为离散数据):选择具有最小Gain_GINI的属性及其属性值,作为最优分裂属性以及最优分裂属性值。Gain_GINI值越小,说明二分之后的子样本的“纯净度”越高,即说明选择该属性(值)作为分裂属性(...原创 2019-04-16 21:41:41 · 4841 阅读 · 2 评论 -
python爬虫:爬取全国航班信息
目标网站携程:https://flights.ctrip.com/domestic/schedule/思路分析获取到所有的地方航班打开网址,可以看到如下内容:这一步目的是获取到这里显示的所有的航班。得到一个地方航班的所有线路随便打开一个航班,可以看到这个地方航班所有的线路,如下图:这一步目的是获取到这里显示的所有的线路。得到一条线路的所有航班信息打开一条线路,可以看到这条...原创 2019-04-16 17:21:19 · 23072 阅读 · 14 评论 -
python实现把汉字转为拼音
前提:需要安装xpinyin模块pip install xpinyin简单使用示例:搞定。原创 2019-04-13 15:12:01 · 1955 阅读 · 0 评论 -
机器学习:利用朴素贝叶斯根据人员姓名预测性别及拉普拉斯平滑处理
准备使用的数据集结构(共120000条数据):. 需导入的模块:import pandas as pdimport mathfrom collections import defaultdict原创 2019-03-23 15:29:55 · 2503 阅读 · 5 评论 -
远程访问Jupyter Notebook
一、生成配置文件并设置密码如果要远程连接jupyter notebook,需要设置一个密码,具体操作请参考我的另一篇博客,在这里就不多加赘述了。https://blog.csdn.net/smile_Shujie/article/details/88357371二、设置允许所有IP访问打开配置文件 jupyter_notebook_config.py文件中默认允许的IP为localhos...原创 2019-03-08 22:42:58 · 1127 阅读 · 0 评论 -
Jupyter Notebook设置密码
一、生成配置文件进入cmd控制台,输入如下命令:jupyter notebook --generate-config执行以上命令后会在用户目录下会产生一个.jupyter文件夹,如下图所示:文件夹中会有一个jupyter_notebook_config.py文件。二、生成密码打开Jupyter Notebook,执行以下代码:from notebook.auth import ...原创 2019-03-08 20:12:40 · 16441 阅读 · 2 评论 -
pip install tesserocr pillow 安装失败解决方案
python识别验证码需要安装tesserocr :pip install tesserocr pillow但是有许多伙伴通过这种pip方法安装失败:用conda命令进行安装的话,就可以了:conda install -c simonflueckiger tesserocr pillow亲测有效。...原创 2019-03-01 20:44:51 · 3878 阅读 · 0 评论 -
python连接mysql及基本操作
python操作mysql需要导入pymysql模块,请先安装pymysql模块:pip install pymysql测试与数据库的连接:import pymysql# 打开数据库连接conn = pymysql.connect( "localhost", "root", "a", "stude原创 2019-03-01 20:09:52 · 742 阅读 · 0 评论