- 博客(4)
- 收藏
- 关注
原创 Requests的get方法
User-Agent要再你的网页右键检查或者F12,然后点击网络,刷新你的页面,然后网络页面会有个搜索图案,点击输入你想要的关键词就会显示你搜索关键词的内容,就会有你搜索的信息,然后点击预览会看到网页的信息,确定后就可以查看标头,划到最下面就有你自己的User-Agent信息。在编写代码时也可以,网页面页是可以的。一般会显示响应的状态码、响应对象的类型等基本信息。服务器接收到请求后,会根据请求的内容返回相应的网页数据,:这行代码输出的是服务器返回的响应内容的文本形式。以上是我的要爬取的内容网址,只需要取。
2025-05-09 15:49:05
854
原创 一个简单的python爬虫
("my_baidu.html", mode="w", encoding="utf-8")中encoding="utf-8",不然会出现UnicodeEncodeError: 'gbk' codec can't encode character '\ue687' in position 22091: illegal multibyte sequence报错,这个报错是指“编码不兼容”,写入文件时,Windows系统默认使用。是响应对象的一个方法,其作用是读取响应中的内容。是ython 的标准库。
2025-05-08 23:27:48
500
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人