
爬虫基础
老婆是云梦
追着你的梦,一直会在路上
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
分布式爬虫结构演示代码
import requests from bs4 import BeautifulSoup import re import time from redis import Redis headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.274...原创 2020-02-26 01:08:26 · 221 阅读 · 0 评论 -
知乎爬虫入门问题如何解决
众所周知,爬取知乎真的不简单。 闲话少说,直接上不太正确的源代码: #-*- coding:utf-8 -*- import requests import simplejson as json import pandas as pd import time import re headers ={"Host":"static.zhihu.com", "user-agent": "Mozi...原创 2019-05-19 01:22:50 · 1422 阅读 · 5 评论