本次主要爬取东方财富网关于“大盘资金流向历史数据”的数据
根据日期及流入资金数据绘制折线图,尝试使用XHR或者bs抓取数据,无奈失败且比较麻烦,采用了selenium抓取的方法。
并使用xpath获取网页中的表格数据,需要提前安装谷歌浏览器及相关程序
from selenium import webdriver #导入模块
import time
import csv #存储数据
from lxml import etree
option = webdriver.ChromeOptions() #网址获取
option.add_argument('headless') #设置浏览器静默
driver = webdriver.Chrome(options=option)
driver.get('http://data.eastmoney.com/zjlx/zs399006.html')
time.sleep(2)
source = driver.page_source
mytree = etree.HTML(source)
tables = mytree.xpath("//table[@class='tab1']")#定位表格,返回列表
for i in range(len(tables)):#循环表格
onetable = []
trs = tables[i].xpath('.//tr')#取出所有tr标签
for tr in trs:
ui = []
for td in tr:
texts = td.xpath(