1.打开B站的热门视频
2.右键查看页面源代码,将第一个标题选取部分搜索,得到信息内容的来源,查看负载中的请求地址,这里作为目标url地址。
3.爬取热门视频的信息并保存到csv文件中
爬虫部分代码
import requests
import json
import csv
url = 'https://api.bilibili.com/x/web-interface/popular?ps=20&pn=1&web_location=333.934&w_rid=3fe5bc9825c83f407b66ba1064507049&wts=1707288726'
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0',
'Cookie':浏览器中的cookie
}
f = open('热门视频信息.csv',mode='a',encoding='utf_8')
csv_write = csv.DictWriter(f, fieldnames=[
'视频标题',
'视频类型',
'播放量',
'弹幕量',
'评论数量',
'收藏数量',
'投币数量',
'分享数量',
'点赞量',
])
csv_write.writeheader()
response = requests.get(url=url,headers=headers)
json_data = response.json()
for index in json_data['data']['list']:
title = index['title'] #视频标题
tname = index['tname'] #视频类型
view = index['stat']['view'] #播放量
danmaku = index['stat']['danmaku'] #弹幕量
reply = index['stat']['reply'] #评论数量
favorite = index['stat']['favorite'] #收藏