爬虫之-bilibili视频下载-下载链接获取

最新推荐文章于 2023-03-20 09:43:28 发布

--龙

最新推荐文章于 2023-03-20 09:43:28 发布

阅读量1.9k

点赞数

CC 4.0 BY-SA版权

分类专栏：学已至用爬虫 python

本文链接：https://blog.csdn.net/qq_33668011/article/details/110222726

python 同时被 3 个专栏收录

21 篇文章

订阅专栏

学已至用

4 篇文章

订阅专栏

爬虫

4 篇文章

订阅专栏

本文介绍了一种从B站爬取系列视频的方法，包括如何获取视频信息、视频及音频下载地址等关键技术步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

获取系列视频信息：（名称+请求地址）

urls = []
names = []
bv_num = "这里是需要下载视频的BV值"
def get_tilt():
	http = "https://www.bilibili.com/video/%s?p=%s"
	try:
		url = "https://www.bilibili.com/video/%s" % bv_num
		response = requests.get(url=url, headers=getHtmlHeaders)
		if response.status_code == 200:
			pattern2 = r'\<script\>window\.__INITIAL_STATE__=(.*?);'
			result2 = re.findall(pattern2, response.text)[0]
			title = json.loads(result2)
			for a in title["videoData"]["pages"]:
				p = a["page"]
				part = a["part"]
				urls.append(http % (bv_num, p))
				names.append(part)
	except RequestException:
		print('请求Html错误')

获取视频下载地址：（用于分片下载）

url = "前面获取到各‘集’视频地址"
getHtmlHeaders = {
			'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
						  'Chrome/86.0.4240.198 Safari/537.36'
		}
def parseHtml():
	try:
		response = requests.get(url=url, headers=getHtmlHeaders)
		if response.status_code == 200:
			html = response.text
			try:
				pattern1 = r'\<script\>window\.__playinfo__=(.*?)\</script\>'
				result1 = re.findall(pattern1, html)[0]
				temp = json.loads(result1)
				try:
					video_url = temp["data"]["dash"]["video"][0]["baseUrl"]
					audio_url = temp['data']['dash']['audio'][0]['baseUrl']
					# video_url 、audio_url 后面用于下载
				except:
					vedio_url = temp['data']['durl'][0]['url']
					# video_url 后面用于下载
			except:
				print("%s【%s】下载失败！********" % (title, url))
	except RequestException:
		print('请求Html错误:')