轻松爬取豆瓣电影榜单：用 Python 和 Requests 获取电影名称与上映时间_编写python程序,使用re、requests库,请求电影榜单第一页, 在获取的响应中-CSDN博客

本文链接：https://blog.csdn.net/liuyalin92546/article/details/144585747

Python 是爬虫开发的首选语言，而在 Python 中，有两个非常重要的库——Requests 和 BeautifulSoup，它们分别用于网页请求和网页内容解析。今天，我们将深入讲解这两个库的安装与使用，并通过一个简单的案例，带你了解如何利用它们来抓取网页数据。

一、Requests 库：发送 HTTP 请求

1.1 Requests 库简介

Requests 是 Python 中非常流行的一个 HTTP 请求库，简单易用，功能强大。它使得发送 HTTP 请求变得非常方便，无需处理底层的复杂细节。Requests 可以帮助我们轻松发送各种类型的 HTTP 请求（如 GET、POST 等），并处理返回的响应数据。

1.2 安装 Requests

首先，你需要确保已经安装了 Requests 库。可以通过 pip 进行安装：

pip install requests

1.3 使用 Requests 发送 GET 请求

发送 HTTP 请求的过程是爬虫的第一步，使用 Requests 库，我们只需要简单的几行代码，就能发送一个 GET 请求，获取网页的 HTML 内容。

import requests
# 发送 GET 请求
url = 'https://www.baidu.com'
response = requests.get(url)
# 打印网页响应状态码
print(response.status_code)  # 200 表示请求成功
# 打印网页内容
print(response.text)  # 获取网页的 HTML 内容

方法：