Python 爬虫应该了解Cookie

本文介绍了Cookie的基本结构,包括NAME、VALUE、DOMAIN、Expires等字段,并讲解了Cookie的有效期、路径限制及安全属性。同时,文章提及了Cookiejar类的不同实现,如FileCookieJar、MozillaCookieJar和LWPCookieJar,它们分别用于存储和管理Cookie。在使用时,需要导入http.cookiejar库来创建CookieJar对象。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先要了解的是cookie结构:

根据网上查询大概其结构如下

Set-Cookie:

NAME=VALUE;Expires/Max-age=DATE;Path=PATH; Domain=DOMAIN_NAME;SECURE

结构变量的含义

NAME:cookie 的name

VALUE:cookie 值,动态值

DOMAIN:服务器域名

Expires:Cookie 有效和终止日期

PATH: 属性定义了页面可获取服务器设置的 Cookie路径

HttpOnly:防攻击

SECURE 在 cookie 里的一个变量值,表明 是否是 HTTPS。

Cookie是服务端根据用户访问产生,当用户访问时发送给User-Agent(浏览器),浏览器将Cookie中的键值保存到指定的目录下的内,以后请求同一网站时发送cookie给服务端(是服务端发送的cookie)

Cookiejar是一个类其子类有FileCookieJar,MozillaCookieJar,LWPCookieJar

FileCookieJar:作用主要是检索cookie信息并将cookie存储到文件中

MozillaCookieJar :是FileCookieJar派生的,用于Mozilla浏览器

LWPCookieJar :创建与libwww-perl标准的 Set-Cookie3 格式。

在使用时应加载头文件:

from http.cookiejar import CookieJar

并创建对象

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

燕山之边

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值