scrapy爬取京东商品信息
时间: 2023-10-21 14:04:50 浏览: 172
Scrapy是一个强大的Python网络爬虫框架,可以用来爬取京东商品信息。以下是一个简单的示例代码,可以帮助你开始:
```python
import scrapy
class JdSpider(scrapy.Spider):
name = "jd"
start_urls = [
'https://list.jd.com/list.html?cat=9987,653,655&ev=exbrand_1276%5F%5F0%5F%5F%7C%7C%7C&sort=sort_rank_asc&trans=1&JL=6_0_0#J_main'
]
def parse(self, response):
for product in response.css('div.p-item'):
yield {
'name': product.css('div.p-name a::text').extract_first().strip(),
'price': product.css('div.p-price strong i::text').extract_first(),
'image': product.css('div.p-img a img::attr(src)').extract_first(),
}
next_page = response.css('a.pn-next::attr(href)').extract_first()
if next_page is not None:
yield response.follow(next_page, self.parse)
```
这个示例爬虫会爬取京东的某个商品列表页面,并提取每个商品的名称、价格和图片。然后,它会继续跟随页面中的“下一页”链接,直到爬取所有页面为止。
你可以在命令行中使用以下命令来运行这个爬虫:
```
scrapy runspider jd_spider.py -o products.csv
```
这将会将爬取到的数据保存到名为products.csv的CSV文件中。
阅读全文
相关推荐














