手把手教你利用Python网络爬虫获取APP推广信息

最新推荐文章于 2024-08-12 17:05:35 发布

2401_84584682

最新推荐文章于 2024-08-12 17:05:35 发布

阅读量1.2k

点赞数 16

CC 4.0 BY-SA版权

分类专栏：程序员文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/2401_84584682/article/details/138323777

作者：Python进阶者

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

CPA之家app推广平台是国内很大的推广平台。该网址的数据信息高达数万条，爬取该网址的信息进行数据的分析。

在这里插入图片描述

项目目标

实现将获取到的QQ，导入excel模板，并生成独立的excel文档。

项目分析

反爬措施处理

前期测试时发现，该网站反爬虫处理措施很多，测试到有以下几个：

直接使用requests库，在不设置任何header的情况下，网站直接不返回数据。
同一个ip连续访问40多次，直接封掉ip，起初我的ip就是这样被封掉的。

为了解决这两个问题，最后经过研究，使用以下方法，可以有效解决。

获取正常的 http请求头，并在requests请求时设置这些常规的http请求头。
使用 fake_useragent ，产生随机的UserAgent进行访问。

需要的库和网址

1、网址，如下所示：

https://www.cpajia.com/index.php?g=Wap&a=searchua

2、需要用到的库：requests、time、lxml、ua

项

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

2401_84584682

关注关注

16
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

用Python手把手教你实现一个爬虫（含前端界面）

全沾软贱开发攻城狮

12-04

1万+

随着互联网的飞速发展，再加上科技圈的技术翻天覆地的革新，互联网上每天都会产生海量的数据，这些数据对于企业和个人都具有重要的价值。作为开发者对数据处理并不陌生，关于使用python应该也不会陌生，因为现在python语言已经在初中阶段就开始普及了，关于python的主要功能之一的爬虫想必也不陌生，其实爬虫（也称网络蜘蛛）是一种能够自动抓取网络数据的工具，它可以帮助我们从网络上获取所需的信息。

Python社交媒体营销与广告推广

吃不胖.

08-26

216

Python是一种强大而灵活的编程语言，可用于创建各种应用程序，包括社交媒体营销和广告推广。使用Facebook Ads API，您可以自动化创建广告系列、广告集和广告，以及跟踪广告系列的性能。使用Google Ads API，您可以自动化创建广告系列、广告组和广告，以及跟踪广告系列的性能。当然，您可以根据自己的需要，使用Python进行更复杂的社交媒体营销。当然，您可以根据自己的需要，使用Python进行更复杂的广告推广。当然，您可以根据自己的需要，使用Python进行更复杂的广告推广。

参与评论您还未登录，请先登录后发表或查看评论

python手机端下载-Python3,x：如何进行手机APP的数据爬取

weixin_37988176的博客

11-01

2324

Python3,x：如何进行手机APP的数据爬取一、简介平时我们的爬虫多是针对网页的，但是随着手机端APP应用数量的增多，相应的爬取需求也就越来越多，因此手机端APP的数据爬取对于一名爬虫工程师来说是一项必备的技能。我们知道，网页爬取的时候我经常使用F12开发者工具或者fiddler之类的工具来帮助我们分析浏览器行为。那对于手机的APP该如何使用呢？同样的，我们也可以使用fiddler来分析。好了...

python爬app_Python爬虫抓取手机APP的传输数据

weixin_39670464的博客

11-23

312

大多数APP里面返回的是json格式数据，或者一堆加密过的数据。这里以超级课程表APP为例，抓取超级课程表里用户发的话题。1、抓取APP数据包方法详细可以参考这篇博文：Fiddler如何抓取手机APP数据包得到超级课程表登录的地址：http://120.55.151.61/V2/StudentSkip/loginCheckV4.action表单：表单中包括了用户名和密码，当然都是加密过了的，还有...

python手机软件-Python爬虫：抓取手机APP的数据

weixin_37988176的博客

11-01

652

分享一篇文章，原文来自：j_hao104的个人页面。摘要大多数APP里面返回的是json格式数据，或者一堆加密过的数据。这里以超级课程表APP为例，抓取超级课程表里用户发的话题。1.抓取APP数据包方法详细可以参考这篇博文：http://my.oschina.net/jhao104/blog/605963得到超级课程表登录的地址：http://120.55.151.61/V2/StudentSk...

Python自动化爬取App数据

04-23

5479

基本环境配置版本：Python3 系统：Windows 需要安装： 1.JDK - Download JDK，Appium要求用户必须配置JAVA环境, 否则启动Seesion报错。 2.Appium - Download Appium, 安装过程请自行搜索。 3.Android SDK - Download SDK 4. Selenium - 建议使用低版本的Pytho...

手把手教你进行Python网络爬虫中的Charles+Postern抓包

m0_59485658的博客

03-30

5167

为什么要说使用Charles+Postern 在实际抓手机App包场景中，有很多种方案，经典的就是Fiddler，但是Fiddler会有一个问题，如果App设置了不走代理这个选项，那Fiddler就不行了。为什么Charles+Postern可以呢? 是因为Charles就没有直接监听到App，Charles是监听到了Postern上，Postern就是一个vpn，所以App设置不走代理也没用，Postern照样能监听到，然后Postern再转发到Charles上，这样就完成了抓包。但是双向验证

python爬取app聊天信息_手把手教你爬取手机app中的信息

weixin_39929595的博客

12-20

1799

使用工具：Fiddler+基础爬虫Fiddler是一个抓包神器，用来检查电脑和互联网之间所有的通讯内容，而且比较简单容易上手，显示的格式也比较友好。网页基本都会爬了，现在开始要想想如何去爬手机app里的内容了，爬取手机内容的方式也有很多，今填就介绍一个比较简单的组合，使用Fiddler+基础爬虫的形式来爬取，主要的案例就是来爬取知乎app内的热榜内容。知乎热榜案例：使用fiddler+基础爬虫爬取...

手把手教你用python抢票回家过年(代码简单)

09-20

### 使用Python进行火车票查询与抢票 #### 一、项目背景与目标 ...通过本文的学习，不仅可以帮助读者更好地理解网络爬虫和自动化编程的基本原理，还能为日常出行提供便利。希望本文能对读者有所帮助！

python 爬视频下载_Python爬虫之App爬虫视频下载的实现

weixin_39857211的博客

12-16

454

前言随着手app的发展逐渐强大，我们手机应用每天的生活也是非常的多。那我们怎么知道他的数据是怎么形成的，通过电脑端如何爬取。相信大家也有这样的问题。下面我将讲解这些操作流程。一、操作流程首先我们要有fidder4夜神模拟器pycharmpython3.0或以上版本二、fidder4抓包1.fidder配置首先我们先下载fidder，打开Fiddler，点击Tools => Options 打...

Python爬虫：抓取手机APP的数据

chenxuan5849的博客

01-20

8996

1、抓取APP数据包方法详细可以参考这篇博文：http://my.oschina.net/jhao104/blog/605963 得到超级课程表登录的地址：http://120.55.151.61/V2/StudentSkip/loginCheckV4.action ...

python爬app_Python爬虫-抓取手机APP数据

weixin_39610594的博客

11-23

171

抓取超级课程表话题数据。#!/usr/local/bin/python2.7# -*- coding: utf8 -*-"""超级课程表话题抓取"""import urllib2from cookielib import CookieJarimport json''' 读Json数据 '''def fetch_data(json_data):data = json_data['data']time...

Python-群发推广邮件

weixin_40997544的博客

06-16

279

python-高效办公

怎样在input里加入搜索_手把手教你使用Python打造一款简易搜索引擎

weixin_39553757的博客

11-23

293

点击上方“Python爬虫与数据挖掘”，进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤一去紫台连朔漠，独留青冢向黄昏。/1 前言/相信大家在知识共享的这个年代一定在网上下载了很多的文件保存以供日后有时间学习吧，毕竟硬盘空间也比较有限，下面我们就来说说我们要做的这个项目，就是搜索盘搜里的资源然后进行下载。/2 项目目标/ 实现搜索自己想要的文件，...

Python爬取网站上面的数据很简单，但是如何爬取APP上面的数据呢

Python学习Q群696455390

06-11

644

前言在我们在爬取手机APP上面的数据的时候，都会借助Fidder来爬取。今天就教大家如何爬取手机APP上面的数据。很多人学习python，不知道从何学起。很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。很多已经做案例的人，却不知道如何去学习更加高深的知识。那么针对这三类人，我给大家提供一个好的学习平台，免费领取视频教程，电子书籍，以及课程的源代码！ QQ群：1097524789 环境配置 1、Fidder的安装和配置下载Fidder软件地址：https://w..

App数据的爬取

Liu_Bruce的博客

04-11

4462

在网页中，我们可以借助浏览器开发者工具中的Network面板看到网页中产生的所有网络请求和响应内容，然而App怎么办呢？想拦截App中的网络请求，就得用到抓包工具了，例如Charles、Fiddler、mitmproxy等，我们可以通过这些工具拦截App和API通信的请求内容和响应内容，如果能从中找到一定的规律，就可以用程序直接构造请求来模拟API的请求，从而完成数据爬取。

Python抓取APP数据的基础步骤