Skip to content
View longxiao's full-sized avatar

Block or report longxiao

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Stars

python

22 repositories

Python - 100天从新手到大师

Jupyter Notebook 178,471 55,375 Updated Jan 15, 2026

删库

9,770 1,649 Updated Oct 20, 2025

一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、微信读书、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )

HTML 14,565 3,832 Updated Jun 28, 2025

实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、企查查、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评、携程、小米应用商店、安居客、途家民宿❤️❤️❤️。微信爬虫展示项目:

Python 5,396 1,427 Updated May 22, 2024

使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现

Python 3,254 1,575 Updated Apr 18, 2017

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python 43,629 9,609 Updated Feb 4, 2026

Download comics novels 小说漫画下载工具 小説漫画のダウンローダ 小說漫畫下載:腾讯漫画 大角虫漫画 有妖气 咪咕 SF漫画 哦漫画 看漫画 漫画柜 汗汗酷漫 動漫伊甸園 快看漫画 微博动漫 733动漫网 大古漫画网 漫画DB 無限動漫 動漫狂 卡推漫画 动漫之家 动漫屋 古风漫画网 36漫画网 亲亲漫画网 乙女漫画 webtoons 咚漫 ニコニコ静画 ComicWa…

JavaScript 3,879 349 Updated Oct 26, 2025

Collection of China illegal cases about web crawler 本项目用来整理所有中国大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规。致力于帮助在中国大陆工作的爬虫行业从业者了解我国相关法律,避免触碰数据合规红线。 [AD]企业租显卡算力部署AI请选Novagrid

HTML 4,512 313 Updated Mar 24, 2025

基于 Selenium 和 Tkinter 的爬取淘宝商品的Web自动化工具

Python 33 9 Updated Jan 12, 2024

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python 59,656 11,229 Updated Feb 3, 2026

自动爬取所有PlayStationStore中的所有游戏信息,包括封面、描述、价格、评分等,生成网页并索引 # # # Automatically crawl all game infos in all playstationstore, automatically generate web pages and index them

JavaScript 63 6 Updated Feb 4, 2026

文章爬虫,会每天都爬取一些有价值的官方文档的博客文章,以便于能得到第一手的更新,教程等信息

CSS 8 2 Updated Oct 2, 2024

关于 A visual no-code/code-free web crawler/spider易采集:一个可视化浏览器自动化测试/数据采集/爬虫软件,可以无代码图形化的设计和执行爬虫任务。别名:ServiceWrapper面向Web应用的智能化服务封装系统。

JavaScript 54 8 Updated Feb 5, 2026

Automate the process of making money online.

Python 12,969 1,235 Updated Jul 8, 2025

PyGWalker: Turn your dataframe into an interactive UI for visual analysis

Python 15,615 855 Updated Dec 30, 2025

Free Offline OCR 离线的中文文本检测+识别SDK

Python 1,373 387 Updated Jan 12, 2026

开源易用的中文离线OCR,识别率媲美大厂,并且提供了易用的web页面及web的接口,方便人类日常工作使用或者其他程序来调用~

Python 2,858 628 Updated Jun 14, 2023

This is a repo with links to everything you'd ever want to learn about data engineering

Jupyter Notebook 39,619 7,601 Updated Dec 15, 2025

A visual no-code/code-free web crawler/spider易采集:一个可视化浏览器自动化测试/数据采集/爬虫软件,可以无代码图形化的设计和执行爬虫任务。别名:ServiceWrapper面向Web应用的智能化服务封装系统。

JavaScript 44,041 5,392 Updated Feb 3, 2026

stock股票.获取股票数据,计算股票指标,筹码分布,识别股票形态,综合选股,选股策略,股票验证回测,股票自动交易,支持PC及移动设备。

Python 11,463 2,343 Updated Feb 5, 2026

Python tool for converting files and office documents to Markdown.

Python 86,414 4,999 Updated Jan 8, 2026

基于Python的开源量化交易平台开发框架

Python 36,175 10,820 Updated Jan 14, 2026