- 博客(10)
- 收藏
- 关注
原创 自然语言处理基础-字符串处理、正则、结巴分词(关键词、停用词、词性分析)
nlp基础:字符串处理、正则表达式应用、结巴分词(中文分词、添加停用词、关键词提取、词性分析)
2025-06-11 21:36:34
1130
原创 大数据计算引擎、常用组件介绍(一)包含HDFS/MAPREDUCE/YARN/HIVE
大数据计算引擎(MAPREDUCE/DAG/SPARK/FLINK/KYLIN/IMPALA)和大数据常用组件介绍(HDFS/MAPREDUCE/YARN/HIVE)
2025-06-10 23:12:19
1052
原创 scrapy爬虫实战(二): 结合Selenium实现动态加载网页数据采集(详细解说爬取过程以及完整代码)
教你如何使用scrapy+selenium爬取动态加载网页数据
2025-05-15 18:05:55
2441
原创 scrapy爬虫实战(一):爬取财经网站新闻数据(动态渲染页面)---详细图文解说
用scrapy框架手把手教你如何爬取最热门财经网站的新闻数据(动态渲染页面)
2025-05-12 17:13:18
1109
原创 Anaconda安装+scrapy部署及初步认识
详细图文解说Anaconda分别在Windows系统和Linux系统安装,以及部署scrapy以及初步介绍
2025-05-08 22:03:50
1043
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人