晦涩难董先生-CSDN博客

原创从爬虫到网络---＜基石9＞在VPS上没搞好Docker项目,把他卸载干净

如有Linux服务器权限不足或遇到“找不到命令”，请补上 sudo 或联系服务器管理员。这条命令会删掉所有未被使用的容器、镜像、网络和卷，如果提示没有找到容器，可以忽略这些提示。

2025-05-10 22:09:56 541

原创从爬虫到网络---＜基石8＞看懂BBR、CUBIC等TCP拥塞控制算法（全网最通俗案例版）

在网络世界中，“速度”永远是一项关键话题。当我们用手机刷视频、用电脑打游戏时，背后有一个默默工作的“大管家”在负责交通管控——TCP拥塞控制算法。它们决定你上传下载有多快、游戏延迟有多低。今天，我们就用生活化场景和“故事会”的方式，来聊聊TCP拥塞控制算法，重点讲清楚BBR、CUBIC等主流算法的原理、演化关系、优劣比较，带你彻底告别“只会换算法命令，不懂背后原理”的尴尬！如果你跑普通家用宽带，不用管，CUBIC默认也不错。**大带宽/数据中心传大文件：**优选CUBIC。

2025-05-04 20:49:38 1553

原创从爬虫到网络---＜基石5＞你的第一台vps如何保证基本安全之＜锁上加告警之PAM＞

PAM 模块中session类型用于“会话管理”，在登录、登出前后自动执行一些动作，非常适合我们做“登录报警”！比如有个模块叫 pam_exec.so ：允许你在用户登录、登出时执行一个你自己写的 Shell 脚本！Ubuntu 的 PAM 登录机制为系统提供了极高的认证、管理与扩展性。通过 pam_exec.so，它允许你在任何认证、会话阶段，执行自定义脚本，实现如“登录实时通知”这类灵活、极实用的安全防御措施。

2025-05-04 06:30:00 762

原创从爬虫到网络---＜基石4＞你的第一台vps如何保证基本安全之＜UFW与Fail2Ban＞

UFW（Uncomplicated Firewall）是Ubuntu官方推荐的iptables前端，旨在简化复杂的iptables管理，帮助用户直观配置防火墙规则。UFW本质上是对iptables的一层封装，所有规则最终会落实在iptables内核防火墙。项目功能是否必要说明UFW防火墙，控制端口访问必要你已经启用了它，很棒。它是“静态规则”防护。Fail2Ban防爆破、动态封禁恶意 IP建议安装它是“动态防御”，专门针对暴力破解、异常访问行为。

2025-05-03 07:30:00 1536

原创从爬虫到网络---＜基石4＞你的第一台vps如何保证基本安全

随着云服务器（VPS）在业务部署、网站搭建及开发测试中的广泛应用，越来越多的开发者与运维人员选择使用 SSH 登录 VPS 以实现远程管理。然而，默认的 root 用户远程登录方式存在极大的安全隐患，攻击者一旦暴力破解密码，服务器将直接失控。因此，限制 root 用户 SSH 登录权限、启用普通用户登录、配置公钥认证机制，已成为强化服务器安全的必要手段。

2025-05-03 06:30:00 1616

原创从爬虫到网络---＜基石1＞搞通DNS,HTTP(S)

瞧见没？输入网址那一刻，表面是你和浏览器的温柔互动，台下是万台机器连轴转，以亿次请求调度保驾护航——无数服务器、交换机、协议、加密机制，为的就是让你能在全球彼此看似“秒通”。再想想，没有 DNS 的互联网等于没有门牌号的城市。没有加密的互联网，无异于花钱寄信，信封全透明，地址谁都能偷换。你可以继续“只会点网址”，但别忘了，每个互联网操作背后都是产业标准、工程师汗水和无数次暗战的结晶。DNS这样的骨干系统，别人一旦破坏，你的世界就会一秒黑屏。

2025-05-01 06:30:00 748

原创要搞一个PHP的工程,顺到手科普下VS Code

VS Code（Visual Studio Code）是一款由微软开发的免费、轻量级代码编辑器，支持多种编程语言和插件扩展。它适合前端、后端开发，甚至写文档都很方便。：你可以在VS Code的"键盘快捷方式"里自定义和学习所有快捷键！

2025-04-30 13:00:00 454

原创这时候,为什么要Laragon,什么是Laragon?

Laragon是一个在 Windows 系统上专门为 PHP、Laravel 等 Web 项目开发而设计的“本地开发环境集成工具”。你可以把它理解为Windows 下的 XAMPP/WAMP 的升级加强版。它主要用来一键帮你搭建好 Web 项目开发所需的各种环境，方便、快速、高度自动化。Laragon = Windows 下集成一切Web开发工具的“开发环境超市”，让你本地开发任何Web/PHP项目，简单又好用。Laragon 更适合 Windows 下快速、本地开发和调试，省心省力。

2025-04-30 06:30:00 1114

原创从 Scrapy 到 Django 必须掌握(8)：网站的自适应和响应式

一个页面自动适配所有设备，代码复用高，开发维护方便。为不同设备做不同页面，用户体验可以更好，但开发和维护复杂。现在主流的网站几乎都是用响应式设计，除非对不同设备有极高的优化需求，才会用自适应（比如某些大型门户，或需要极致性能体验的应用）。响应式网页设计已经成为现代网站开发的主流，由于有大量用户会用手机浏览，更需要高度重视响应式体验。下面我会从“规划-布局-细节-常见问题”四个部分，详细讲解一个响应式论坛网页从零开始应如何设计。需求梳理→ 明确终端和功能原型/线框图→ 画草图，尝试分辨率适配。

2025-04-22 06:15:00 1383

原创从 Scrapy 到 Django 必须掌握(7)：Forms 完全解析(二)

用户提交的数据往往是不完整的、格式不正确的，甚至是故意恶意的（如 SQL 注入）。表单通过 Django 的 Form 类与视图和模板连接，可以在前端页面上实时反馈用户输入的问题，而数据库直接验证数据无法实现。表单（forms）与后端数据库（如 MySQL）之间的区别主要在于它们的作用和功能在整个应用程序开发过程中的不同定位。它们的核心差异以及为什么通常需要使用表单而不是直接操作数据库来进行验证的原因就是本文需要讲解的地方;通过这样的分工，表单和数据库协作实现了数据的接收、验证和存储。

2025-04-21 06:45:00 778

原创从 Scrapy 到 Django 必须掌握(7)：Forms 完全解析(一)

Django 提供了许多内置的表单字段（如 CharField、EmailField、IntegerField），但有时我们需要定义自己的特殊字段类型或验证规则。例如，创建一个只允许接受特定格式字符串的字段。示例：创建自定义字段raise forms.ValidationError('只能包含字母和数字。')通过继承内置字段类并覆写其 validate 方法，我们可以创建新的字段类型。这个方法常用于特殊数据格式（如银行卡号、特定时间格式等）的验证。

2025-04-21 06:30:00 1067

原创 ‘从Scrapy到Django必须掌握(6)：django表单详细解

迁移（Migration）是 Django 的 ORM 提供的数据库框架，用来将模型（Models）中的定义同步到数据库表中。如果模型发生变化（新增字段、修改字段等），迁移机制会自动检测变化，并生成操作数据库表的迁移文件。

2025-03-31 09:30:00 1448

原创从 Scrapy 到 Django 必须掌握(5)：用户模型详解2

到此为止，我们已经完成了自定义 Django 用户模型的完整流程，包括从模型定义到迁移数据库，再到确保项目中所有与用户交互的地方都适配新模型。修改 settings.py 配置自定义用户模型。继承 AbstractUser 或 AbstractBaseUser 创建新用户模型。注册到 admin.py 以便在管理后台中管理。使用 makemigrations 和 migrate 命令同步模型到数据库。更新其他依赖用户模型的部分，确保兼容性。测试模型功能，确认无误。

2025-03-31 06:15:00 651

原创从 Scrapy 到 Django 必须掌握(5)：用户模型详解1

Django 自带了一个完整的认证和授权系统，其中，用户模型是其核心组件之一。用户名、密码、电子邮件、全名等用户基本信息。用户是否活跃/验证状态。创建、更新和验证用户凭据。用户角色管理（包括权限和分组）。Django 默认提供了一个用户模型，位于 django.contrib.auth.models.User 中，可以直接使用。如果你的用户需求比较简单（如只需用户名、邮箱、密码），内置的 User 模型已经能够满足。但在实际项目中，默认的用户模型可能无法满足需求。

2025-03-30 23:35:50 1096

原创从 Scrapy 到 Django必须掌握(4):Runte路由详解

如果你从 Scrapy 过渡到 Django，必须思考数据如何从爬取到展示整合，路由起到了桥梁的作用。在后续的开发中，理解 Django 的路由、动态配置和面向 API 的设计方法将帮助你晋级为高效的 Web 开发者。

2025-03-30 15:02:25 933

原创从 Scrapy 到 Django必须掌握(3):数据迁移详解

Django 使用强大的 ORM（对象-关系映射）功能提供了一种简单的数据库结构管理工具。从 Scrapy 到 Django 的转变，不仅涉及框架本身的学习，也需要在数据库迁移方面下功夫。通过 Django 的强大迁移工具，我们可以快速搭建和优化数据库结构。在开发初期，可以使用 SQLite 快速迭代，生产部署时迁移到 MySQL 或其他数据库。本教程提供的分步操作，旨在帮助您快速完成 SQLite 到 MySQL 的迁移，让 Django 项目运行在更高效的数据库环境中。

2025-03-29 23:52:36 741

原创从 Scrapy 到 Django，必须掌握(2)：settings 详解

Django 的 settings 是框架的核心配置模块，用于管理一个项目的全局配置。Django 项目的运行、功能扩展、安全管理依赖于一系列参数配置，这些配置项就是 settings 中的内容。当你创建一个 Django 项目时，系统会自动生成一个默认的 settings.py 文件。该文件包含了一些通用的应用配置，比如数据库连接、安装的应用、静态文件管理、模板设置等。settings.py 是整个项目的“大脑”，决定着你的项目如何运行。

2025-03-29 23:35:03 939

原创从scrapy到Django,必须掌握(1)

Django 提供了灵活的 URL 模式，可以通过正则表达式或路径参数来实现动态路由。例如：与 Django ORM 一样，你需要先定义模型来映射数据库表。示例中假设有一个 Product 模型，包含 price 和 created_at 两个字段。# 定义数据库# 定义模型price = DecimalField() # 假设价格是一个小数created_at = DateTimeField() # 创建时间字段# 创建表（如果表不存在）

2025-03-28 19:04:01 1360

原创攻破tensorflow,勇创最佳agent(3)---搞懂算法之半监督学习算法1

与标准SVM的目标一致，优化分类边界以最优化划分有标签数据。

2025-03-28 03:54:37 695

原创攻破tensorflow,勇创最佳agent(3)---搞懂算法之监督学习算法1

一种机器学习方法，利用。

2025-03-28 03:38:37 423

原创阿里云轻量级服务器Ubuntu22.04.4,装mysql链接到本机navicat

⚠️ 将你的用户名和你的密码替换为你需要的用户名和密码。% 表示允许该用户从任何 IP 地址连接。如果看到 active (running)，说明 MySQL 已启动。按 Ctrl+O 保存文件，然后按 Ctrl+X 退出。0.0.0.0 表示接受来自任何 IP 地址的连接。⚠️ 请将 '你的密码' 替换为你希望设置的密码。，如果配置无误，应该会提示连接成功。阿里云轻量服务器需在。

2025-03-27 06:15:00 1288

原创 js逆向,常见的navigator数据

在 JavaScript 逆向中，navigator 对象内的属性是非常重要的，因为前端页面通常通过这些属性来采集用户的环境信息。这些数据在反爬虫、检测自动化脚本（如爬虫、模拟器）或决定页面行为时经常会用到。以下是 navigator 对象中各属性的重要性以及它们的作用详细解读。

2025-03-26 06:30:00 1384

原创深入解析urllib.parse在爬虫开发中的应用

Python标准库中的urllib.parse模块的功能及在爬虫开发中的应用。该模块包含了诸多函数，如urlparse、urlunparse、urlsplit、urljoin、urlencode等，能够方便地解析、重构和操作URL，使爬虫程序更智能高效。在实践中，我们可利用这些函数处理动态网页分页、搜索结果采集、相对路径整合等情景，从而简化开发流程。此外，文章还提及了在更复杂场景中如处理重定向、短链接、动态构建查询参数等方面的高级应用，展示了如何通过urllib.parse解决这些问题。

2025-03-26 06:15:00 859

原创攻破tensorflow,勇创最佳agent(2)---损失(loss) 准确率(accuracy)问题

L1正则化（Lasso回归）：通过在损失函数中增加权重绝对值的和作为惩罚项，从而驱使某些权重减小到零，生成稀疏解，适合特征选择.L2正则化（Ridge回归）：通过增加权重平方和作为惩罚项，促使所有权重趋向较小的均匀值，而不是完全为零。它通过减少权重避免过拟合，增强模型的稳定性.这两种正则化方法可以在模型中结合使用，以提高模型的泛化能力和抗干扰能力。数据表示:模型在训练过程中的表现，loss和val_loss越小，accuracy和val_accuracy越高，说明模型越来越好。

2025-03-25 18:21:06 1331

原创攻破tensorflow,勇创最佳agent(1)---学习率learning_rate问题

学习率是决定在每次更新模型参数时的步长大小的变量。简而言之，学习率定义了优化算法在每次迭代中根据梯度（损失函数对参数的偏导数）更新权重的速度和幅度。其数学表达式通常为：(反正我看不懂,所以我就知道,这个学习率就是: 每次加一点,加到效果最佳;什么叫每次加一点?你失败了,就要总结,总结就要学习,找到经验再走一点;找到个谷底,再走到山峰;

2025-03-25 17:42:24 1158

原创爬虫工程师---如何用charles把scrapy的爬虫监控起来调试

想法是,通过charles挂上'魔法工具',然后跑代码的时候,实时监控每一个访问的请求状态和返回是个啥?原理其实和挂手机等一样的;但是,我想说的,让scrapy挂上charles...

2024-05-17 18:09:52 1116

原创爬虫工作量由小到大的思维转变---＜第七十六章＞ Scrapy爬虫引入Item Drop机制的概念及其价值

在Scrapy框架中，DropItem机制提供了一种有效的数据过滤和控制方式。具体来说，它是一种基于条件的数据丢弃机制，用于在数据处理流程中筛选出不需要的Item。当爬虫抓取到数据后，数据会被封装成Item的形式，在数据流经Scrapy的处理流程时，我们可以根据不同的需求对这些Item进行检查，并决定哪些Item应当继续被处理，哪些应当被丢弃。在技术实现上，DropItem是通过在Item Pipeline中抛出DropItem异常来完成的。

2024-05-16 19:44:14 1688

原创向爬虫而生---Redis 实战篇1 动态Redis连接管理在Python中的实践

随着互联网技术的飞速发展，数据处理和存储在Web开发和大数据处理领域中的重要性日益凸显。特别是对于如Redis这样的内存数据结构存储系统而言，其在处理大量数据时显得尤为关键。正因如此，对于管理与Redis实例连接的需求也随之增长，尤其是在应用规模不断拓展、数据量日益增加的今天，单一的Redis实例已经难以满足复杂的数据处理需求。在这种情况下，"动态Redis连接管理"成为了解决这一问题的重要手段。通过动态连接管理，我们可以根据实时的应用需求和资源状态，灵活地创建、复用或关闭与Redis实例的连接。

2024-05-16 06:30:00 1390

fiddle连接mumu模拟器到adb连接成功，保姆级

爬虫工作量由小到大的思维转变-＜第十七章 Scrapy给项目代理ip(二)＞,升级版rar

JS逆向分析工具，v1.8.3版本

解决mumu模拟器上网证书===`安全警告`问题!

app图片转文字-高端版(免费)

python做项目时候的一些的操作规范!!-戒小错无大错!!!

文章提取关键词,分词器(针对中文)-textrank4ch(需要改动),2023年10月12日

空空如也