AI绘画极简攻略：Stable Diffusion本地部署与提示词工程

九章云极AladdinEdu

已于 2025-09-11 17:25:55 修改

阅读量1.1k

点赞数 23

CC 4.0 BY-SA版权

文章标签： AI作画 stable diffusion 迁移学习人工智能机器学习 gpu算力图像处理

于 2025-09-05 11:30:46 首次发布

本文链接：https://blog.csdn.net/AladdinEdu/article/details/151218089

点击 “AladdinEdu，同学们用得起的【H卡】算力平台”，注册即送-H卡级别算力，80G大显存，按量计费，灵活弹性，顶级配置，学生更享专属优惠。

引言：人人都是艺术家，AI是你的画笔

你是否曾惊叹于网络上那些绚丽多彩、创意非凡的AI绘画作品？是否认为掌握这门技术需要高深的编程知识和高昂的硬件成本？今天，这篇攻略将彻底打破你的刻板印象。借助强大的开源项目和开发者们的无私贡献，我们现在可以在一台普通的家用电脑上，轻松搭建属于自己的AI艺术工作室。

本文将手把手带你走进AI绘画的世界，核心围绕两点：第一，如何使用秋葉aaaki的整合包，像安装软件一样简单地在本地部署Stable Diffusion；第二，如何掌握提示词工程（Prompt Engineering）的精髓，并了解LoRA模型训练的入门知识，从而从“抽卡”玩家进阶为有目的的“创作者”。最终，你将能独立构思并生成高质量、独具个人风格的AI艺术作品。

第一部分：零基础入门——秋葉aaaki整合包本地部署详解

对于绝大多数初学者来说，从GitHub拉取源码、配置Python环境、解决各种依赖库冲突无疑是噩梦般的体验。幸运的是，国内大神秋葉aaaki制作了一键整合包，极大地降低了入门门槛。

1.1 前期准备：检查你的硬件

在开始之前，你需要确保你的电脑满足最基本的要求：

显卡（GPU）：这是最重要的部件。推荐使用NVIDIA显卡，且显存至少4GB（如GTX 1650、1060 6G等）。显存越大（8G、12G或以上），能生成的图片分辨率越高，速度也越快。AMD显卡支持较为复杂，整合包对N卡支持最为友好。
硬盘空间：至少预留20GB以上的可用空间。主要用于放置整合包、基础模型和生成的图片。
操作系统：Windows 10 或 Windows 11。

1.2 下载与安装

**获取整合包：**在百度网盘或相关论坛（如本站）搜索“秋葉aaaki Stable Diffusion整合包”。请务必从可信来源下载，以避免安全风险。压缩包大小约为10G左右。
解压：将下载好的压缩包解压到你电脑上任意一个剩余空间充足且路径不含中文的磁盘目录下。例如 D:\sd-webui-aki-v4.4。
**一键启动：**解压完成后，进入文件夹，双击运行 A启动器.exe。

1.3 启动与界面初识

首次运行启动器，它会进行一些初始化工作。之后你会看到一个非常友好的启动器界面：

一键启动：点击这个按钮即可运行Stable Diffusion WebUI。
高级选项：**在这里你可以进行各种配置，如：
版本管理：**更新你的整合包版本。
模型管理：方便地下载和管理各种模型。
疑难解答：如果遇到问题，可以在这里一键修复依赖。
功能选项：建议勾选监听远程连接（如果你想在局域网内其他设备访问），并可以设置自定义参数。

点击“一键启动”，程序会自动打开一个命令行窗口并加载必要组件。稍等片刻，你的默认浏览器就会自动弹出 Stable Diffusion WebUI 的界面。它的地址通常是 http://127.0.0.1:7860。

至此，恭喜你！你已经成功在本地部署了世界上最强大的AI绘画工具之一！

第二部分：核心创作力——提示词工程的艺术与科学

安装只是第一步，如何让AI画出你心中所想，全靠“提示词”（Prompt）。提示词是与AI沟通的唯一语言，其质量直接决定成图质量。

2.1 提示词的基本结构

提示词通常由正面提示词（Prompt） 和负面提示词（Negative Prompt） 组成。

正面提示词：描述你想要什么。例如：一个女孩，星空，赛博朋克城市。
负面提示词：描述你不想要什么。例如：丑陋的手，多余的手指，模糊，水印。

2.2 提示词语法与技巧

权重控制：

(word)：增加权重。括号可以多层叠加，每层增加1.1倍权重。例如 (best quality)。
[word]：降低权重。
(word:1.5)：精确控制权重，1.5代表1.5倍权重。这是最推荐的方式。
() 和 [] 不要滥用，精确的数值控制效果更好。

组合与交替：

[word1|word2]：在生成过程中交替使用word1和word2，可以产生混合效果。

迭代步数关联：

[word:1.5:20]：表示从第20步开始，word的权重变为1.5。可用于在生成后期引入或强化某些概念。

2.3 常用标签与公式

一些经过社区验证的“咒语”可以显著提升图片质量。

高质量通用正面提示词（可作开头）：

masterpiece, best quality, ultra-detailed, 8k, HD, absurdres, professional lighting, cinematic lighting

（中文大意：杰作，最佳质量，超高细节，8k分辨率，高清，超高分辨率，专业打光，电影级光照）

通用负面提示词（必填，可有效避免常见瑕疵）：

(worst quality, low quality, normal quality:1.4), lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, ugly, disgusting, amputation

（中文大意：最差质量，低质量，正常质量，低分辨率，解剖结构错误，手部错误，文字，错误，缺少手指，多余手指，更少手指，裁剪，JPEG压缩痕迹，签名，水印，用户名，模糊，变异的手，画得不好的手，画得不好的脸，变异，畸形，丑陋，恶心，截肢）

一个简单的创作流程：

主体：1 girl, beautiful, smiling
场景与氛围：in a field of sunflowers, sunny day, golden hour, warm light
细节与风格：flowing white dress, detailed eyes, freckles, photorealistic, photography
画质标签：masterpiece, best quality, ultra-detailed
负面提示词：复制上面的通用负面词。

多尝试不同的组合，观察AI如何响应你的指令，你会逐渐找到“对话”的感觉。

第三部分：塑造独特风格——LoRA模型训练初探

基础模型（如chilloutmix、majicmix等）能生成通用高质量图片，但如果你想固定某种特定人物脸孔、画风或元素，就需要用到LoRA（Low-Rank Adaptation of Large Language Models）。

LoRA是一种轻量级的模型微调技术，它不像训练完整大模型那样需要巨大的算力和数据，通常只需要十几张到几十张图片，在消费级显卡上训练半小时到几小时，就能得到一个几MB到几百MB的小模型文件，效果却非常惊人。

3.1 训练前的准备

准备数据集：

主题：确定你想训练什么？比如你自己的照片、某个二次元角色、一种特定的绘画风格（水墨风、铅笔素描）或一个物件。
图片数量：建议15-25张高质量图片。太少效果不佳，太多可能过拟合。
图片要求：分辨率统一（建议512x512或768x768），主体清晰、角度多样、光照多样。如果是人物，需要面部特写、半身、全身等不同景别。务必确保图片内容合法合规，尊重肖像权和版权。

处理数据集：

使用秋葉整合包内置的“图像预处理”功能（在训练页签下），可以为你的每张图片自动生成对应的说明文本（TAG）。你需要手动检查和修正这些文本，确保它们准确描述了图片内容。高质量的TAG是训练成功的关键。

3.2 使用秋葉整合包进行训练

秋葉整合包同样内置了“一键训练”功能，极大简化了流程。

放置数据：将处理好的图片和TAG文件放在整合包下的 train\LoRA\项目名\image 文件夹中。
配置参数：在训练器页签选择LoRA训练，并设置主要参数：

基础模型：选择你要训练的基础模型（如novelai\model.ckpt）。
训练数据集路径：指向你的项目文件夹。
分辨率：与你准备的图片分辨率一致。
最大训练轮数：一般设置10-20。
学习率：初学者可使用默认值。

开始训练：点击“开始训练”，程序会自动运行。完成后，模型会输出在 output 目录下。

3.3 使用你的LoRA

训练完成后，将生成的 .safetensors 模型文件放入整合包下的 models\Lora 文件夹中。重启WebUI后，在文生图或图生图页面，点击右下方的LoRA图标，选择你训练的LoRA模型，它就会以 <lora:你的模型名:1> 的形式添加到你的提示词中。你可以通过调整最后的数字（如0.8或1.2）来控制其影响力的大小。

现在，你就可以让你的AI画家运用它刚刚学会的新技能了！