自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 手把手教你搭建Coze工作流,一键创作自媒体平台爆火的心理学火柴人视频

极简心理学火柴人视频制作流程解析 摘要:本文拆解了当前流行的极简心理学火柴人视频制作流程。该工作流通过用户输入主题→大模型生成文案→拆分文案→合成音频字幕→生成绘图提示词→制作背景→剪映合成等环节完成视频制作。关键节点包括:1)大模型节点调整提示词可个性化文案;2)语音字幕合成节点选择音色;3)图像生成节点定制火柴人形象;4)剪映插件添加特效。工作流最终生成视频链接,可导入剪映进行二次编辑。该流程可帮助解决作品同质化问题,实现风格差异化。

2025-07-24 10:30:56 422

原创 AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250628更新 支持magcache加速

FramePack一款高效视频生成工具,基于神经网络实现逐帧预测,支持低显存运行(最低6GB)。特点包括:在RTX4090上可达1.5秒/帧的生成速度,支持大批次训练,提供GUI界面和多种注意力机制。

2025-07-04 16:04:38 915

原创 穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

摘要:该项目利用荀子基座大模型和LoRA微调技术,开发了一个现代汉语转古汉语风格的自动转换工具。通过训练文言文-现代文平行语料,模型能精准呈现古汉语的语法与韵味。该项目具有创新性和实用性,可应用于文化传承、教育辅助和文学创作等领域。项目已开源,支持社区共同完善,并提供了适配主流显卡的整合包。

2025-06-27 11:23:41 791

原创 IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示 v1.5 20250519更新

摘要:IndexTTS是由B站推出的创新中文文本转语音(TTS)模型,通过混合建模和时间戳嵌入技术显著提升了发音准确性(误读率降至0.9%)和自然度(断句准确率98.6%)。其技术架构融合了条件编码器、BigVGAN2解码器和Conformer模型,支持8G显卡运行,操作简便。应用场景广泛,包括无障碍阅读、智能客服和教育等。开源项目已获社区关注,未来将优化情感表达和多语种支持。

2025-06-24 16:33:01 1506

原创 AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频 一键整合包 NarratoAI v0.6.1

NarratoAI是一款智能视频剪辑工具,能将文字或口播内容自动生成完整的短剧解说视频。用户只需输入剧情文案,AI就会自动匹配素材画面、添加配音、字幕和背景音乐,生成1-3分钟的高清视频。支持剪映导出、人脸匹配和多种语音引擎,普通电脑即可运行,特别适合不会剪辑的短视频创作者使用。它简化了视频制作流程,是短剧解说账号的实用助手。

2025-06-22 11:13:27 515

原创 字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

BAGEL是由字节跳动开发的开源多模态基础模型,采用140亿参数(7B活跃参数)的Mixture-of-Transformer-Experts架构,统一处理语言、图像、视频等多模态数据。其核心创新包括双编码器设计、NextGroupofToken预测范式,在理解、生成和编辑任务上超越Qwen2.5-VL等主流模型,图像生成质量媲美SD3。特别值得注意的是,BAGEL展现出独特的"世界建模"潜力,支持多视角合成、自由视觉操作等高级功能,且不同能力随训练阶段自然涌现。实验表明结合VAE和Vi

2025-06-20 15:31:56 1265

原创 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer v20250617 一键汉化整合包

《FinegrainImageEnhancer图像增强工具介绍》摘要:该开源AI工具通过深度学习实现4倍超分辨率放大,支持参数精细化调节和效果种子管理,适用于照片修复、艺术创作等场景。整合包优化了原版性能,支持40/50系显卡,修复大量BUG并新增批量处理功能,提供汉化界面。特别适合8G显存设备运行,其人像增强效果突出。项目在GitHub开源,提供本地部署方案,同时附有视频教程和网盘下载资源。

2025-06-19 11:52:11 694

原创 你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

Kolors是由快手团队开发的开源AI绘画工具,支持中英文描述生成图像。用户输入文字即可获得符合描述的图片,适用于创意设计、个性化头像、教学插图、游戏创作等多种场景。该工具基于深度学习技术,通过文字与图像的关联模型实现"文字转图像"功能。Kolors特别优化了中文理解能力,需要NVIDIA 12G及以上显卡支持,生成图片保存在指定文件夹。项目开源特性使其具有持续改进潜力,为设计师、教育工作者等内容创作者提供了便捷的AI辅助工具。

2025-06-17 15:03:58 576

原创 视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

《AI全自动视频工厂:一键生成高清短视频》摘要: 这是一个开源AI视频生成工具,能将文字描述自动转换为专业短视频。用户只需输入文本(如教程或科普内容),系统就会智能匹配素材库中的高清视频片段,自动完成配音、字幕、配乐和转场特效,输出可直接发布的成品视频。工具特别适合自媒体创作者快速制作内容,支持本地部署(需技术基础)或在线平台简化版使用。部分高级功能需调用国内AI大模型服务,注册即赠试用额度。该项目提供一键启动包,解压即可体验AI视频创作的便利性。

2025-06-15 10:22:15 1504 1

原创 微软常用运行库合集(Microsoft Visual C++ Redistributable) Windows电脑系统必装软件 2025.05.30 再次更新

微软常用运行库合集是一款集成在微软 Windows 操作系统中的运行库,该合集可以让各种应用程序与操作系统之间进行有效的信息交流。通过微软常用运行库合集,不仅可以增强应用程序的使用体验,还可以防止操作系统崩溃以及增强系统的稳定性和可维护性。

2025-06-13 17:10:49 1454

原创 一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator(即 UVR5 的命令行版本)开发的,提供了友好的可视化界面,使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍

2025-06-11 10:13:26 1069

原创 图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.39

ComfyUI是一款可视化节点式AI图像生成工具,专为StableDiffusion系列模型设计。通过拖拽连接各类功能节点(如模型加载、提示词输入等),用户可构建复杂的工作流程并保存为JSON文件。支持SD1.x/SDXL/SD3等主流模型,提供文生图、图生图、ControlNet等丰富功能,兼容LoRA、Hypernetworks等扩展。特色包括动态提示词、Latent预览、区域合成等高级功能,具备跨平台兼容性(Windows/Linux/macOS)。该工具既适合创意工作者进行艺术探索,也方便开发者构建

2025-06-10 17:08:21 1249

原创 音视频转字幕小工具V1.2,支持上百种语言,离线视频翻译神器,批量处理,操作极其简单

音视频转字幕小工具V1.2,支持上百种语言,离线视频翻译神器,批量处理,操作极其简单

2025-05-29 11:01:42 327

心理学火柴人主工作流源码

用于生成视频草稿链接

2025-07-24

心理学火柴人子工作流源码

用于生成音频和字幕

2025-07-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除