自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 基于 Docker 的中文 PDF OCR 服务部署实战

本文介绍了如何使用 Docker 部署一个支持 PDF 光学字符识别(OCR)的本地 Web 服务。该服务基于 Python 的 FastAPI 框架构建,结合 pdf2image 将 PDF 页转换为图像,利用 pytesseract 执行文字识别。用户可通过 HTTP 接口上传 PDF 文件,系统返回识别出的文本内容。部署过程中使用 Docker 构建镜像并开放端口供访问,支持英文识别,亦可扩展中文和多语言功能。该服务适用于构建自动化文本提取工具或文档数字化处理系统。

2025-05-23 10:21:54 494

原创 用 Docker 部署语音识别服务(funasr)

本文介绍了如何基于 FastAPI 和 FunASR,快速构建一个本地语音识别服务接口。通过上传音频文件,服务能实时返回对应的文本转写结果。同时,本文还讲解了如何配置跨域支持,确保该服务可以被浏览器端以及 Dify 等自动化工作流无缝调用。最后,示范了如何利用 Docker 容器化部署,实现一键启动、易于维护和扩展的高可用语音识别微服务。此方案适合需要自主控制语音数据和快速集成自动化流程的开发者和企业。

2025-05-22 11:31:50 866 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除