关于pdf文档无大纲的若干解决办法(扫描版书籍/ppt转的pdf)。
girhub 开源pdf-bookmark项目解决大纲问题
项目地址:
https://github.com/ifnoelse/pdf-bookmark
使用条件
· 已有文本化目录结构:
eg:
· 知道偏移页数:(在预览模式下pdf文件页数标识与实际页码标识(正文)差值)
根据目录可知此书籍偏移页数为12(13-1)。
使用方法:
· 将代码下载到本地(下载问题自行解决)
·找到本地代码中bin目录下pdf-bookmark批处理文件
双击运行
特点
速度快,但是需要原始目录结构
使用Adobe Acrobat搭配AutoBookmark插件实现。(对于ppt转的pdf的大纲的实现)
使用条件:
· 软件:
··Adobe Acrobat
··AutoBookmark插件
···本人使用的是Adobe Acrobat2022 Pro DC+AutoBookmark-7.4-x86_64
插件安装
将插件直接拖入到Adobe Acrobat的安装目录下的plug_ins中
此时打开软件左上角出现增效软件按钮
使用方法:
·使用软件打开对应pdf
··一定要先对你要操作的pdf进行文本识别
·之后进行大纲实现:
选择一级二级标题
创建好合适的结构后
成功生成
特点
速度会很慢,需要专业软件。
ocr识别会产生无法处理页面,因为“页面捕捉”识别服务发生错误
解决办法
新版的64位Acrobat 2022基本上都报错,原因是安装时没有选择【印前检查】服务。
(1)有安装包的小伙伴直接打开安装包,然后参考(3);
(2)没有安装包的小伙伴进入 控制面板 -> 软件卸载界面,选中Acrobat右键 -> “更改”(不是卸载,是更改!)再进行(3);
(3)选择“安装”,然后“下一步”,在自定义安装界面,把“可选功能”和“印前检查”两项都选中即可,完成安装就能解决问题。