Read DRM info from docx

本文介绍如何利用Python对docx文件进行深度解析,特别是关注于提取文档中的DRM(数字版权管理)信息。通过示例代码,详细讲解了数据处理和清洗的步骤,帮助读者掌握这一实用技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# Use win32com package or docx package
# we use docx here
import win32com

import docx
from docx import Document

# 0. setting
WorkPath = 'D:/Script/DRM/'
File = 'DRM.docx'
FilePath=WorkPath+File
# 1.
def MatchStrList(StrChecked,StrKeyword):
    LenResult=min(len(StrChecked),len(StrKeyword))
    for i in range(min(len(StrChecked),len(StrKeyword))):
        LenResult=LenResult*len(re.findall(StrKeyword[i],StrChecked[i]))
        #should not contain space in StrKeyword cause the regular expression only pick up \s as space
        #if one of Strlist is null, return 0
        #if one of index is not match also return 0
    return LenResult
def ReadDocxFile(FilePath):
    try:
        DocxFile = docx.Document(FilePath)
    except IOexception as e:
        return e
    DRM={}
    Layers={}
    for p in DocxFile.paragraphs:
        if ((len(p.text)>0)& (MatchStrList([p.text],['Manual&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值