日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python 讀取PDF文件

系統 1823 0

首先需要安裝 pdfminer3k? 庫:

            
              pip install pdfminer3k
            
          

Python 讀取PDF文件_第1張圖片

            
              from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfpage import PDFTextExtractionNotAllowed
from pdfminer.pdfinterp import PDFResourceManager
from pdfminer.pdfinterp import PDFPageInterpreter
from pdfminer.pdfdevice import PDFDevice
from pdfminer.layout import *
from pdfminer.converter import PDFPageAggregator


path = r"C:\Users\Administrator\Desktop\a.pdf"
toPath = r"C:\Users\Administrator\Desktop\a.txt"

def Pdf2Txt(Path,Save_name):
    #來創建一個pdf文檔分析器
    parser = PDFParser(Path)
    #創建一個PDF文檔對象存儲文檔結構
    document = PDFDocument(parser)
    # 檢查文件是否允許文本提取
    if not document.is_extractable:
        raise PDFTextExtractionNotAllowed
    else:
        # 創建一個PDF資源管理器對象來存儲共賞資源
        rsrcmgr=PDFResourceManager()
        # 設定參數進行分析
        laparams=LAParams()
        # 創建一個PDF設備對象
        # device=PDFDevice(rsrcmgr)
        device=PDFPageAggregator(rsrcmgr,laparams=laparams)
        # 創建一個PDF解釋器對象
        interpreter=PDFPageInterpreter(rsrcmgr,device)
        # 處理每一頁
        for page in PDFPage.create_pages(document):
            interpreter.process_page(page)
            # 接受該頁面的LTPage對象
            layout=device.get_result()
            for x in layout:
                if(isinstance(x,LTTextBoxHorizontal)):
                    with open('%s'%(Save_name),'a') as f:
                        f.write(x.get_text()+'\n')

Path = open(path, 'rb')
Pdf2Txt(Path, toPath)
            
          

?


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 京山县| 杭锦后旗| 象州县| 旬阳县| 铜陵市| 巫山县| 中宁县| 吴桥县| 玉龙| 武城县| 休宁县| 城市| 亚东县| 贵定县| 建宁县| 东宁县| 北安市| 尼勒克县| 白玉县| 赤城县| 雅江县| 海兴县| 濉溪县| 高唐县| 昭平县| 景谷| 扎赉特旗| 五大连池市| 焦作市| 泸西县| 伊宁市| 泰顺县| 沾化县| 长兴县| 探索| 合水县| 礼泉县| 巴中市| 加查县| 东明县| 虎林市|