日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python使用python-docx讀寫word文檔

系統 1996 0

python-docx庫可用于創建和編輯Microsoft Word(.docx)文件。

官方文檔:鏈接地址

備注:

doc是微軟的專有的文件格式,docx是Microsoft Office2007之后版本使用,其基于Office Open XML標準的壓縮文件格式,比?doc文件所占用空間更小。docx格式的文件本質上是一個ZIP文件,所以其實也可以把.docx文件直接改成.zip,解壓后,里面的?word/document.xml包含了Word文檔的大部分內容,圖片文件則保存在word/media里面。

python-docx不支持.doc文件,間接解決方法是在代碼里面先把.doc轉為.docx。

一、安裝包

            
pip3 install python-docx
          

二、創建word文檔

下面是在官文示例基礎上對個別地方稍微修改,并加上函數的使用說明

            
from docx import Document
from docx.shared import Inches
 
document = Document()
 
#添加標題,并設置級別,范圍:0 至 9,默認為1
document.add_heading('Document Title', 0)
 
#添加段落,文本可以包含制表符(\t)、換行符(\n)或回車符(\r)等
p = document.add_paragraph('A plain paragraph having some ')
#在段落后面追加文本,并可設置樣式
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True
 
document.add_heading('Heading, level 1', level=1)
document.add_paragraph('Intense quote', style='Intense Quote')
 
#添加項目列表(前面一個小圓點)
document.add_paragraph(
 'first item in unordered list', style='List Bullet'
)
document.add_paragraph('second item in unordered list', style='List Bullet')
 
#添加項目列表(前面數字)
document.add_paragraph('first item in ordered list', style='List Number')
document.add_paragraph('second item in ordered list', style='List Number')
 
#添加圖片
document.add_picture('monty-truth.png', width=Inches(1.25))
 
records = (
 (3, '101', 'Spam'),
 (7, '422', 'Eggs'),
 (4, '631', 'Spam, spam, eggs, and spam')
)
 
#添加表格:一行三列
# 表格樣式參數可選:
# Normal Table
# Table Grid
# Light Shading、 Light Shading Accent 1 至 Light Shading Accent 6
# Light List、Light List Accent 1 至 Light List Accent 6
# Light Grid、Light Grid Accent 1 至 Light Grid Accent 6
# 太多了其它省略...
table = document.add_table(rows=1, cols=3, style='Light Shading Accent 2')
#獲取第一行的單元格列表
hdr_cells = table.rows[0].cells
#下面三行設置上面第一行的三個單元格的文本值
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
for qty, id, desc in records:
 #表格添加行,并返回行所在的單元格列表
 row_cells = table.add_row().cells
 row_cells[0].text = str(qty)
 row_cells[1].text = id
 row_cells[2].text = desc
 
document.add_page_break()
 
#保存.docx文檔
document.save('demo.docx')
          

創建的demo.docx內容如下:

? Python使用python-docx讀寫word文檔_第1張圖片

三、讀取word文檔

            
from docx import Document
 
doc = Document('demo.docx')
 
#每一段的內容
for para in doc.paragraphs:
 print(para.text)
 
#每一段的編號、內容
for i in range(len(doc.paragraphs)):
 print(str(i), doc.paragraphs[i].text)
 
#表格
tbs = doc.tables
for tb in tbs:
 #行
 for row in tb.rows: 
 #列 
 for cell in row.cells:
 print(cell.text)
 #也可以用下面方法
 '''text = ''
 for p in cell.paragraphs:
 text += p.text
 print(text)'''
          

運行結果:

            
Document Title
A plain paragraph having some bold and some italic.
Heading, level 1
Intense quote
first item in unordered list
second item in unordered list
first item in ordered list
second item in ordered list
Document Title
A plain paragraph having some bold and some italic.
Heading, level 1
Intense quote
first item in unordered list
second item in unordered list
first item in ordered list
second item in ordered list
 
 
 
Qty
Id
Desc
101
Spam
422
Eggs
631
Spam, spam, eggs, and spam
[Finished in 0.2s]
          

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 德钦县| 峡江县| 罗平县| 象州县| 从江县| 澄城县| 富裕县| 舒城县| 九寨沟县| 吴江市| 广水市| 名山县| 马龙县| 赣榆县| 玉门市| 青铜峡市| 呼图壁县| 青海省| 普定县| 介休市| 灵寿县| 高清| 通化县| 汽车| 杂多县| 盐亭县| 平塘县| 奈曼旗| 临洮县| 和平区| 新宾| 怀安县| 平乐县| 大渡口区| 诏安县| 阳信县| 梅河口市| 固始县| 昌黎县| 隆回县| 湖北省|