日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python3-操作excle(xlrd&xlwt&xlutils和

系統(tǒng) 2282 0

一,前言

入職數(shù)據(jù)分析以后,肯定要涉及到python處理excle,特別是涉及到對excle的一些重復(fù)操作時,也許能提升一些效率;因此,有必要對python操作excle進(jìn)行學(xué)習(xí)。

現(xiàn)有操作excle的工具包有很多,例如 xlrd&xlwt&xlutils 以及強(qiáng)大的 pandas ,此外還有別的工具包,但受限于平臺或者安裝方式,都沒有以上兩種常用。(其中,pandas不僅是用來操作excle,而是一整套強(qiáng)大的工具包。)

知乎有一篇文章些不同python包操作excle的對比,其中有些內(nèi)容不太準(zhǔn)確,需要自己驗證。(知乎鏈接:https://zhuanlan.zhihu.com/p/23998083)

下面對不同模塊對excle進(jìn)行操作的基本方法進(jìn)行解釋和練習(xí),更高級復(fù)雜的操作還需要日后繼續(xù)深入學(xué)習(xí)打磨。

二,xlrd,xlwt讀寫excle

下面是一個讀excle的例子:

            
              # -*- coding: utf-8 -*-
"""
Created on Tue Jul 30 17:27:40 2019

@author: chao
"""
import xlrd
import sys
f1 = xlrd.open_workbook(r'C:\Users\chao\Desktop\dataana.xlsx')#打開的這個excel必須存在,否則會報錯
filename = sys.argv[0] #獲取文件全路徑
print('opening the file:'+str(filename)) 
#獲取所有sheet頁的名字
print('all sheets:'+str(f1.sheet_names()))
#按名字查找第二張表單
# sheet=wb.sheet_by_name('abc2')#根據(jù)sheet頁的名字獲取sheet頁
sheet = f1.sheet_by_index(0)#根據(jù)sheet頁的索引獲取sheet頁
#獲取sheet頁的行數(shù)和列數(shù)
print('num of rows:'+str(sheet.nrows))
print('num of columns:'+str(sheet.ncols))

for rownum in range(sheet.nrows):  #循環(huán)取每行的數(shù)據(jù)

    print(sheet.row_values(rownum))#取每行的數(shù)據(jù)

    #按照索引打印對應(yīng)單元格內(nèi)容
    #cell_location_value=sheet.cell(0,0).value #獲取指定單元格的值,第一個值是列,第二個值是行
    #print(cell_location_value)
            
          

下面是一個寫excle的例子:

            
              # -*- coding: utf-8 -*-
"""
Created on Tue Jul 30 17:37:55 2019

@author: chao
"""
import xlwt
title = ['姓名','年齡','性別','分?jǐn)?shù)']
stus = [['mary',20,'女',89.9],['rmay',21,'女',89.9],['amry',22,'女',89.9],['yram',23,'女',89.9]]
#新建一個excel對象
f1 = xlwt.Workbook()
#添加一個名為sheet1課程表的sheet頁
sheet = f1.add_sheet('sheet1')
for i in  range(len(title)):#寫入表頭
    sheet.write(0,i,title[i])#寫入每行,第一個值是行,第二個值是列,第三個是寫入的值
for i in range(len(stus)):
    if i !=0:#如果不是表頭的話
        for j in range(4):
            sheet.write(i,j,stus[i][j])#循環(huán)寫入每行數(shù)據(jù)
 #保存‘test1.xls’文件
f1.save(r'C:\Users\chao\Desktop\test1.xls')#保存xlsx后,會顯示文件損壞打不開
            
          

xlwt無法完成對已有文件的追加或修改,因此需要下面的xlutils對已有文件進(jìn)行操作。

三,xlutils修改excle

xlutils實質(zhì)上仍然需要xlrd和xlwt來完成操作,例子如下:

            
              # -*- coding: utf-8 -*-
"""
Created on Tue Jul 30 17:37:55 2019

@author: chao
"""
#import xlwt
import xlrd
from xlutils.copy import copy
f1 = xlrd.open_workbook(r'C:\Users\chao\Desktop\dataana.xlsx')
# 復(fù)制為新的xlsx
wt_f1 = copy(f1)
# 修改新的xls
wt_sheet = wt_f1.get_sheet(0)
wt_sheet.write(24,1,'追加內(nèi)容')
# 保存修改
wt_f1.save(r'C:\Users\chao\Desktop\dataana_copy.xls')
            
          

四,pandas創(chuàng)建,讀寫excle

先嘗試創(chuàng)建一個空xlsx:

            
              # -*- coding: utf-8 -*-
"""
Created on Tue Jul 30 19:39:51 2019

@author: chao
"""


import pandas as pd
 
 
# 構(gòu)建數(shù)據(jù)
df=pd.DataFrame()#構(gòu)造原始數(shù)據(jù)文件

# 保存文件
df.to_excel(r'C:\Users\chao\Desktop\pandas_test1.xlsx')
            
          

代碼運行后能成功保存文件并且可以打開,說明pandas是支持新版本的excle的。

創(chuàng)建指定內(nèi)容的excle文件:

            
              import pandas as pd
df=pd.DataFrame({'ID':[1,2,3],'Name':['XiaoMing','XiaoHong','XiaoLan']})
df=df.set_index('ID') #指定索引為ID
df.to_excel(r'C:\Users\chao\Desktop\pandas_test1.xlsx')

            
          

注意,如果不指定索引,pandas會在左側(cè)自動添加一列索引。

pandas讀取excle:

            
              df=pd.read_excel(r'C:\Users\chao\Desktop\dataana.xlsx',sheet_name='Sheet1')
#sheet_name用來指定讀取的sheet,省略時默認(rèn)讀取第一個sheet
data=df.head()#默認(rèn)讀取前5行的數(shù)據(jù)
print("read lines:\n{0}".format(data))#格式化輸出
#{}效力等同%
            
          

打印出來,會發(fā)現(xiàn),pandas讀取數(shù)據(jù)時也會自動加上索引:

Python3-操作excle(xlrd&xlwt&xlutils和pandas)_第1張圖片

讀取指定行列:

            
              # -*- coding: utf-8 -*-
"""
Created on Tue Jul 30 19:39:51 2019

@author: chao
"""
import pandas as pd
df=pd.read_excel(r'C:\Users\chao\Desktop\dataana.xlsx',sheet_name='Sheet1')
data=df.loc[1:3]['Age']
print("read lines:\n{0}".format(data))
            
          

注意,網(wǎng)上關(guān)于pandas很多教程有點老了,新的pandas已經(jīng)棄用了ix,現(xiàn)在用iloc和loc。

修改指定行列并保存:

            
              # -*- coding: utf-8 -*-
"""
Created on Tue Jul 30 19:39:51 2019

@author: chao
"""
import pandas as pd
df=pd.read_excel(r'C:\Users\chao\Desktop\dataana.xlsx',sheet_name='Sheet1')
df.loc[22,'Age']=18.888
df=df.set_index('Name')
print("read lines:\n{0}".format(df))
pd.DataFrame(df).to_excel(r'C:\Users\chao\Desktop\pandas_test1.xlsx', sheet_name='Sheet1')
            
          

保存結(jié)果:

Python3-操作excle(xlrd&xlwt&xlutils和pandas)_第2張圖片

由上述結(jié)果可知,pandas能夠?qū)π掳姹镜膃xcle進(jìn)行支持,而xlrd&xlwt&xlutils并不支持xlsx。而xlrd&xlwt&xlutils在有些博客的實驗里,讀取速度比pandas更快,而后續(xù)需要對數(shù)據(jù)進(jìn)行分析的話,還是采用pandas是比較好的。

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 大同市| 梓潼县| 通化县| 青河县| 象州县| 江油市| 门头沟区| 罗甸县| 措勤县| 芜湖县| 策勒县| 东城区| 随州市| 二连浩特市| 屯门区| 合川市| 石家庄市| 黄骅市| 威远县| 满洲里市| 海安县| 卢龙县| 湟中县| 星座| 射洪县| 通江县| 吉隆县| 天镇县| 横峰县| 股票| 兴文县| 巴塘县| 探索| 东辽县| 教育| 北票市| 哈尔滨市| 文山县| 景德镇市| 桐城市| 大足县|