日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python使用Pandas對csv文件進(jìn)行數(shù)據(jù)處理的方法

系統(tǒng) 1698 0

今天接到一個新的任務(wù),要對一個140多M的csv文件進(jìn)行數(shù)據(jù)處理,總共有170多萬行,嘗試了導(dǎo)入本地的MySQL數(shù)據(jù)庫進(jìn)行查詢,結(jié)果用Navicat導(dǎo)入直接卡死....估計是XAMPP套裝里面全默認(rèn)配置的MySQL性能不給力,又嘗試用R搞一下吧結(jié)果發(fā)現(xiàn)光加載csv文件就要3分鐘左右的時間,相當(dāng)不給力啊,翻了翻萬能的知乎發(fā)現(xiàn)了Python下的一個神器包:Pandas(熊貓們?),加載這個140多M的csv文件兩秒鐘就搞定,后面的分類匯總等操作也都是秒開,太牛逼了!記錄一下這次數(shù)據(jù)處理的過程:

使用Python3.6.4環(huán)境(對中文支持比較好),安裝Pandas包

pip install pandas

基本使用:

            
import pandas as pd
import numpy as np #進(jìn)行具體的sum,count等計算時候要用到的
df=pd.read_csv('d:/snp/nh23.csv') #這里絕對路徑一定要用/,windows下也是如此,不加參數(shù)默認(rèn)csv文件首行為標(biāo)題行
df.head() #查看引入的csv文件前5行數(shù)據(jù)
df[“播種面積”] #查看指定列,后面跟[:5]查看前5行數(shù)據(jù)
          

Python使用Pandas對csv文件進(jìn)行數(shù)據(jù)處理的方法_第1張圖片

df[“調(diào)查對象代碼”].str[:6] #獲取指定列前6位字符串

df["ADDR"]=df["調(diào)查對象代碼"].str[:6] #將上一行處理后的6位地址碼作為新列ADDR插入

Python使用Pandas對csv文件進(jìn)行數(shù)據(jù)處理的方法_第2張圖片

gp=df.groupby(["ADDR","代碼"])["播種面積"].sum() #根據(jù)ADDR和代碼進(jìn)行分組后對播種面積列進(jìn)行sum求和計算

Python使用Pandas對csv文件進(jìn)行數(shù)據(jù)處理的方法_第3張圖片

            
pv=df.pivot_table(["播種面積"],index="ADDR",columns="代碼",margins=True,aggfunc=np.sum,fill_value=0) #數(shù)據(jù)透視圖,對播種面積列進(jìn)行匯總計算,index為行,columns為列,margins=True增加一個全部行匯總,aggfunc=np.sum透視圖中對播種面積值進(jìn)行sum計算,這里np是開頭import的numpy as np,fill_value=0對空值進(jìn)行0替換,否則沒有數(shù)據(jù)會顯示NaN
          

Python使用Pandas對csv文件進(jìn)行數(shù)據(jù)處理的方法_第4張圖片

            
pv.to_csv("d:/snp/test.csv") #寫入csv文件
          

總結(jié)

以上所述是小編給大家介紹的Python使用Pandas對csv文件進(jìn)行數(shù)據(jù)處理的方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 武清区| 洛宁县| 鄂托克前旗| 南开区| 辰溪县| 姚安县| 苗栗市| 佛坪县| 邳州市| 北京市| 静乐县| 九龙城区| 伽师县| 施甸县| 平潭县| 满洲里市| 堆龙德庆县| 萨嘎县| 筠连县| 淮安市| 高台县| 大连市| 油尖旺区| 嘉鱼县| 融水| 仙居县| 福贡县| 迁安市| 肥城市| 来凤县| 鄂州市| 延川县| 浪卡子县| 泸溪县| 新乡市| 麻城市| 瑞安市| 开原市| 城固县| 利津县| 长治县|