日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python學習——數據分析

系統 1700 0

目錄:

  1.數據分析模塊

  2.數據文件導入

  3.圖形繪制

  4.讀取數據并可視化分析

?

1.數據分析模塊

            
              import
            
            
               numpy as nn

            
            
              #
            
            
              一維數組numpy.array([元素1,元素2....,元素n])
            
            
x = nn.array([
            
              '
            
            
              2
            
            
              '
            
            ,
            
              '
            
            
              3
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            ,
            
              '
            
            
              g
            
            
              '
            
            
              ])

            
            
              #
            
            
               print(x)
            
            
              #
            
            
              創建二維數組格式numpy.array([[元素1],[元素2]....,[元素n]])
            
            
y = nn.array([[2,3,4],[4,3,4,],[34,4,2
            
              ,]])

            
            
              #
            
            
               print(y)
            
            
              #
            
            
              排序sort()
            
            
              
#
            
            
               x.sort()
            
            
              
#
            
            
               print(x)
            
            
              
#
            
            
               y.sort()
            
            
              
#
            
            
               print(y)
            
            
              #
            
            
              取最大值和最小值
            
            
              
#
            
            
               y1 = y.min()
            
            
              
#
            
            
               print(y1)
            
            
              #
            
            
              切片:數組[起始下標:最終下表+1]
            
            
x1 = x[1:3
            
              ]
x2 
            
            = x[:2
            
              ]
x3 
            
            = x[1
            
              :]

            
            
              print
            
            
              (x1,x2,x3)


            
            
              import
            
            
               pandas as pda

            
            
              #
            
            
               Series #indes 索引
            
            
              
#
            
            
               a = pda.Series([8,9,2,1])
            
            
b = pda.Series([8,9,2,1],index=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])

            
            
              print
            
            
              (s)


c 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74
            
              ]])

指定列名
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])


e 
            
            =
            
               pda.DataFrame({
    
            
            
              '
            
            
              a
            
            
              '
            
            :2
            
              ,
    
            
            
              '
            
            
              b
            
            
              '
            
            :[6,4,7
            
              ],
    
            
            
              '
            
            
              c
            
            
              '
            
            :list(str(919
            
              ))
})

head()調取頭部數據,默認5行
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
e 
            
            = d.head(2
            
              )

            
            
              print
            
            
              (e)
tail()調取尾部收據,默認5行
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
f 
            
            = d.tail(2
            
              )

            
            
              print
            
            
              (f)
desctibe()統計數據基本情況count元素個數、mean平均數、std標準差、
min列中所有數據中最小值、百分數每一列的分位數、max列中最大值
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
g 
            
            =
            
               d.describe()

            
            
              print
            
            
              (g)

數據轉置(行列互換)
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
d1 
            
            =
            
               d.T

            
            
              print
            
            (d1)
          

?

2.數據文件導入

            
              import
            
            
               pandas as pd

導入csv文件
i 
            
            = pd.read_csv(
            
              '
            
            
              文件路徑
            
            
              '
            
            
              )

            
            
              #
            
            
               按照某一列排序
            
            
i.sort_values(by=
            
              '
            
            
              列名
            
            
              '
            
            
              )

導入excel文件
j 
            
            = pd.read_excel(
            
              '
            
            
              C:/Users/BLX/Desktop/123.xls
            
            
              '
            
            
              )

            
            
              print
            
            
              (j)

導入mysql數據庫中的數據

            
            
              import
            
            
               pymysql
conn 
            
            = pymysql.connect(host=
            
              '
            
            
              127.0.0.1
            
            
              '
            
            ,user=
            
              '
            
            
              root
            
            
              '
            
            ,passwd=
            
              '
            
            
              root
            
            
              '
            
            ,db=
            
              '
            
            
              hexun
            
            
              '
            
            
              )
sql 
            
            = 
            
              '
            
            
              select * from myhexun
            
            
              '
            
            
              #
            
            
              查詢語句
            
            
k =
            
               pd.read_sql(sql,conn)

導入html數據
pd.read_html(
            
            
              '
            
            
              網頁源碼路徑
            
            
              '
            
            
              )

導入文本數據
pd.read_table(
            
            
              '
            
            
              路徑
            
            
              '
            
            )
          

?

3.圖形繪制

            
              import
            
            
               matplotlib.pylab as pyl

            
            
              import
            
            
               numpy as npy

散點圖
            
            /
            
              折線圖plot
x 
            
            = [1,2,3,4,8
            
              ]
y 
            
            = [5,7,2,1,5
            
              ]
折線圖
pyl.plot(x,y)
            
            
              #
            
            
              plot(x軸數據,y軸數據,展現形式(可有可無))
            
            
              pyl.show()

散點圖
pyl.plot(x,y,
            
            
              '
            
            
              o
            
            
              '
            
            
              )
pyl.show()

顏色

            
            
              '''
            
            
              
c-cyan-青色
r-red-紅色
m-magenta-品紅
g-green-綠色
b-blue-藍色
y-yellow-黃色
k-black-黑色
w-white-白色

            
            
              '''
            
            
              
pyl.plot(x,y,
            
            
              '
            
            
              oc
            
            
              '
            
            
              )

線條樣式

            
            
              '''
            
            
              
-直線
--虛線
-.點直線
:細小虛線

            
            
              '''
            
            
              
pyl.plot(x,y,
            
            
              '
            
            
              -.
            
            
              '
            
            
              )

點的樣式

            
            
              '''
            
            
              
s方形
h六角形
H六角形
*星形
+加好形
x叉形
d菱形
D菱形
p五角形

            
            
              '''
            
            
              
pyl.plot(x,y,
            
            
              '
            
            
              p
            
            
              '
            
            
              )
pyl.show()

標題
pyl.plot(x,y)
x2 
            
            = [1,2,3,5,6,9
            
              ]
y2 
            
            = [3,1,5,6,4,2
            
              ]
pyl.plot(x2,y2)
pyl.title(
            
            
              '
            
            
              show
            
            
              '
            
            )
            
              #
            
            
              主標題
            
            
pyl.xlabel(
            
              '
            
            
              ages
            
            
              '
            
            )
            
              #
            
            
              x軸標題
            
            
pyl.ylabel(
            
              '
            
            
              temp
            
            
              '
            
            )
            
              #
            
            
              y軸標題
            
            
pyl.xlim(0,10)
            
              #
            
            
              x軸范圍
            
            
pyl.ylim(0.10)
            
              #
            
            
              y軸范圍
            
            
              pyl.show()


隨機數的生成
data 
            
            = npy.random.random_integers(1,20,10) 
            
              #
            
            
              (最小值,最大值,個數)生成10個1-20之間的隨機數
            
            
data2 = npy.random.normal(5.0,2.0,10) 
            
              #
            
            
              (平均數,西格瑪,個數)正態分布隨機數
            
            
正態分布隨機數,參考網址:www.mamicode.com/info-detail-507676
            
              .html

直方圖hist
data3 
            
            = npy.random.normal(10.0,1.0,1000
            
              )
pyl.hist(data3)
pyl.show()

data4 
            
            = npy.random.random_integers(1,25,100
            
              )
pyl.hist(data4)
pyl.show()

設置直方圖的組距、輪廓
data4 
            
            = npy.random.random_integers(1,25,100
            
              )
sty 
            
            = npy.arange(2,17,2)
            
              #
            
            
              (起始,結束,每條直方圖取值間隔)
            
            
pyl.hist(data4,sty,histtype=
            
              '
            
            
              stepfilled
            
            
              '
            
            ) 
            
              #
            
            
              histtype內參數取消圖形輪廓
            
            
              pyl.show()

子圖繪制:各區域內分別寫內容
data4 
            
            = npy.random.random_integers(1,25,100
            
              )

            
            
              #
            
            
               區域1
            
            
pyl.subplot(2,2,1)
            
              #
            
            
               拆分n行,拆分n列,當前繪制區域
            
            
x1 = [1,2,3,4,5
            
              ]
y1 
            
            = [5,2,5,8,9
            
              ]
pyl.plot(x1,y1)

區域2
pyl.subplot(
            
            2,2,2
            
              )
x2 
            
            = [1,2,3,4,5
            
              ]
y2 
            
            = [5,2,5,8,9
            
              ]
pyl.plot(x2,y2)

區域3
pyl.subplot(
            
            2,1,2)
            
              #
            
            
               拆分為2行1列的第二個位置
            
            
x3 = [1,2,3,4,5,6,7,8
            
              ]
y3 
            
            = [5,2,5,8,9,3,5,8
            
              ]
pyl.plot(x3,y3)

pyl.show()
            
          

?

4.讀取數據并可視化分析

            
              import
            
            
               pandas as pd

            
            
              import
            
            
               numpy as np

            
            
              import
            
            
               matplotlib.pylab as mp

data 
            
            = pd.read_csv(
            
              '
            
            
              E:/python/123.csv
            
            
              '
            
            
              )

            
            
              #
            
            
               data.shape()#返回(行數,列數)
            
            
data2 =
            
               data.T
x1 
            
            = data2.values[1] 
            
              #
            
            
               取[第幾行][第幾列]的數據
            
            
y1 = data2.values[2
            
              ]
mp.plot(x1,y1)
mp.show()
            
          

?


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 阿拉善右旗| 和静县| 永春县| 额尔古纳市| 乾安县| 新平| 砀山县| 库车县| 姚安县| 元朗区| 收藏| 屯留县| 额敏县| 米泉市| 名山县| 明水县| 建昌县| 贵州省| 大连市| 东乡| 横峰县| 永济市| 浦北县| 宁海县| 吐鲁番市| 泸州市| 桦甸市| 肥西县| 长丰县| 利辛县| 隆安县| 康保县| 华安县| 富阳市| 綦江县| 新津县| 鱼台县| 修武县| 成都市| 沛县| 普陀区|