散點(diǎn)圖
散點(diǎn)圖顯示兩組數(shù)據(jù)的值,如圖1-1所示。每個(gè)點(diǎn)的坐標(biāo)位置由變量的值決定,并由一組不連接的點(diǎn)完成,用于觀察兩種變量的相關(guān)性。例如,身高—體重、溫度—維度。
圖1-1 散點(diǎn)圖示例
使用Matplotlib的scatter()函數(shù)繪制散點(diǎn)圖,其中x和y是相同長(zhǎng)度的數(shù)組序列。scatter()函數(shù)的一般用法為:
主要參數(shù)說明如下:
? ?x,y:數(shù)組。?
? ?s:散點(diǎn)圖中點(diǎn)的大小,可選。?
?? c:散點(diǎn)圖中點(diǎn)的顏色,可選。?
? ?marker:散點(diǎn)圖的形狀,可選。?
? ? alpha:表示透明度,在 0~1 取值,可選。?
?? linewidths:表示線條粗細(xì),可選。
示例: 繪制身高—體重的散點(diǎn)圖
運(yùn)行腳本輸出如圖1-2所示的圖形。
圖1-2 基本的散點(diǎn)圖
散點(diǎn)圖主要演示兩個(gè)變量的相關(guān)性:正相關(guān)、負(fù)相關(guān)、不相關(guān)。
示例:
顯示y=2x+1的圖形
Matplotlib中最基礎(chǔ)的模塊是Pyplot, 下面從最簡(jiǎn)單的線圖開始講解。例如,有一組數(shù)據(jù),還有一個(gè)擬合模型,通過編寫代碼來實(shí)現(xiàn)數(shù)據(jù)與模型結(jié)果的可視化。?
假設(shè)一個(gè)線性函數(shù)具有形式y(tǒng)=ax+b, 自變量是x,因變量是y,y軸截距為b,斜率為a。 ?
下面用簡(jiǎn)單的數(shù)據(jù)來描述線性方程y=2x+1,代碼如下:
運(yùn)行腳本輸出如圖2-2所示的圖形。
圖2-2?基本直線圖
在圖2-2中,使用線性方程y=2x+1畫出的是直線圖。如果想畫出曲線圖,則只需更改線性方程為
,完整代碼如下:
運(yùn)行腳本輸出如圖2-3所示的圖形。
圖2-3 曲線圖
3
直方圖
直方圖由一系列高度不等的縱向條形組成,表示數(shù)據(jù)分布的情況。例如,某年級(jí)學(xué)生的身高分布情況,如圖4-1所示。
圖4-1?直方圖
直方圖與柱狀圖的區(qū)別有以下幾點(diǎn):
(1)柱狀圖是用條形的長(zhǎng)度表示各類別頻數(shù)的多少,其寬度(表示類別)是固定的,主要是展示不同類別的數(shù)據(jù)。?
(2)直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù) ( 或頻率 ),寬度則表示各組的組距,因此其高度與寬度均有意義。 ?
(3)由于分組數(shù)據(jù)具有連續(xù)性,因此直方圖的各矩形通常是連續(xù)排列,而柱狀圖則是分開排列。 ?
(4)柱狀圖主要用于展示分類型數(shù)據(jù),而直方圖主要用于展示數(shù)據(jù)型數(shù)據(jù)。 ?
使用Matplotlib的hist()函數(shù)繪制直方圖,hist()函數(shù)的一般用法為:
主要參數(shù)說明如下:
? ?bins:直方圖中箱子 (bin) 的總個(gè)數(shù)。個(gè)數(shù)越多,條形帶越緊密。?
? ?color:箱子的顏色。?
? ?normed:對(duì)數(shù)據(jù)進(jìn)行正則化。決定直方圖y軸的取值是某個(gè)箱子中的元素的個(gè)數(shù)?(normed=False), 還是某個(gè)箱子中的元素的個(gè)數(shù)占總體的百分比 (normed=True)。?
在介紹直方圖之前,先來了解什么是正太分布。
正態(tài)分布也稱常態(tài)分布,是連續(xù)隨機(jī)變量概率分布的一種,自然界、人類社會(huì)、心理和教育中的大量現(xiàn)象均按正態(tài)形式分布。 例如,能力的高低、學(xué)生成績(jī)的好壞等都屬于正態(tài)分布。 正態(tài)分布曲線呈鐘形,兩頭低,中間高,左右對(duì)稱。 因其曲線呈鐘形,所以人們又經(jīng)常稱之為鐘形曲線,如圖4-2所示。
圖4-2 正態(tài)分布的鐘形曲線
正態(tài)分布有兩個(gè)參數(shù),即均值和標(biāo)準(zhǔn)差。均值是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢(shì)位置。概率規(guī)律為:取與均值越近的值的概率越大,而取離均值越遠(yuǎn)的值的概率越小。?
標(biāo)準(zhǔn)差描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,標(biāo)準(zhǔn)差越大,數(shù)據(jù)分布越分散;標(biāo)準(zhǔn)差越小,數(shù)據(jù)分布越集中。標(biāo)準(zhǔn)差也是正態(tài)分布的形狀參數(shù),標(biāo)準(zhǔn)差越大,曲線越扁平;反之,標(biāo)準(zhǔn)差越小,曲線越瘦高。?
繪制直方圖,需要使用NumPy的np.random.randn(N)函數(shù),這個(gè)函數(shù)的作用就是從標(biāo)準(zhǔn)正態(tài)分布中返回N個(gè)樣本值。 ?
示例: 直方圖
?
本例文件名為
“PythonFullStackChapter07mpl_hist01”
顯示直方圖。其完整代碼如下:
運(yùn)行腳本輸出如圖4-3所示的圖形。
圖4-3?直方圖?
本文摘自《 Python 3.x全棧開發(fā)從入門到精通 》
▼
Python3.x全棧開發(fā)圣經(jīng)
推薦書籍:
Python3.x入門經(jīng)典書
活動(dòng)參與方式:暢所欲言,在留言區(qū)聊聊“ Python ? ”點(diǎn)贊數(shù)最高前 3 名 將贈(zèng)送 《Python 3.x全棧開發(fā)從入門到精通》、 《Python3.x: 基礎(chǔ)教程》任選紙書一本,共送出 3 本。
活動(dòng)時(shí)間: 即日起截止 8月16日 中午12:00
中獎(jiǎng)?lì)I(lǐng)取方式: 點(diǎn)贊數(shù)多的前 3 名,小編會(huì)私信各位詳細(xì)地址來給您寄送紙書
#急于購(gòu)書的朋友也可以? 點(diǎn)擊閱讀原文 直接購(gòu)買? #
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
