日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python 確定多項式擬合/回歸的階數(shù)

系統(tǒng) 1923 0

通過 1至10 階來擬合對比 均方誤差及R評分,可以確定最優(yōu)的“最大階數(shù)”。

            
              import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression,Perceptron
from sklearn.metrics import mean_squared_error,r2_score
from sklearn.model_selection import train_test_split

X = np.array([-4,-3,-2,-1,0,1,2,3,4,5,6,7,8,9,10]).reshape(-1, 1)
y = np.array(2*(X**4) + X**2 + 9*X + 2)
#y = np.array([300,500,0,-10,0,20,200,300,1000,800,4000,5000,10000,9000,22000]).reshape(-1, 1)

x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
rmses = []
degrees = np.arange(1, 10)
min_rmse, min_deg,score = 1e10, 0 ,0

for deg in degrees:
    # 生成多項式特征集(如根據(jù)degree=3 ,生成 [[x,x**2,x**3]] )
    poly = PolynomialFeatures(degree=deg, include_bias=False)
    x_train_poly = poly.fit_transform(x_train)

    # 多項式擬合
    poly_reg = LinearRegression()
    poly_reg.fit(x_train_poly, y_train)
    #print(poly_reg.coef_,poly_reg.intercept_) #系數(shù)及常數(shù)
    
    # 測試集比較
    x_test_poly = poly.fit_transform(x_test)
    y_test_pred = poly_reg.predict(x_test_poly)
    
    #mean_squared_error(y_true, y_pred) #均方誤差回歸損失,越小越好。
    poly_rmse = np.sqrt(mean_squared_error(y_test, y_test_pred))
    rmses.append(poly_rmse)
    # r2 范圍[0,1],R2越接近1擬合越好。
    r2score = r2_score(y_test, y_test_pred)
    
    # degree交叉驗證
    if min_rmse > poly_rmse:
        min_rmse = poly_rmse
        min_deg = deg
        score = r2score
    print('degree = %s, RMSE = %.2f ,r2_score = %.2f' % (deg, poly_rmse,r2score))
        
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(degrees, rmses)
ax.set_yscale('log')
ax.set_xlabel('Degree')
ax.set_ylabel('RMSE')
ax.set_title('Best degree = %s, RMSE = %.2f, r2_score = %.2f' %(min_deg, min_rmse,score))  
plt.show()
            
          

?

Python 確定多項式擬合/回歸的階數(shù)_第1張圖片

Python 確定多項式擬合/回歸的階數(shù)_第2張圖片

因為因變量?Y = 2*(X**4) + X**2 + 9*X + 2 ,自變量和因變量是完整的公式,看圖很明顯,degree >=4 的都符合,擬合函數(shù)都正確。 (RMSE 最小,R平方非負(fù)且接近于1,則模型最好)

如果將 Y 值改為如下:

            y = np.array([300,500,0,-10,0,20,200,300,1000,800,4000,5000,10000,9000,22000]).reshape(-1, 1)
          

Python 確定多項式擬合/回歸的階數(shù)_第3張圖片

Python 確定多項式擬合/回歸的階數(shù)_第4張圖片

degree=3 是最好的,且 r 平方也最接近于1(注意:如果 R 平方為負(fù)數(shù),則不準(zhǔn)確,需再次測試。因樣本數(shù)據(jù)較少,可能也會判斷錯誤)。

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 金堂县| 广东省| 开鲁县| 辽中县| 广宗县| 尚志市| 襄樊市| 安岳县| 伊宁县| 九台市| 镇雄县| 云安县| 密云县| 商水县| 永修县| 班玛县| 岢岚县| 建湖县| 阜南县| 昭苏县| 交城县| 芮城县| 阿图什市| 阜阳市| 弥勒县| 历史| 海阳市| 德格县| 梓潼县| 六盘水市| 桂东县| 城步| 出国| 沙坪坝区| 和龙市| 新密市| 海口市| 曲靖市| 濉溪县| 务川| 上饶县|