日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

機器學習-CART決策樹

系統(tǒng) 2471 0

? 之前泛泛看了下了Random Forest和決策樹,現(xiàn)在落實到一個具體決策樹算法:CART(Classification and Regression Tree)。

? CART是1984年由Breiman, Friedman, Olshen, Stone提出的一個決策樹算法,雖然不是第一個機器學習領(lǐng)域的決策樹,但卻是第一個有著復(fù)雜的統(tǒng)計學和概率論理論保證的決策樹(這些話太學術(shù)了,引自參考文獻[2])。

? CART是一個二叉決策樹,亦即決策樹的每個內(nèi)部節(jié)點(決策節(jié)點)最多有兩個分支。因為之前有 博文 介紹過ID3和C4.5算法,所以這里只從確定最佳分裂屬性和剪枝兩方面介紹CART。

? 1. 確定最佳分裂屬性(和最佳分裂點)

? 我們這里只考慮連續(xù)值的情況。對于每個輸入屬性的每個可能的分裂點(分裂點即相鄰兩個連續(xù)值的中點),我們計算每個劃分 Gini指標 ,然后對該分裂點的兩個劃分的Gini指標求加權(quán)和。我們選取Gini指標最小的那個輸入屬性的分裂點進行劃分。

? 按照以上規(guī)則生成一個完全增長的決策樹,不需要任何停止條件。

? 2. 剪枝

? 因為上一步生成的決策樹是沒有停止條件的,所以這個決策樹可能會非常大,對訓練數(shù)據(jù)很可能會過度擬合,所以需要對決策樹進行后剪枝。

? CART算法采用的是 Cost-Complexy剪枝 :

? 我們用 來衡量一棵子樹的代價復(fù)雜度。其中R(T)代表將這個子樹替換為葉子節(jié)點后所帶來的誤差的增加,number-of-leaves為子樹T的葉子節(jié)點的個數(shù),α不是一個常數(shù),而是一個從0開始增大到無窮大的數(shù)。對于決策樹T,我們在α不是一個常數(shù),而是一個從0開始增大到無窮大的數(shù)。逐步增加的過程中,每次選擇使Rα最小的子樹,并將之替換為一個葉子節(jié)點,對替換后的樹迭代執(zhí)行以上步驟。

? 上述過程可能略顯復(fù)雜,我們可以用另外一個等價的剪枝方法來得到相同的結(jié)果: Weakest-Link-Pruning

? (1)對于所有的子樹STi,我們試圖用合適的葉子節(jié)點來代替STi,然后計算增加的誤差E與STi的葉子節(jié)點的比值。我們選擇比值最小的那個子樹STj,用合適的葉子節(jié)點代替之。

? (2)重復(fù)迭代以上步驟,每次都替換掉一棵子樹。我們會得到從完全增長的樹T0到只有根節(jié)點一個決策節(jié)點的樹Tn的一系列決策樹:T0,T1,.....Tn。然后我們用獨立的驗證集(我們可以從可用數(shù)據(jù)集中抽取三分之一作為驗證集,剩下的三分之二作為訓練集)來驗證各個決策樹的分類準確性。選取準確性最高的決策樹為最終的CART決策樹。

參考文獻:

[1] CART算法學習及實現(xiàn)

[2] 機器學習十大算法:CART

[3] Complexity-Based Evaluation Of Rule-Based Expert Systems

?

機器學習-CART決策樹


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!??!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 盐津县| 丰县| 河津市| 交城县| 达州市| 澄江县| 永昌县| 庐江县| 义马市| 中方县| 会东县| 郁南县| 荆门市| 潢川县| 海宁市| 黑龙江省| 娱乐| 嘉义市| 石渠县| 故城县| 恩平市| 和静县| 南康市| 白银市| 通州市| 高安市| 聂拉木县| 黑龙江省| 玉山县| 刚察县| 介休市| 无为县| 南汇区| 临江市| 绥宁县| 定安县| 星子县| 分宜县| 琼中| 河曲县| 迁安市|