決策樹是一種通過樹形結構進行分類的人工智能預測模型,如根據(jù)圖1所示“氣象特點與游客是否來游樂場的關系”繪制的如圖2所示的決策樹樹形結構:
通過了解當天的是否有風、天氣、溫度和濕度這4個節(jié)點參數(shù)即可預測當天是否有人來游樂場。
不同的節(jié)點劃分順序可以繪制不同的決策樹,為了選出最優(yōu)的節(jié)點劃分順序,需要采用“信息熵”與“信息增益”指標。
信息熵,又稱香農熵,被用來度量信息量的大小,信息熵越大表示信息量越大。
信息增益,表示樣本經(jīng)某節(jié)點劃分后的信息熵變化大小。我們繪制決策樹時應當逐次選擇信息增益最大的節(jié)點作為當前節(jié)點。
對于有n個信息的樣本D,記第k個信息發(fā)生的概率為pk,信息熵計算公式為E(D)=?∑n1pklog2(pk),
例如游樂場14個樣本中“去”(9個)、“不去”(5個),則信息熵=?(914log2914+514log2514)=0.940
若樣本按“是否有風”節(jié)點劃分,“是”(6個,其中3個去,3個不去)信息熵=?(36log236+36log236)=1;
“否”(8個,其中6個去,2個不去)信息熵=?(68log268+28log228)=0.811;經(jīng)過此節(jié)點劃分后的信息增益=原始信息熵?按此節(jié)點劃分后樣本信息熵比例和=0.940?(614×1+814×0.811)=0.048。
(1)根據(jù)上述描述與圖1,則“天氣”節(jié)點中的“多云”信息熵是 00。
(2)實現(xiàn)求首次劃分節(jié)點的程序如下,請在橫線處填入合適的代碼:
n
1
9
14
9
14
5
14
5
14
3
6
3
6
3
6
3
6
6
8
6
8
2
8
2
8
6
14
8
14
【考點】應用程序的試運行和保存.
【答案】0
【解答】
【點評】
聲明:本試題解析著作權屬菁優(yōu)網(wǎng)所有,未經(jīng)書面同意,不得復制發(fā)布。
發(fā)布:2024/6/27 10:35:59組卷:0引用:1難度:0.3
相似題
-
1.有如下VB程序段:
執(zhí)行該程序段后,變量c的值是( ?。?/h2>發(fā)布:2024/12/16 5:0:1組卷:1引用:2難度:0.3 -
2.小明用python語言中對大小為100*100像素的圖像“上.jpg”(如圖所示)進行簡單處理,部分代碼如圖:
程序執(zhí)行后的圖像效果是( ?。?/h2>發(fā)布:2024/12/20 9:30:2組卷:3引用:5難度:0.4 -
3.由大寫字母組成的長度相同的兩個字符串s1和s2,檢測各字母的數(shù)量,如“ABDAC”與“AABCD”所含字母數(shù)量一樣,與“AABBC”所含字母數(shù)量不一樣。實現(xiàn)該功能的VB程序段如下:
填空處的代碼可以由以下部分組成:
①Text2.Text ②val(Text2.Text) ③b(a)=b(a)+1 ④b(a)=b(a)-1 ⑤b(i)<>0⑥b(i)=0
代碼順序正確的是( ?。?/h2>發(fā)布:2024/12/16 9:30:1組卷:3引用:3難度:0.4
把好題分享給你的好友吧~~