Aicmiú Crann Cinnidh

aicmiú
crann cinnidh
múnla réamhaisnéise
Aicmiú Crann Cinnidh cover image

Réamhrá

Is modh foghlama neamh-pharaiméadrach faoi mhaoirseacht a úsáidtear le haghaidh rangú agus aischéimnithí iad Crainn Cinnidh (DTanna). Is é an sprioc múnla a chruthú a thuar luach athróige sprice trí rialacha cinnteoireachta simplí a fhoghlaim tátal a bhaint as na gnéithe sonraí.

eantrópachta

Is é sprioc na hoiliúna ná na scoilteanna is fearr sna nóid a aimsiú chun an crann is fearr a aimsiú. Baintear úsáid as critéir áirithe mar: Eantrópacht.

Tá go leor sainmhínithe ar eantrópacht mar:

  • Freagraíonn eantrópacht don mhéid faisnéise atá i bhfoinse faisnéise.

  • Is féidir eantrópacht a fheiceáil freisin mar randamacht nó mar thomhas iontas i dtacar.

  • Is méadrach é eantrópacht a thomhaiseann dothuarthacht nó neamhíonacht an chórais.

entropy

I gcrainn chinnidh, breithneoimid eantrópacht mar thomhas na híonachta laistigh de nód. Is é sprioc mhúnla an chrainn chinnidh ná eantrópacht na nóid ag gach scoilt a laghdú:

entropy_reductioin

Mar sin, ba mhaith linn an difríocht idir eantrópacht an nód tuismitheora agus eantrópacht na nóid linbh a uasmhéadú. Gnóthachan Faisnéise a thugtar ar an difríocht seo.

Tá an Eantrópacht HH de thacar XX ceaptha go matamaiticiúil mar seo a leanas:

H(X)=_xXp(x)logp(x)H(X) = - \sum\limits\_{x \in X} p(x) \log p(x)

Gnóthachan faisnéise

Is é Gnóthachan Faisnéise an difríocht idir eantrópacht an mháthairnód agus suim ualaithe eantrópaithe na nóid chlide, agus mar sin is féidir é a fhoirmliú mar seo a leanas:

IG(Y,X)=H(Y)xunique(X)P(xX)×H(YX=x)IG(Y, X) = H(Y) - \sum_{x \in unique(X)} P(x|X) \times H(Y | X = x)

=H(Y)xunique(X)X.count(x)len(X)×H(Y[X==x])= H(Y) - \sum_{x \in unique(X)} \frac{X.count(x)}{len(X)} \times H(Y[X == x])

áit:

  • Is é H(.)H(.) an eantrópachta.

  • Is é YY an daonra roimh an scoilt, seasann sé don mháthairnód.

  • Is é XX an athróg is mian linn a úsáid don scoilteadh.

  • Is luach uathúil é xx ar X.

  • Is liosta scoilte é Y[X==x]Y[X==x] gan ach xxluachanna.

Glacaimis sampla ceart:

entropy_reductioin

Táimid chun an Gnóthachan Faisnéise a ríomh nuair a roinnimid an máthairnód trí úsáid a bhaint as luachanna X:

IG(parent,X)=H(parent)xunique(X)P(xX)×H(parentX=x)IG(parent, X) = H(parent) - \sum_{x \in unique(X)} P(x|X) \times H(parent | X = x)

\

Ar dtús, ríomhaimid eantrópacht an nód tuismitheora:

H(parent)=P(Y=Blue)×logP(Y=Blue)P(Y=Yellow)×logP(Y=Yellow)H(parent) = - P(Y=Blue) \times \log P(Y=Blue) - P(Y=Yellow) \times \log P(Y=Yellow)

=1121×log(1121)1021×log(1021)=0.3= - \frac{11}{21} \times \log(\frac{11}{21}) - \frac{10}{21} \times \log(\frac{10}{21}) = 0.3

\

Ansin, táimid chun dóchúlacht inmheánach gach nód linbh tar éis an scoilte a ríomh trí luachanna uathúla X a úsáid:

unique(X)=[Circle,Square]unique(X) = [Circle, Square]

_xunique(X)P(xX)×H(YX=x)=P(SquareX)×H(YX=Square)\sum\_{x \in unique(X)} P(x|X) \times H(Y | X = x) = P(Square|X) \times H(Y | X = Square)

+P(CircleX)×H(YX=Circle)+ P(Circle|X) \times H(Y | X = Circle)

=921×H(YX=Square)+1221×H(YX=Circle)= \frac{9}{21} \times H(Y | X = Square) + \frac{12}{21} \times H(Y | X = Circle)

Mar:

  • H(YX=Cearnoˊg)H(Y | X = Cearnóg) : is ionann eantrópacht an chéad nód linbh.

  • H(YX=Ciorcal)H(Y | X = Ciorcal) : is ionann eantrópacht an dara nód linbh.

\

Tosaímid leis an gcéad nód linbh:

H(YX=Square)=P(Y=BlueX=Square)×logP(Y=BlueX=Square)H(Y | X = Square) = - P(Y=Blue | X = Square) \times \log P(Y=Blue| X = Square)

P(Y=YellowX=Square)×logP(Y=YellowX=Square)- P(Y=Yellow| X = Square) \times \log P(Y=Yellow| X = Square)

=79×log7929×log29=0.23= - \frac{7}{9} \times \log\frac{7}{9} - \frac{2}{9} \times \log\frac{2}{9} = 0.23

\

Agus ansin nód an dara leanbh:

H(YX=Circle)=P(Y=BlueX=Circle)×logP(Y=BlueX=Circle)H(Y | X = Circle) = - P(Y=Blue | X = Circle) \times \log P(Y=Blue| X = Circle)

P(Y=YellowX=Circle)×logP(Y=YellowX=Circle)- P(Y=Yellow| X = Circle) \times \log P(Y=Yellow| X = Circle)

=412×log412812×log812=0.28= - \frac{4}{12} \times \log\frac{4}{12} - \frac{8}{12} \times \log\frac{8}{12} = 0.28

\

Ar deireadh, cuirimid na heantrópaí in ionad na foirmle Gnóthachan Faisnéise:

IG(parent,X)=H(parent)xunique(X)P(xX)×H(parentX=x)IG(parent, X) = H(parent) - \sum_{x \in unique(X)} P(x|X) \times H(parent | X = x)

=0.3921×0.231221×0.28=0.041= 0.3 - \frac{9}{21} \times 0.23 - \frac{12}{21} \times 0.28 = 0.041

\

\

Mar a dúradh cheana, is é an cuspóir atá le scoilt nód ná an Gnóthachan Faisnéise a uasmhéadú, agus mar sin an Eantrópacht a íoslaghdú sa nód leanaí mar thoradh air. Chun seo a dhéanamh, ní mór dúinn iarracht a dhéanamh an nód a scoilt le tacair éagsúla ionchuir X1,X2,,XnX_1, X_2, \ldots, Xn agus ní choinnímid ach an scoilt a uasmhéadaíonn an Gnóthachan Faisnéise:

X\*=argmaxXiIG(Y,Xi)X^{\*} = \underset{X_i}{\operatorname{argmax}} IG(Y, X_i)

Cathain is ceart scoilteadh a stopadh

Is athchúrsach é an scoilteadh nód i gcrainn chinnidh, mar sin ní mór critéir a bheith ann ar féidir linn a úsáid chun stop a chur leis an scoilteadh. Seo cuid de na critéir is mó a cuireadh i bhfeidhm:

  • Nuair a bhíonn an nód glan: H(nód) = 0. Ní miste an nód a scoilt a thuilleadh.

  • Uastalíon doimhneachta: Is féidir linn uasdoimhneacht a shocrú gur féidir leis an múnla a bhaint amach, ciallaíonn sé go stoptar an scoilteadh fiú mura bhfuil an nód íon.

  • Íoslíon samplaí in aghaidh an nód: Is féidir linn íoslíon NN samplaí in aghaidh an nód a shocrú freisin. Más ionann líon na samplaí in aghaidh an nód agus NN ansin stopfaimid de scoilteadh fiú mura bhfuil an nód íon.

Faoi dheireadh na hoiliúna ( an scoilteadh ), tugtar "Duilleog" ar gach nód a bhraitheann ar dheireadh an chrainn chinnidh, toisc nach bhfuil sé ina fhréamh d'aon fho-chraobh. Léireoidh gach duilleog toradh an ranga leis an líon is mó samplaí.

Conclúid

Tá crann cinntí ar cheann de na halgartaim meaisínfhoghlama is cáiliúla mar gheall ar a éifeachtúlacht, a chúlra iomasach agus a chur i bhfeidhm simplí. Is féidir an algartam seo a úsáid tuilleadh le hathróga neamhspleácha uimhriúla ( Crann Cinnidh Gaussach ), agus is féidir é a leathnú chun tascanna aischéimniúcháin a réiteach freisin.


Career Services background pattern

Seirbhísí Gairme

Contact Section background image

Bígí i dteagmháil

Code Labs Academy © 2024 Gach ceart ar cosaint.