Neuroninio tinklo kūrimas apima kelis pagrindinius veiksmus:
-
Duomenų rinkimas ir išankstinis apdorojimas: surinkite ir tvarkykite duomenis, kuriuos naudosite treniruodami ir tikrindami savo neuroninį tinklą. Tai gali apimti duomenų išvalymą, trūkstamų reikšmių tvarkymą ir jų padalijimą į mokymo, patvirtinimo ir bandymų rinkinius.
-
Pasirinkite neuroninio tinklo architektūrą: nuspręskite, kokio tipo neuroninio tinklo architektūra tinka jūsų problemai. Tai gali būti grįžtamasis neuroninis tinklas, konvoliucinis neuroninis tinklas (CNN) vaizdo duomenims, pasikartojantis neuroninis tinklas (RNN) nuosekliems duomenims arba kitos specializuotos architektūros.
-
Inicijuoti modelį: inicijuokite neuroninio tinklo parametrus, tokius kaip svoriai ir poslinkiai, paprastai atsitiktinai arba naudodami specifinius inicijavimo metodus.
-
Sklidimas pirmyn: vykdykite pirminį sklidimą perduodant įvesties duomenis per tinklą, kad galėtumėte prognozuoti. Kiekvienas sluoksnis atlieka tiesinę arba netiesinę įvesties operaciją.
-
Apskaičiuoti nuostolius: palyginkite numatomą išeigą su faktine galia, kad apskaičiuotumėte nuostolius, matuojančius, kiek prognozės nutolusios nuo faktinių verčių.
– Atgalinis sklaida: naudokite optimizavimo algoritmą (pvz., gradiento nusileidimą), kad atnaujintumėte tinklo svorį taip, kad nuostoliai būtų kuo mažesni. Šiame žingsnyje apskaičiuojami nuostolių funkcijos gradientai, atsižvelgiant į tinklo svorius, tada atitinkamai pakoreguojami svoriai, kad būtų sumažintas nuostolis.
- Pakartokite: pakartokite sklidimo pirmyn, nuostolių skaičiavimo ir sklidimo atgal veiksmus kelioms iteracijoms arba epochoms, kad pagerintumėte modelio našumą.
Įprastos neuroninio tinklo architektūros sluoksniai apima:
- Įvesties sluoksnis: šis sluoksnis gauna įvesties duomenis, nesvarbu, ar tai vaizdai, tekstas, skaitinės reikšmės ir kt. Šio sluoksnio mazgų skaičius atitinka įvesties funkcijų skaičių.
– Paslėpti sluoksniai: šie sluoksniai yra tarp įvesties ir išvesties sluoksnių ir yra atsakingi už atitinkamų funkcijų ištraukimą iš įvesties duomenų. Giliuose neuroniniuose tinkluose gali būti keli paslėpti sluoksniai, o kiekvienas sluoksnis susideda iš neuronų arba mazgų.
- Išvesties sluoksnis: galutinis sluoksnis, kuris sukuria modelio išvestį. Mazgų skaičius šiame sluoksnyje priklauso nuo problemos tipo – pavyzdžiui, dvejetainei klasifikacijai gali būti vienas mazgas vienam išėjimui, o kelių klasių klasifikavimui gali būti keli mazgai, atstovaujantys skirtingoms klasėms.
Neuroninius tinklus taip pat apibrėžia:
-
Aktyvinimo funkcijos: kiekviename sluoksnyje (išskyrus įvesties sluoksnį) paprastai yra aktyvinimo funkcija, kuri įveda į tinklą netiesiškumą, leidžiantį išmokti sudėtingus modelius. Įprastos aktyvinimo funkcijos apima ReLU (Recified Linear Activation), Sigmoid, Tanh ir kt.
-
Ryšiai (arba svoriai): kiekvienas sluoksnio mazgas yra sujungtas su kiekvienu tolesnio sluoksnio mazgu, su kiekvienu ryšiu susietas svoris. Šie svoriai koreguojami treniruočių metu, kad būtų optimizuotas tinklo veikimas.
Skirtingos neuroninių tinklų architektūros gali turėti variantų arba papildomų sluoksnių, būdingų jų tikslams, tačiau šie sluoksniai sudaro pagrindinę neuroninio tinklo struktūrą.