Esquecemento catastrófico na aprendizaxe automática

ML
Ciencia de datos
Esquecemento catastrófico na aprendizaxe automática cover image

O esquecemento catastrófico, tamén coñecido como interferencia catastrófica, é un fenómeno que se produce cando unha rede neuronal ou un modelo de aprendizaxe automática "esquece", ou reduce drasticamente o seu rendemento en tarefas aprendidas previamente despois de aprender unha nova tarefa. Isto pode ocorrer cando se adestra un modelo nun fluxo de tarefas, en lugar de adestralo en todas as tarefas á vez.

Hai algunhas formas diferentes nas que se pode producir un esquecemento catastrófico. Unha forma é a través do proceso de "sobrefitting" 1, onde o modelo está tan centrado en axustar os datos de adestramento para a nova tarefa que esquece a información das tarefas anteriores. Outra forma é a través do proceso de "interferencia", onde a nova tarefa está relacionada coas tarefas anteriores dalgún xeito, e a aprendizaxe do modelo sobre a nova tarefa "interfire" co seu coñecemento sobre as tarefas anteriores. Unha forma habitual na que se produce o esquecemento catastrófico é cando se adestra un modelo mediante o enfoque "Aprendizaxe en liña" 2, no que o modelo se actualiza continuamente con novos exemplos. a medida que entran, en lugar de ser adestrados nun conxunto fixo de exemplos ao mesmo tempo. Neste escenario, o modelo pode ser presentado con novos exemplos que son significativamente diferentes dos exemplos nos que foi adestrado anteriormente, e isto pode facer que "esqueza" ou degrade significativamente o seu rendemento na tarefa anterior.

Hai varias formas de mitigar o esquecemento catastrófico:

  • Un enfoque é utilizar técnicas como a "Regularización do peso" 3, que poden axudar a evitar o modelo de cambiar drasticamente os seus valores de peso e perder os coñecementos adquiridos nas tarefas anteriores.

  • "A consolidación de peso elástico" 4, que implica engadir unha pequena cantidade de ruído aos pesos da rede durante o adestramento, tamén pode axudar a previr o esquecemento catastrófico. Este ruído axuda a "estabilizar" os pesos, facendo menos probable que o modelo esqueza os seus coñecementos sobre tarefas previas.

  • Outro enfoque é utilizar métodos como "Ensaio" 5, no que o modelo se presenta continuamente con exemplos de tarefas aprendidas previamente para axudar a conservar ese coñecemento.

  • Outro método popular para abordar o esquecemento catastrófico é empregar "Transfer Learning" 6, no que un modelo adestrado nunha tarefa está afinado nunha tarefa relacionada. Por exemplo, un modelo que foi adestrado para recoñecer imaxes de cans pode ser afinado para recoñecer imaxes de gatos. Neste caso, o modelo xa aprendeu moitas características que son útiles para recoñecer imaxes de animais en xeral, polo que pode utilizar este coñecemento para aprender rapidamente a recoñecer imaxes de gatos.

  • Os "Métodos de conxunto" 7, nos que se adestran varios modelos para resolver diferentes tarefas, e os seus resultados se combinan para facer unha predición final, tamén son útiles para previndo o esquecemento catastrófico. Por exemplo, un modelo de conxunto pode consistir nun modelo que está adestrado para recoñecer imaxes de cans, outro modelo que está adestrado para recoñecer imaxes de gatos, etc. Cando se lle presenta un novo exemplo, o modelo de conxunto pode utilizar a saída de cada un dos seus modelos constituíntes para facer unha predición máis informada.

O esquecemento catastrófico é unha consideración importante cando se adestran modelos de aprendizaxe automática, especialmente cando se adestran eses modelos para aprender varias tarefas ao longo do tempo. Usando técnicas como a regularización de peso, a consolidación de peso elástico, o ensaio, a aprendizaxe de transferencia e os métodos de conxunto, é posible mitigar os efectos do esquecemento catastrófico e mellorar o rendemento dos modelos de aprendizaxe automática.

[1] The Overfitting Iceberg (2020)

[2] Métodos en liña na aprendizaxe automática: teoría e aplicacións (Consultado en xaneiro de 2023)

[3] Técnicas de regularización na aprendizaxe profunda (2019)

[4] Superando o esquecemento catastrófico nas redes neuronais (2017)

[5] Esquecemento catastrófico, ensaio e pseudohearsal (1995)

[6] A Survey of Transfer Learning (2016)

[7] Ensemble Learning - Wikipedia (Consultado en xaneiro de 2023)


Career Services background pattern

Servizos de Carreira

Contact Section background image

Mantémonos en contacto

Code Labs Academy © 2024 Todos os dereitos reservados.