Sự lãng quên thảm khốc trong học máy

Cập nhật trên November 15, 2024 5 phút Đọc

Sự quên lãng thảm khốc, còn được gọi là Can thiệp thảm họa, là hiện tượng xảy ra khi mạng lưới thần kinh hoặc mô hình học máy “quên” hoặc giảm đáng kể hiệu suất của nó đối với các nhiệm vụ đã học trước đó sau khi học một nhiệm vụ mới. Điều này có thể xảy ra khi huấn luyện một mô hình theo một chuỗi nhiệm vụ, thay vì huấn luyện mô hình đó trên tất cả các nhiệm vụ cùng một lúc.

Có một số cách khác nhau mà sự quên lãng thảm khốc có thể xảy ra. Một cách là thông qua quá trình “overfitting” 1, trong đó mô hình tập trung vào việc điều chỉnh dữ liệu đào tạo cho nhiệm vụ mới mà nó quên mất thông tin của nhiệm vụ trước đó. Một cách khác là thông qua quá trình “can thiệp”, trong đó nhiệm vụ mới có liên quan đến các nhiệm vụ trước đó theo một cách nào đó và việc mô hình tìm hiểu về nhiệm vụ mới “can thiệp” vào kiến thức của nó về các nhiệm vụ trước đó. Một cách phổ biến mà Chứng quên thảm họa xảy ra là khi đào tạo một mô hình bằng cách sử dụng phương pháp “Học trực tuyến” 2, trong đó mô hình được cập nhật liên tục với các ví dụ mới khi họ đến, thay vì được đào tạo trên một tập hợp các ví dụ cố định cùng một lúc. Trong trường hợp này, mô hình có thể được trình bày với các ví dụ mới khác biệt đáng kể so với các ví dụ đã được đào tạo trước đó và điều này có thể khiến mô hình “quên” hoặc làm giảm đáng kể hiệu suất của nó đối với nhiệm vụ trước đó.

Có một số cách để giảm thiểu sự quên lãng thảm khốc:

Một cách tiếp cận là sử dụng các kỹ thuật như “Điều chỉnh cân nặng” 3, có thể giúp ngăn chặn mô hình từ việc thay đổi mạnh mẽ các giá trị trọng lượng của nó và làm mất đi kiến thức đã thu được từ các nhiệm vụ trước đó.
“Hợp nhất trọng lượng đàn hồi” 4, bao gồm việc thêm một lượng nhiễu nhỏ vào trọng lượng của mạng trong quá trình đào tạo, cũng có thể giúp ngăn ngừa chứng Lãng quên thảm họa. Tiếng ồn này giúp “ổn định” các trọng số, khiến mô hình ít có khả năng quên kiến thức về các tác vụ trước đó.
Một cách tiếp cận khác là sử dụng các phương pháp như “Diễn tập” 5, trong đó mô hình liên tục được trình bày với các ví dụ từ các nhiệm vụ đã học trước đó để giúp mô hình ghi nhớ kiến thức đó.
Một phương pháp phổ biến khác để giải quyết chứng quên thảm họa là sử dụng “Học chuyển giao” 6, trong đó một mô hình được đào tạo về một nhiệm vụ sẽ được điều chỉnh về một nhiệm vụ liên quan. Ví dụ: một mô hình đã được đào tạo để nhận dạng hình ảnh của chó có thể được tinh chỉnh để nhận dạng hình ảnh của mèo. Trong trường hợp này, mô hình đã học được nhiều tính năng hữu ích cho việc nhận dạng hình ảnh của động vật nói chung, do đó, mô hình có thể sử dụng kiến thức này để học cách nhanh chóng cách nhận dạng hình ảnh của mèo.
“Các phương pháp tập hợp” 7, trong đó nhiều mô hình được đào tạo để giải quyết các nhiệm vụ khác nhau và kết quả đầu ra của chúng được kết hợp để đưa ra dự đoán cuối cùng, cũng hữu ích trong ngăn ngừa sự lãng quên thảm khốc. Ví dụ: một mô hình tập hợp có thể bao gồm một mô hình được đào tạo để nhận dạng hình ảnh của chó, một mô hình khác được đào tạo để nhận dạng hình ảnh của mèo, v.v. Khi đưa ra một ví dụ mới, mô hình tập hợp có thể sử dụng đầu ra của từng mô hình thành phần của nó để đưa ra dự đoán sáng suốt hơn.

Sự quên lãng thảm khốc là một điều quan trọng cần cân nhắc khi đào tạo các mô hình học máy, đặc biệt khi các mô hình đó đang được đào tạo để học nhiều nhiệm vụ theo thời gian. Bằng cách sử dụng các kỹ thuật như Chính quy hóa trọng lượng, Hợp nhất trọng lượng đàn hồi, Diễn tập, Học chuyển đổi và Phương pháp tập hợp, có thể giảm thiểu tác động của chứng quên thảm khốc và cải thiện hiệu suất của các mô hình học máy.

Biến dữ liệu phức tạp thành thông tin chi tiết có thể hành động—tham gia Code Labs Academy(/courses/data-science-and-ai) của Code Labs Academy Code Labs Academy’s Data Science & AI Bootcamp để khai thác toàn bộ tiềm năng của máy học và trí tuệ nhân tạo.

[1] Tảng băng trôi quá mức (2020)

[2] Phương pháp trực tuyến trong học máy - Lý thuyết và ứng dụng (Được tư vấn vào tháng 1 năm 2023)

[3] Kỹ thuật chính quy hóa trong học sâu (2019)

[4] Khắc phục tình trạng quên lãng nghiêm trọng trong mạng lưới thần kinh (2017)

[5] Quên thảm khốc, diễn tập và diễn tập giả (1995)

[6] Khảo sát về học tập chuyển tiếp (2016)

[7] Học tập hòa tấu - Wikipedia (Được tư vấn vào tháng 1 năm 2023)