O Algoritmo Beam Search no Contexto de Processamento de Linguagem Natural e Tarefas de Geração de Sequência

Atualizado em June 21, 2024 3 Minutos Leia

No domínio do processamento de linguagem natural (PNL) e tarefas de geração de sequência, como tradução de linguagem ou geração de texto, tanto o algoritmo de pesquisa de feixe quanto a decodificação gananciosa são usados para prever a sequência de palavras mais provável, dado um modelo e uma sequência de entrada.

Decodificação gananciosa

Ideia principal: a decodificação gananciosa seleciona a palavra com maior probabilidade em cada etapa, construindo iterativamente a sequência de saída.
Exploração do espaço de busca: explora um único caminho através do espaço de saída, favorecendo a palavra mais provável em cada etapa sem considerar consequências futuras.
Sequências Candidatas: Acompanha apenas a sequência mais provável em cada etapa, descartando outras possibilidades.
Tomada de decisão: toma decisões locais com base apenas na maior probabilidade na etapa atual, sem considerar possíveis resultados de longo prazo.

Pesquisa de feixe

Ideia principal: A pesquisa por feixe estende a exploração a múltiplas sequências possíveis, em vez de apenas à mais provável.
Exploração do Espaço de Busca: Explora múltiplos caminhos (ou “feixes”) simultaneamente, mantendo um conjunto de sequências candidatas promissoras.
Sequências candidatas: Mantém um número fixo de sequências mais prováveis (determinadas pelo parâmetro de largura do feixe) em cada etapa.
Tomada de decisão: em cada etapa, considera múltiplas sequências candidatas e seleciona as mais prováveis com base em suas probabilidades cumulativas até aquele ponto.

Parâmetro de largura do feixe e compensações

Largura do feixe: determina o número de sequências candidatas a serem mantidas em cada etapa. Uma largura de feixe maior explora mais possibilidades, mas aumenta a complexidade computacional.

Compensações:

Diversidade versus Precisão: Uma largura de feixe maior incentiva a diversidade nas sequências geradas, mas pode sacrificar a precisão. Por outro lado, uma largura menor pode fornecer resultados mais precisos, mas pode carecer de diversidade.
Custo computacional: Aumentar a largura do feixe aumenta significativamente os recursos computacionais necessários.

Abordando diversidade versus precisão

A busca por feixe tenta equilibrar diversidade e precisão, permitindo a exploração de múltiplas sequências enquanto mantém um conjunto gerenciável de candidatos. Técnicas como normalização de comprimento ou diversas variações de busca de feixe podem aumentar a diversidade sem sacrificar muito a qualidade.

Limitações e resultados abaixo do ideal

Suboptimalidade: A pesquisa de feixe pode produzir resultados abaixo do ideal quando a sequência mais provável em cada etapa não leva necessariamente à melhor sequência geral.
Falta de Exploração: Pode ficar preso em ótimos locais, especialmente se a verdadeira sequência ótima se desviar significativamente das palavras individuais mais prováveis em cada etapa.
Crescimento Exponencial: O espaço de busca cresce exponencialmente com a largura do feixe, levando a maiores requisitos computacionais.

Estratégias como o uso de penalidades de comprimento, diversas variantes de busca de feixe ou a incorporação de restrições adicionais podem aliviar algumas dessas limitações, mas podem não resolver completamente os desafios inerentes à exploração eficaz de vastos espaços de busca. Os pesquisadores frequentemente experimentam diferentes estratégias de decodificação com base nos requisitos específicos da tarefa e no equilíbrio necessário entre diversidade e precisão.