Compreender a aprendizagem supervisionada e não supervisionada

Aprendizagem supervisionada
aprendizagem não supervisionada
dados
Compreender a aprendizagem supervisionada e não supervisionada cover image

Aprendizagem supervisionada

A aprendizagem supervisionada envolve o treino de um modelo num conjunto de dados rotulados. Dados rotulados significam que os dados de entrada são emparelhados com a saída correcta. O objetivo é que o modelo aprenda o mapeamento ou a relação entre entradas e saídas para que possa fazer previsões ou classificar com precisão dados novos e não vistos. Existem dois tipos principais de aprendizagem supervisionada:

  • Classificação: Envolve a previsão de um rótulo categórico. Por exemplo, determinar se uma mensagem de correio eletrónico é spam ou não spam com base em determinadas características (como palavras utilizadas, remetente, etc.). Algoritmos como Máquinas de Vectores de Suporte (SVM), Árvores de Decisão e Redes Neuronais são utilizados para a classificação.

  • Regressão: Implica a previsão de um valor contínuo. Por exemplo, prever o preço de uma casa com base nas suas características como a área, o número de quartos, etc. Algoritmos como Regressão Linear, Floresta Aleatória e Reforço de Gradiente são utilizados para tarefas de regressão.

Aprendizagem não supervisionada

A aprendizagem não supervisionada envolve a formação de um modelo num conjunto de dados não rotulados. Neste caso, o algoritmo tenta encontrar padrões ocultos ou estruturas intrínsecas nos dados sem qualquer supervisão explícita. O objetivo é explorar os dados, compreender a sua estrutura e extrair conhecimentos significativos. Os tipos mais comuns de aprendizagem não supervisionada incluem:

  • Agrupamento: Agrupamento de pontos de dados semelhantes com base em determinadas características ou semelhanças. Por exemplo, agrupar segmentos de clientes com base no seu comportamento de compra utilizando algoritmos como K-Means ou Agrupamento Hierárquico.

  • Redução da dimensionalidade: Reduzir o número de características, mantendo a informação essencial. A Análise de Componentes Principais (PCA) e a Incorporação de Vizinhos Estocásticos Distribuídos t (t-SNE) são utilizadas para visualizar dados de elevada dimensão num espaço de dimensão inferior.

Quando utilizar cada um

  • A aprendizagem supervisionada é utilizada quando se tem dados rotulados e se pretende prever ou classificar instâncias futuras com base nesses dados rotulados. Por exemplo, se tiver dados históricos sobre compras de clientes e quiser prever compras futuras, a aprendizagem supervisionada é adequada.

  • A aprendizagem não supervisionada é utilizada quando não se dispõe de dados rotulados ou quando se pretende explorar e compreender a estrutura subjacente dos dados. Por exemplo, na deteção de anomalias ou na procura de padrões ocultos em grandes conjuntos de dados.

Por vezes, pode ser utilizada uma combinação de ambos os tipos de aprendizagem, conhecida como aprendizagem semi-supervisionada, quando se tem uma pequena quantidade de dados rotulados e uma grande quantidade de dados não rotulados, permitindo que os modelos beneficiem de ambas as fontes de informação.


Career Services background pattern

Serviços de carreira

Contact Section background image

Vamos manter-nos em contacto

Code Labs Academy © 2024 Todos os direitos reservados.