types machine learning
Este tutorial explica os tipos de aprendizado de máquina, ou seja, aprendizado supervisionado, não supervisionado, de reforço e semissupervisionado com exemplos simples. Você também aprenderá as diferenças entre o aprendizado supervisionado e o não supervisionado:
No Tutorial Anterior , aprendemos sobre aprendizado de máquina, seu funcionamento e aplicativos. Também vimos uma comparação entre aprendizado de máquina e inteligência artificial.
O aprendizado de máquina é um campo da ciência que lida com programas de computador que aprendem por meio da experiência e prediz o resultado.
A principal característica do ML é aprender com a experiência. O aprendizado acontece quando o sistema alimentado com os dados de entrada do treinamento faz alterações em seus parâmetros e se ajusta para dar a saída desejada. A saída é o valor alvo definido nos dados de treinamento.
=> Leia a série completa de treinamento em aprendizado de máquina
O que você aprenderá:
- Tipos de aprendizado de máquina
- Exemplo da vida real de aprendizagem supervisionada e não supervisionada
- Diferença entre aprendizagem supervisionada e não supervisionada
- Aprendizagem Semi-Supervisionada
- Conclusão
Tipos de aprendizado de máquina
Os programas de aprendizado de máquina são classificados em 3 tipos, conforme mostrado abaixo.
- Supervisionado
- Sem supervisão
- Aprendizagem por Reforço
Vamos entender cada um deles em detalhes !!
# 1) Aprendizagem Supervisionada
A aprendizagem supervisionada acontece na presença de um supervisor, assim como a aprendizagem realizada por uma criança pequena com a ajuda de seu professor. Quando uma criança é treinada para reconhecer frutas, cores, números sob a supervisão de um professor, esse método é um aprendizado supervisionado.
Neste método, cada passo da criança é verificado pelo professor e a criança aprende com o resultado que tem que produzir.
Como funciona a aprendizagem supervisionada?
No algoritmo de ML supervisionado, a saída já é conhecida. Existe um mapeamento de entrada com saída. Portanto, para criar um modelo, a máquina é alimentada com muitos dados de entrada de treinamento (tendo entrada e saída correspondente conhecidas).
Os dados de treinamento ajudam a atingir um nível de precisão para o modelo de dados criado. O modelo construído agora está pronto para ser alimentado com novos dados de entrada e prever os resultados.
O que é um conjunto de dados rotulado?
O conjunto de dados com saídas conhecidas para uma determinada entrada é chamado de Conjunto de dados rotulado. Por exemplo, uma imagem de fruta junto com o nome da fruta é conhecida. Portanto, quando uma nova imagem de fruta é mostrada, ela é comparada com o conjunto de treinamento para prever a resposta.
O aprendizado supervisionado é um mecanismo de aprendizado rápido com alta precisão. Os problemas de aprendizagem supervisionada incluem problemas de regressão e classificação.
Alguns dos algoritmos de aprendizagem supervisionada são:
- Árvores de decisão,
- K-vizinho mais próximo,
- Regressão linear,
- Máquina de vetor de suporte e
- Redes neurais.
Exemplo de aprendizagem supervisionada
- Na primeira etapa, um conjunto de dados de treinamento é alimentado para o algoritmo de aprendizado de máquina.
- Com o conjunto de dados de treinamento, a máquina se ajusta, fazendo alterações nos parâmetros para construir um modelo lógico.
- O modelo construído é então usado para um novo conjunto de dados para prever o resultado.
Tipos de algoritmos de aprendizagem supervisionada
- Classificação: Nestes tipos de problemas, prevemos a resposta como classes específicas, como “sim” ou “não”. Quando apenas 2 classes estão presentes, é chamada de Classificação Binária. Para mais de 2 valores de classe, é chamada de Classificação multiclasse. Os valores de resposta previstos são valores discretos. Por exemplo, É a imagem do sol ou da lua? O algoritmo de classificação separa os dados em classes.
- Regressão: Problemas de regressão prevêem a resposta como valores contínuos, como prever um valor que varia de -infinito a infinito. Pode exigir muitos valores. Por exemplo, o algoritmo de regressão linear aplicado prevê o custo da casa com base em vários parâmetros, como localização, aeroporto próximo, tamanho da casa, etc.
# 2) Aprendizagem não supervisionada
O aprendizado não supervisionado acontece sem a ajuda de um supervisor, assim como um peixe aprende a nadar sozinho. É um processo de aprendizagem independente.
Neste modelo, como não há saída mapeada com a entrada, os valores alvo são desconhecidos / não rotulados. O sistema precisa aprender por si mesmo a partir da entrada de dados e detectar os padrões ocultos.
O que é conjunto de dados sem rótulo?
Um conjunto de dados com valores de saída desconhecidos para todos os valores de entrada é chamado de conjunto de dados sem rótulo.
Como funciona a aprendizagem não supervisionada?
Como não existem valores de saída conhecidos que podem ser usados para construir um modelo lógico entre a entrada e a saída, algumas técnicas são usadas para extrair regras de dados, padrões e grupos de dados com tipos semelhantes. Esses grupos ajudam os usuários finais a entender melhor os dados, bem como a encontrar uma saída significativa.
As entradas alimentadas não estão na forma de uma estrutura adequada, assim como os dados de treinamento (no aprendizado supervisionado). Ele pode conter outliers, dados ruidosos, etc. Essas entradas são alimentadas em conjunto para o sistema. Durante o treinamento do modelo, as entradas são organizadas para formar clusters.
Os algoritmos de aprendizagem não supervisionados incluem algoritmos de agrupamento e associação, como:
- A priori,
- Clustering K-means e outros algoritmos de mineração de regras de associação.
Quando novos dados são fornecidos ao modelo, ele prevê o resultado como um rótulo de classe ao qual a entrada pertence. Se o rótulo da classe não estiver presente, uma nova classe será gerada.
Enquanto passa pelo processo de descoberta de padrões nos dados, o modelo ajusta seus parâmetros por si mesmo, portanto, também é chamado de auto-organização. Os clusters serão formados descobrindo as semelhanças entre os insumos.
Por exemplo, ao comprar produtos online, se a manteiga for colocada no carrinho, ele sugere a compra de pão, queijo, etc. O modelo não supervisionado examina os pontos de dados e prevê os outros atributos que estão associados ao produto.
Exemplo de aprendizagem não supervisionada
Tipos de algoritmos não supervisionados
- Algoritmo de clustering : Os métodos de encontrar as semelhanças entre itens de dados, como a mesma forma, tamanho, cor, preço, etc. e agrupá-los para formar um cluster é a análise de cluster.
- Detecção de Outlier : Neste método, o conjunto de dados é a busca por qualquer tipo de dissimilaridades e anomalias nos dados. Por exemplo, uma transação de alto valor no cartão de crédito é detectada pelo sistema para detecção de fraude.
- Mineração de regras de associação : Neste tipo de mineração, ele descobre os conjuntos de itens ou associações entre os elementos que ocorrem com mais frequência. Associações como “produtos geralmente comprados juntos”, etc.
- Autoencoders: A entrada é compactada em um formato codificado e recriada para remover dados ruidosos. Esta técnica é usada para melhorar a qualidade da imagem e do vídeo.
# 3) Aprendizagem por Reforço
Nesse tipo de aprendizado, o algoritmo aprende por mecanismo de feedback e experiências anteriores. É sempre desejável que cada etapa do algoritmo seja executada para atingir um objetivo.
Portanto, sempre que a próxima etapa deve ser realizada, ele recebe o feedback da etapa anterior, junto com o aprendizado da experiência para prever qual poderia ser a próxima melhor etapa. Esse processo também é chamado de processo de tentativa e erro para atingir a meta.
A aprendizagem por reforço é um processo iterativo de longo prazo. Quanto maior o número de feedbacks, mais preciso se torna o sistema. A aprendizagem por reforço básico também é chamada de Processo de Decisão de Markov.
Exemplo de aprendizado por reforço
Exemplo de Aprendizado por Reforço são os videogames, onde os jogadores completam certos níveis de um jogo e ganham pontos de recompensa. O jogo fornece feedback ao jogador por meio de movimentos de bônus para melhorar seu desempenho.
O Aprendizado por Reforço é usado no treinamento de robôs, carros autônomos, gerenciamento automático de estoque, etc.
Alguns algoritmos populares de Aprendizagem por Reforço incluem:
- Q-Learning,
- Deep Adversarial Networks
- Diferença Temporal
A figura abaixo descreve o mecanismo de feedback do Reinforcement Learning.
adicionar elemento ao exemplo de array java
- A entrada é observada pelo agente que é o elemento AI.
- Este agente de IA atua no ambiente de acordo com a decisão tomada.
- A resposta do ambiente é enviada para a IA na forma de uma recompensa de volta como feedback.
- O estado e a ação realizada no ambiente também são salvos.
(imagem fonte )
Exemplo da vida real de aprendizagem supervisionada e não supervisionada
Para Aprendizagem Supervisionada:
# 1) Tomemos o exemplo de uma cesta de vegetais com cebola, cenoura, rabanete, tomate, etc., e podemos organizá-los na forma de grupos.
#dois) Criamos uma tabela de dados de treinamento para entender o aprendizado supervisionado.
A tabela de dados de treinamento caracteriza os vegetais com base em:
- Forma
- Cor
- Tamanho
Forma | Cor | Tamanho | Vegetal |
---|---|---|---|
É mais preciso do que o aprendizado não supervisionado, pois os dados de entrada e a saída correspondente são bem conhecidos e a máquina só precisa dar previsões. | Ele tem menos precisão porque os dados de entrada não estão rotulados. Assim, a máquina deve primeiro entender e rotular os dados e, em seguida, fornecer previsões. | ||
Redondo | Castanho | Grande | Cebola |
Redondo | Internet | Médio | Tomate |
Cilíndrico | Branco | Grande | Rabanete |
Cilíndrico | Internet | Médio | Cenoura |
Quando esta tabela de dados de treinamento é alimentada para a máquina, ela construirá um modelo lógico usando a forma, cor, tamanho do vegetal, etc., para prever o resultado (vegetal).
Conforme uma nova entrada é alimentada para este modelo, o algoritmo irá analisar os parâmetros e produzir o nome da fruta.
Para aprendizagem não supervisionada:
Na aprendizagem não supervisionada, ele cria grupos ou clusters com base em atributos. No conjunto de dados de amostra acima, os parâmetros de vegetais são:
# 1) Forma
Os vegetais são agrupados com base na forma.
- Redondo: Cebola e Tomate.
- Cilíndrico: Rabanete e Cenoura.
Pegue outro parâmetro, como tamanho.
# 2) Tamanho
Os vegetais são agrupados com base no tamanho e forma:
- Tamanho médio e formato redondo: Tomate
- Tamanho grande e forma redonda: Cebola
No aprendizado não supervisionado, não temos nenhum conjunto de dados de treinamento e variável de resultado, enquanto no aprendizado supervisionado, os dados de treinamento são conhecidos e são usados para treinar o algoritmo.
Diferença entre aprendizagem supervisionada e não supervisionada
Supervisionado | Sem supervisão |
---|---|
Em algoritmos de aprendizagem supervisionada, a saída para a entrada fornecida é conhecida. | Em algoritmos de aprendizagem não supervisionados, a saída para a entrada fornecida é desconhecida. |
Os algoritmos aprendem com um conjunto rotulado de dados. Esses dados ajudam a avaliar a precisão dos dados de treinamento. | O algoritmo é fornecido com dados não rotulados, onde tenta encontrar padrões e associações entre os itens de dados. |
É uma técnica de modelagem preditiva que prevê os resultados futuros com precisão. | É uma técnica de Modelagem Descritiva que explica a relação real entre os elementos e a história dos elementos. |
Inclui algoritmos de classificação e regressão. | Inclui algoritmos de aprendizagem de regras de agrupamento e associação. |
Alguns algoritmos de aprendizagem supervisionada são Regressão Linear, Naïve Bayes e Redes Neurais. | Alguns algoritmos para aprendizagem não supervisionada são k- means clustering, Apriori, etc. |
Este tipo de aprendizagem é relativamente complexo, pois requer dados rotulados. | É menos complexo porque não há necessidade de compreender e rotular os dados. |
É um processo online de análise de dados e não requer interação humana. | Esta é uma análise de dados em tempo real. |
Aprendizagem Semi-Supervisionada
A abordagem de aprendizagem semissupervisionada aceita entrada de dados de treinamento rotulados e não rotulados. Esse tipo de aprendizado é útil quando é difícil extrair recursos úteis de dados não rotulados (abordagem supervisionada) e os especialistas em dados acham difícil rotular os dados de entrada (abordagem não supervisionada).
Apenas uma pequena quantidade de dados rotulados nesses algoritmos pode levar à precisão do modelo.
Exemplos de aprendizagem semissupervisionada incluem tomografias e ressonâncias magnéticas, onde um especialista médico pode marcar alguns pontos nas varreduras para qualquer doença, embora seja difícil marcar todas as varreduras.
Conclusão
As tarefas de aprendizado de máquina são amplamente classificadas em tarefas supervisionadas, não supervisionadas, semissupervisionadas e de aprendizado por reforço.
Aprendizagem supervisionada é aprender com a ajuda de dados rotulados. Os algoritmos de ML são alimentados com um conjunto de dados de treinamento no qual, para cada dado de entrada, a saída é conhecida, para prever resultados futuros.
Este modelo é altamente preciso e rápido, mas requer alto conhecimento e tempo para ser construído. Além disso, esses modelos requerem reconstrução se os dados forem alterados. Tarefas de ML, como regressão e classificação, são realizadas em um ambiente de aprendizado supervisionado.
A aprendizagem não supervisionada ocorre sem a ajuda de um supervisor. Os dados de entrada fornecidos aos algoritmos de ML não são rotulados, ou seja, para cada entrada nenhuma saída é conhecida. O algoritmo por si só descobre as tendências e padrões nos dados de entrada e cria uma associação entre os diferentes atributos da entrada.
Esse tipo de aprendizado é útil para localizar padrões em dados, criar clusters de dados e análises em tempo real. Tarefas como clustering, algoritmos KNN, etc., estão sob a aprendizagem não supervisionada.
Tarefas de aprendizagem semissupervisionadas têm a vantagem de algoritmos supervisionados e não supervisionados ao prever os resultados usando dados marcados e não marcados. O aprendizado por reforço é um tipo de mecanismo de feedback em que a máquina aprende com o feedback constante do ambiente para atingir seu objetivo.
Nesse tipo de aprendizado, os agentes de IA realizam algumas ações sobre os dados e o ambiente dá uma recompensa. A aprendizagem por reforço é usada por jogos multijogador para crianças, carros autônomos, etc.
Fique ligado em nosso próximo tutorial para saber mais sobre Aprendizado de Máquina e Rede Neural Artificial!
=> Visite aqui para a série exclusiva de aprendizado de máquina
Leitura recomendada
- Data Mining Vs Machine Learning Vs Artificial Intelligence Vs Deep Learning
- 11 ferramentas de software de aprendizado de máquina mais populares em 2021
- Tutorial de aprendizado de máquina: introdução ao ML e seus aplicativos
- Tipos de dados Python
- Tipos de dados C ++
- Tipos de riscos em projetos de software
- Tipos de teste de migração: com cenários de teste para cada tipo
- 15 melhores sistemas de gestão de aprendizagem (LMS do ano 2021)