Machine learning (ML) é uma tecnologia revolucionária que vem transformando vários setores da nossa sociedade. Mas o que ela é exatamente e como funciona? Nesta postagem, vamos nos aprofundar nesses temas.
Machine learning em sua essência
Nós já mencionamos anteriormente (aqui) que machine learning é uma subárea da inteligência artificial. Especificamente, ela se concentra no desenvolvimento e implementação de algoritmos que possibilitam que computadores aprendam através da exposição a dados.
Ou seja, ao invés de serem explicitamente programados para executar tarefas específicas, algoritmos de ML são desenhados para analisar e identificar padrões em conjuntos de dados. A partir da identificação destes padrões, eles se tornam capazes de fazer previsões e tomar decisões.
Os componentes centrais das técnicas de machine learning
Existem múltiplos algoritmos de machine learning e diferentes formas de implementá-los. No entanto, de maneira geral, a implementação de técnicas de ML envolve alguns componentes principais comuns. Eles são:
Dados: os dados são o elemento central para que algoritmos de machine learning aprendam. Geralmente, esses algoritmos requerem quantidades enormes de dados para aprender. Por exemplo, para aprender a classificar imagens de gatos e cachorros, não é incomum que um algoritmo tenha que ser exposto a centenas ou milhares de imagens desses animais. Os dados usados em algoritmos de machine learning podem ser estruturados (como planilhas e listas) ou não estruturados (como textos e áudios).
Algoritmos: algoritmos são modelos matemáticos que processam, analisam, e identificam padrões nos dados. Existe uma ampla variabilidade de algoritmos em machine learning e eles são adequados para diferentes tipos de tarefas. É por isso que a área tem uma vasta gama de aplicações na nossa sociedade, indo de assistentes virtuais a carros autônomos (clique aqui).
Recursos: os recursos são as características extraídas dos dados que os algoritmos de ML usam para aprender e, posteriormente, fazer previsões. Por exemplo, no reconhecimento de imagens, os recursos podem ser os valores dos píxeis, no processamento de linguagem natural, eles podem ser frequências de palavras, já para reconhecer padrões de flores, eles podem incluir a largura e altura de suas pétalas.
Treinamento: o treinamento em machine learning corresponde a etapa de aprendizagem. Nessa etapa, os algoritmos são expostos a dados e, gradativamente, corrigem seus parâmetros internos para se adequarem aos padrões presentes nestes dados. Esse processo é o centro das técnicas de ML. Conforme um algoritmo aprimora iterativamente seus parâmetros, ele melhora suas previsões.
Teste e avaliação: após o treinamento, os modelos de ML são testados em dados inéditos para verificação de seu desempenho e precisão. Esta etapa é crucial para garantir que os modelos sejam capazes de generalizar bem suas aprendizagens em situações do mundo real.
Tipos de machine learning
Algoritmos de machine learning são divididos em três categorias principais:
Aprendizagem Supervisionada: a aprendizagem supervisionada é, provavelmente, o tipo mais popular de algoritmos de machine learning na atualidade. Na aprendizagem supervisionada, o algoritmo é treinado através de sua exposição a dados previamente rotulados. Ou seja, cada dado de entrada no algoritmo está associado a um alvo ou saída correspondente. O objetivo desse tipo de aprendizagem é criar um mapeamento das entradas para as saídas. Com isso, o modelo se torna capaz de prever o alvo quando é exposto a dados novos.
Aprendizagem Não Supervisionada: a aprendizagem não supervisionada consiste em técnicas projetadas para identificar padrões em dados não rotulados. Ou seja, os dados de treinamento consistem em um conjunto de vetores de entrada sem quaisquer valores-alvo correspondentes. O objetivo nesses algoritmos geralmente consiste em identificar padrões que possibilitem agrupamentos dos dados e redução de dimensionalidade (simplificação dos dados, mantendo apenas informações essenciais).
Aprendizagem por Reforço: técnica popular em robótica e sistemas autônomos. Ela consiste no treinamento de agentes com o uso de reforços e punições. O objetivo do procedimento é treinar os agentes a realizar sequências de decisões para maximizar uma recompensa cumulativa.
Conclusão
Concluindo, as técnicas de machine learning são ferramentas centrais em inteligência artificial. Elas possibilitam que os computadores aprendam, se adaptem e tomem decisões inteligentes através de suas exposições a dados.