O aprendizado de máquina é muito parecido com o que parece: a ideia de que várias formas de tecnologia, incluindo tablets e computadores, podem aprender algo com base em programação e outros dados. Parece um conceito futurista, mas esse nível de tecnologia é usado pela maioria das pessoas todos os dias . O reconhecimento de voz é um excelente exemplo disso. Assistentes virtuais como Siri e Alexa usam a tecnologia para recitar lembretes, responder perguntas e seguir comandos.
Com a proliferação do aprendizado de máquina, mais profissionais estão buscando carreiras como engenheiros de aprendizado de máquina . Uma das melhores maneiras de começar é colocando a mão na massa e desenvolvendo um projeto, e há muitos recursos gratuitos online.
Dez principais projetos de aprendizado de máquina:
Aqui está a lista dos 10 principais projetos de aprendizado de máquina simples que aprenderemos em detalhes:
- Recomendações de filmes com conjunto de dados Movielens
- TensorFlow
- Previsão de vendas com Walmart
- Previsões de preços de ações
- Reconhecimento de atividade humana com smartphones
- Previsões de qualidade do vinho
- Predição de câncer de mama
- Classificação Iris
- Classificação de tweets específicos no Twitter
- Transformando documentos manuscritos em versões digitalizadas
Vamos discutir cada um em detalhes:
1. Recomendações de filmes com conjunto de dados Movielens
Quase todo mundo hoje usa tecnologia para transmitir filmes e programas de televisão. Embora descobrir o que transmitir em seguida possa ser assustador, as recomendações costumam ser feitas com base no histórico e nas preferências do visualizador. Isso é feito por meio do aprendizado de máquina e pode ser um projeto divertido e fácil para iniciantes. Novos programadores podem praticar a codificação em linguagens Python ou R e com dados do Conjunto de dados Movielens . Gerado por mais de 6.000 usuários, Movielens atualmente inclui mais de 1 milhão de classificações de filmes de 3.900 filmes.
2. TensorFlow
Esta biblioteca de inteligência artificial de código aberto é um excelente lugar para iniciantes para aprimorar suas habilidades de aprendizado de máquina . Com o TensorFlow , eles podem usar a biblioteca para criar gráficos de fluxo de dados, projetos usando Java e uma variedade de aplicativos. Também inclui APIs para Java.
3. Previsão de vendas com Walmart
Embora a previsão de vendas futuras com precisão não seja possível, as empresas podem chegar perto do aprendizado de máquina. Por exemplo, o Walmart fornece conjuntos de dados para 98 produtos em 45 pontos de venda, para que os desenvolvedores possam acessar informações sobre vendas semanais por locais e departamentos. O objetivo com um projeto desse escopo é tomar melhores decisões baseadas em dados na otimização de canais e planejamento de estoque.
4. Previsões de preços de ações
Semelhante à previsão de vendas, as previsões dos preços das ações são baseadas em conjuntos de dados de preços anteriores, índices de volatilidade e indicadores fundamentais. Os iniciantes podem começar com um projeto como este e usar conjuntos de dados do mercado de ações para criar previsões nos próximos meses. É uma ótima maneira de se familiarizar com a criação de previsões baseadas em grandes conjuntos de dados. Para começar, baixe um conjunto de dados do mercado de ações da Quantopian ou Quandl .
5. Reconhecimento da atividade humana com smartphones
Muitos dos dispositivos móveis de hoje são projetados para detectar automaticamente quando estamos envolvidos em uma atividade específica, como correr ou andar de bicicleta. Isso é aprendizado de máquina no trabalho. Para praticar esse tipo de projeto, os engenheiros de aprendizado de máquina novatos usam um conjunto de dados que contém registros de atividades físicas para algumas pessoas (quanto mais, melhor) que foram coletados por meio de dispositivos móveis equipados com sensores inerciais. Os alunos podem então construir modelos de classificação que irão prever com precisão as atividades futuras. Isso também pode ajudá-los a entender como resolver problemas de multiclassificação.
6. Previsões de qualidade do vinho
Comprar vinhos novos e desconhecidos pode ser um sucesso ou um fracasso. Não há maneira infalível de saber se um vinho é de alta qualidade, a menos que você seja um especialista que leva em consideração diferentes fatores, como idade e preço. O Wine Quality Data Set pode ser um projeto divertido de aprendizado de máquina que contém esses detalhes para ajudar a prever a qualidade. Por meio deste projeto, os iniciantes em ML obtêm experiência com visualização de dados, exploração de dados, modelos de regressão e programação R.
7. Predição de câncer de mama
Este projeto de aprendizado de máquina usa um conjunto de dados que pode ajudar a determinar a probabilidade de um tumor de mama ser maligno ou benigno. Vários fatores são levados em consideração, incluindo a espessura do nódulo, o número de núcleos nus e a mitose. Esta é também uma excelente forma de novos profissionais de aprendizado de máquina para a prática de programação R .
8. Classificação da íris
O conjunto de dados Iris Flowers é muito conhecido e um dos mais antigos e simples para projetos de aprendizado de máquina para iniciantes. Com este projeto, os alunos precisam descobrir os fundamentos do manuseio de valores e dados numéricos. Os pontos de dados incluem o tamanho das sépalas e pétalas por comprimento e largura. Usando o aprendizado de máquina, um projeto bem-sucedido classificou as íris em uma das três espécies.
9. Classificação de tweets específicos no Twitter
Em um mundo perfeito, seria ótimo filtrar tweets contendo palavras e informações específicas rapidamente. Felizmente, existe um projeto de aprendizado de máquina de nível iniciante que permite aos programadores criar um algoritmo que pega tweets que foram executados por meio de um processador de linguagem natural para determinar quais eram mais propensos a corresponder a temas específicos, falar sobre certos indivíduos e assim por diante.
10. Transformando documentos manuscritos em versões digitalizadas
Esse tipo de projeto é uma maneira perfeita de praticar o aprendizado profundo e as redes neurais – essenciais para o reconhecimento de imagem no aprendizado de máquina. Os iniciantes também podem aprender como transformar dados de pixel em imagens, bem como usar regressão logística e conjuntos de dados MNIST.
Veja os outros conteúdos dos site, pode te ajudar nessa jornada de Data Science.