A leitura atenta é um bom começo para quem quer compreender a Ciência de Dados e aplicar corretamente os algoritmos de Machine Learning
Publicado:
Leitura 6 minutos
Defendo ferozmente a educação como único meio para iniciar uma
carreira no mercado de Analytics. Essa é a minha visão e também a de
muitos executivos e CDOs com quem tenho conversado.
Mas não acredito que seja necessário um mestrado
ou um doutorado para se tornar um bom cientista de dados. Mesmo atuando como
professor de graduação, pós-graduação e pesquisador na área, acredito
que a academia e o mercado de trabalho são diferentes, embora
complementares. Na academia, queremos produzir novos conhecimentos; no
mercado, queremos gerar valor para agregar na qualidade de vida de
nossos clientes. Tratam-se de dois ambientes diferentes com tipos de
profissionais diferentes que buscam resultados diferentes.
Independentemente da forma que você escolher para se tornar uma
cientista de dados, a educação e o estudo certamente serão os únicos
meios para você conseguir uma posição no mercado de trabalho.
Uma das formas de você estudar e adquirir conhecimento é por meio de
(bons!) livros. Desde que tenho escrito aqui no LinkedIn, muitas pessoas
têm me pedido referências para estudar. Recebi mensagens de pessoas do
país todo me solicitando uma lista de livros confiáveis para conhecer a teoria e a prática de Machine Learning.
Como professor, estou sempre preocupado em conhecer e indicar boas
referências de estudo aos meus alunos. Se demorei a elaborar esta lista,
peço perdão a quem me pediu, mas foi preciso estudar diversas obras a
fim de indicar as melhores.
Além disso, ainda que toda disciplina tenha seu conjunto de
livros/textos, procuro fazer indicações específicas para cada aluno que
me pede uma referência complementar.
Por isso procurei selecionar os livros que podem ajudar quem está interessado em começar uma carreira em Ciência de Dados. E o melhor de tudo isso é que todos os livros da lista estão em português!
Continue lendo para saber quais livros me ajudaram a compreender a
Ciência de Dados e aplicar corretamente os algoritmos de Machine
Learning.
1 – Inteligência Artificial. Uma Abordagem de Aprendizado de Máquina
Neste livro você vai conhecer uma visão geral dos algoritmos de
aprendizado, além de técnicas para preparar a sua base de dados e um
conjunto de aplicações em diferentes áreas.
Além dos conceitos que irão te introduzir no mundo de Machine
Learning, o livro aborda temas avançados de pesquisa na área, como
aprendizado em fluxos de dados (meu tema de pesquisa!), meta-aprendizado
e computação natural. Todos esses temas são expostos com a clareza de
quatro professores doutores experientes na área.
Recomendo este livro para quem tem interesse em começar a carreira e
quer ter uma boa referência em português sobre o que a Inteligência
Artificial é capaz de fazer.
Apesar de eu ser suspeito para indicá-lo, já que foi escrito pela
minha orientadora de mestrado, faço questão de inclui-lo nesta lista
pois foi com ele que tive o meu primeiro contato na Ciência de Dados. Fiz a compra na época do mestrado e até hoje o utilizo para relembrar alguns conceitos importantes.
O livro não aborda como você deve implementar os algoritmos e nem te
dá exercícios para praticar em alguma ferramenta, mas ele ainda é o
livro de cabeceira que todo cientista de dados brasileiro deve ter ao
lado da cama.
Data Science do Zero. Primeiras Regras com o Python
Este livro foi traduzido para o português e é uma referência muito importante para quem quer conhecer de perto como os algoritmos funcionam.
A ideia do livro é mostrar como você pode construir qualquer algoritmo
de Machine Learning do zero utilizando a linguagem Python.
Apesar de ser um pouco superficial, o livro aborda vários algoritmos
da área e é recheado de códigos. Se você entende bem como a linguagem
Python trabalha, não terá dificuldades para compreender como os códigos
podem ser executados e como os algoritmos funcionam.
Ainda que brevemente, o autor apresenta um conteúdo básico sobre
álgebra linear, probabilidade e estatística. Esse é um ponto muito
positivo para o livro, já que são temas muito relevantes para Machine
Learning, embora sejam tão pouco falados.
Já no capítulo final você encontrará algumas ferramentas básicas do
cientista de dados, como o IPython, e sugestões de como você pode
praticar e formar seu portfólio de projetos.
Python Para Análise de Dados
Manipular, processar, limpar e triturar dados são as atividades que
mais consomem o tempo de um cientista de dados. Neste livro, você vai
conhecer o básico e o avançado de várias ferramentas que permitem a
realização dessas atividades.
O autor introduz o ecossistema Python e vai detalhando as
funcionalidades de cada pacote da linguagem conforme a necessidade de
tratamento de dados. Por exemplo, em vez de ensinar uma função da
linguagem, o autor mostra como você pode utilizá-la para resolver um
problema analítico. Além de ser uma excelente referência analítica, é
didático!
Um dos temas mais interessantes abordados no livro é a visualização de dados. Em
apenas um capítulo, o autor mostra diferentes formas de exibir as
informações que são analisadas e como extrair conhecimento a partir
delas. Por se tratar de um tópico cada vez mais exigido nas entrevistas
de emprego, esse livro merece estar presente nesta lista.
Além de abordar os conceitos essenciais de análise e visualização de
dados, o autor incluiu dois capítulos avançados: um deles para falar
sobre a manipulação de dados de séries temporais, e o outro para mostrar
exemplos de dados de aplicações econômicas e financeiras.
Esse é o livro ideal para você conhecer antes de se aprofundar nos algoritmos de Machine Learning.

Agora é com você!
Os livros desta lista vão te permitir conhecer a essência dos algoritmos de Machine Learning. Acredito que esse pode ser um primeiro passo para você se tornar um cientista de dados.
Conhece outros livros muito bons? Deixe sua indicação nos comentários.
(*) Orlando Silva Junior é cientista de dados do Banco Itaú e professor convidado no curso de “Especialização em Ciência dos Dados” da Faculdade de Engenharia de Sorocaba
Redação
14 horas atrás
Redação
17 horas atrás
Redação
18 horas atrás
Redação
18 horas atrás