Eu sou cientista de dados e neste github apresento os projetos que compõem o meu portfólio e o meu objetivo é mostrar e compartilhar as minhas habilidades em solucionar problemas de negócio utilizando conceitos e ferramentas da ciência de dados.
Portfólio: Visite o meu portfólio de projetos aqui.
Sou formado em engenharia de produção civil e desde 2010 atuei na área de engenharia de avaliações e perícias. Entretanto, no final do ano de 2018, ao ler um livro, totalmente por acaso, se deu o início do meu processo de transição de carreira. Definitivamente, ler o livro Indústria 4.0 Conceitos e Fundamentos foi uma grande virada de chave na minha vida !! O despertar para todas as grandes transformações tecnologicas que estão ocorrendo simulteneamente desde o início da quarta revolução industrial me fez buscar um novo propósito profissional e de vida.
No livro "A Origem das Espécies", Charles Darwin detalha o conceito de Natura non facit saltum, "a natureza não dá saltos". A ideia que toda evolução de uma espécie ocorre através de um processo de adaptação é singular. O meu caminho natural de adaptação foi buscar mais conhecimento sobre essa nova revolução tecnológica e assim em março de 2019 iniciei o MBA em indústria 4.0 na PUC-Minas, sendo, na época, o primeiro curso de MBA sobre esse assunto autorizado pelo MEC no Brasil.
O MBA ofereceu um excelente overview sobre os pilares fundamentais da indústria 4.0 e os que mais despertaram a minha atenção foram inteligência artificial e big data analytics. Após finalizar o curso em junho de 2020, percebi que a minha vocação e o meu caminho natural eram continuar aprofundando nessas duas áreas e foi onde encontrei a ciência de dados como a minha nova profissão.
De 2020 para cá venho me preparando e construindo esse novo capítulo da minha carreira. Durante esse processo de transformação a jornada tem sido incrível, o que me faz ter certeza do porque me tornei um cientista de dados.
Habilidades
-
Processamento e Análise de Dados: Pyhton (Pandas - Numpy, Seaborn, StatsModels, Scipy, Pyplot, Matplotlib, Scikit-learn).
-
Coleta de dados: SQL, Extração, visualização, limpeza e carregamento de dados.
-
Estatística: Descritiva, Inferencial e Teste A/B .
-
Engenharia de Software: Git, Github, Ambientes virtuais, Python API's Cloud Heroku.
-
Modelagem de Machine Learning: Classificação, Regressão, Clustering, Séries Temporais.
-
Técnicas de balanceamento de dados, seleção de atributos e redução de dimensionalidade.
-
Tradução de métricas de desempenho (MAE, MAPE, RMSE, Precisão, Recall, Curva Roc, Curva Lift, AUC, Confusion Matrix) de algoritmos em resultados de negócio.
Ferramentas
Python |
pandas |
NumPy |
SciPy |
Matplotlib |
seaborn |
scikit-learn |
XGBoost |
Flask |
Jupyter |
Heroku |
Telegram Bots |
CatBoost |
LGBM |
SQlite |
DBeaver |
Scrapy |
Statsmodels |
Pingouin |
Streamlit |
Visite o meu portfólio de projetos aqui.