Olá, Eu sou Emerson.

Seja muito bem-vindo (a) ao meu Portfólio de Projetos de Ciência de Dados.

Nessa página, eu demonstro minhas habilidades de resolver problemas de negócio utilizando conceitos e ferramentas da Ciência de Dados, através de projetos com dados públicos.

Você vai encontrar também, minhas experiências profissionais, habilidades, ferramentas e conceitos envolvendo a Ciência de Dados.

Sinta-se à vontade para entrar em contato através dos links no final da página.

Sobre mim

Meu nome é Emerson Ferreira, sou formado em Marketing DIgital com pós graduação em Business Intelligence, Big Data e Analytics.


Atualmente, trabalho na prestação de atendimento ao público, na execução de atividades bancárias, na comercialização de produtos e serviços, realização de negócios e atividades administrativas, com foco no alcance dos objetivos estatutários e estratégicos.


Estou buscando uma oportunidade de trabalhar profissionalmente como Cientista de Dados para melhorar a tomada de decisão da empresa, através da construção de soluções usando dados.

Habilidades

Linguagens de Programação e Banco de Dados

  • Python com foco em análise de dados
  • Pensamento Estratégico
  • Conceitos de ETL
  • SQL Language

Estatística e Machine Learning

  • Algoritmos de Regressão, classificação e clusterização;
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade;
  • Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, AUC, Silhouette Score e R2);
  • Pacotes de Machine Learning: Sklearn.

Visualização de Dados

  • Matplotlib, Seaborn e Plotly
  • Streamlit
  • Power BI, Tableau

Engenharia de Software

  • Git, Github
  • Streamlit Cloud
  • SQLite3 Database

Experiências

2+ anos Assintente de Varejo

Prestação de atendimento ao público PJ, execução de atividades bancárias com apoio ao Gerente de Carteira, comercialização de produtos e serviços, realização de negócios e atividades administrativas, responsabilidade pelo sigilo das informações a que tenha acesso no uso de suas atribuições, com foco no alcance dos objetivos estatutários e estratégicos.


5+ anos Caixa Bancário

Realização de transações bancárias (descontar cheques, aceitar depósitos e pagamentos de empréstimo, processar retiradas etc), venda de produtos e serviços, acompanhamento do fluxo de caixa, verificação dos valores e documentos financeiros, gerenciamento de risco em cada transação e detectar transações fraudulentas para evitar perdas.


3+ anos Técnico Bancário

Execução de atividades bancárias, comercialização de produtos e serviços, prestação de atendimento, realização de negócios e atividades administrativas, responsabilidade pelo sigilo das informações a que tenha acesso no uso de suas atribuições, com foco no alcance dos objetivos estatutários e estratégicos.


1+ ano Auxiliar administrativo

Atendimento ao público em geral, solucionando as dúvidas e prestando as informações necessárias. Fazer a análise de documentos e efetuar a classificação e/ou registros necessários. Redigir documentos. Elaborar documentos, atas, relatórios, portarias e decisões e responsabilizar-se por seu arquivamento. Conferir e organizar dados e documentos, de acordo com instruções pré-estabelecidas. Atender telefone, receber, anotar e transmitir mensagens. Operar microcomputador. Realizar serviços de digitação em geral.


1+ ano Agente de Organização Escolar

Desenvolvimento de atividades no âmbito da organização escolar, relacionadas com a execução de ações envolvendo a secretaria escolar e o atendimento a alunos e à comunidade escolar em geral, de acordo com as necessidades da unidade escolar.

Projetos em Ciência de Dados

Análise Comparativa de Algoritmos de Machine Learning

Neste projeto, investigamos os conceitos fundamentais de treinamento, ajuste de parâmetros e o equilíbrio entre overfitting e underfitting em diversos algoritmos de aprendizado de máquina. O foco estava em tarefas de classificação, regressão e agrupamento. Utilizamos uma abordagem experimental para examinar como esses algoritmos se comportam.

O produto final do projeto foi um painel onde é demonstrado a performance desses algoritmos de aprendizado de máquina. O painel destacou como as variações nos parâmetros-chave de cada algoritmo influenciam o overfitting e underfitting, fornecendo insights valiosos sobre o ajuste fino dos modelos.

As ferramentas utilizadas foram:

  • Python e Scikit-learn
  • Algoritmos de classificação: KNN, Decision Tree, Random Forest e Logistic Regression
  • Métricas de performance: Accuracy, Precision, Recall e F1-Score
  • Algoritmos de regressão: Linear Regression, Decision Tree Regressor, Random Forest Regressor, Polinomial Regression, Linear Regression Lasso, Linear Regression Ridge, Linear Regression Elastic Net, Polinomial Regression Lasso, Polinomial Regression Ridge e Polinomial Regression Elastic Net
  • Métricas de performance: R2, MSE, RMSE, MAE e MAPE
  • Algoritmos de agrupamento: K-Means e Affinity Propagation
  • Métricas de performance: Silhouette Score

Desenvolvimento de um Painel Gerencial para Negócio com o Stremlit

Neste projeto, foram aplicados conceitos de programação em Python, manipulação de dados, pensamento estratégico e lógica de negócios, aliados ao uso de ferramentas de desenvolvimento web como o Streamlit e o Github. O objetivo foi desenvolver um painel gerencial que apresentasse as principais métricas de uma empresa de marketplace de entrega de comida na Índia.

O produto final do projeto consistiu em um painel hospedado em um ambiente de nuvem, acessível por meio de um link web. Essa solução pode ser acessada por qualquer dispositivo conectado à internet, proporcionando uma visão consolidada e intuitiva das métricas essenciais para a gestão eficiente do negócio.

As ferramentas utilizadas foram:

  • Python
  • Jupyter Lab
  • Terminal
  • Streamlit
  • Streamlit Cloud
  • Github

Utilizando Machine Learning para Previsão de Inadimplência Empresarial

Este projeto, enfrentou o desafio das pequenas empresas brasileiras endividadas durante a pandemia. Utilizando dados do Banco Central, empregou-se o modelo XGBoost para prever a inadimplência

O Notebook Python resultante no GitHub fornece uma solução prática, permitindo instituições financeiras personalizar estratégias de crédito com base na probabilidade de inadimplência, contribuindo para uma gestão mais eficiente e informada.

As ferramentas utilizadas foram:

  • Python, Pandas, Numpy e Sweetviz
  • Anaconda e Jupyter Notebook
  • Mapas interativos com Seaborn
  • Machine Learn com ScikitLearn
  • Github

Portfolio de Projetos - Data Science na Pratica Sigmoidal

Neste espaço, apresento minhas habilidades de resolução de problemas de negócio utilizando conceitos e ferramentas da Ciência de Dados.

Para isso, realizo projetos com dados públicos, aplicando técnicas de coleta, limpeza, exploração e análise de dados, bem como algoritmos de aprendizado de máquina.

A Ciência de Dados e o machine learning são áreas em constante crescimento e evolução, e estar sempre atualizado é fundamental para poder extrair insights valiosos e tomar decisões baseadas em dados.

Por isso, estou sempre buscando aprender e aperfeiçoar minhas habilidades nestes campos, seja através de cursos online, participações em comunidades e troca de experiências com colegas.

Agora você poderá conferir alguns dos projetos que realizei, onde apliquei os conhecimentos adquiridos em Ciência de Dados e machine learning para resolver problemas de negócio de diferentes áreas.

  1. Análise de Dados do Airbnb de Lisboa
  • Neste relatório, faremos uma Análise de Dados da cidade de Lisboa, Portugal, buscando obter insights valiosos a partir dos dados brutos. Veremos o que eles podem nos revelar sobre a cidade e suas características únicas.
  • Neste projeto foram utilizadas as bibliotecas: Pandas, Matplotlib e Seaborn.
  1. Panorama do Covid-19 no Brasil
  • Projeto onde foi feito uma Análise de Dados para verificar o panorama do Covid-19 no Brasil utilizando dados públicos da Our World in Data, onde pudemos chegar a algumas conclusões.
  • Neste notebook foram utilizadas as bibliotecas: Pandas, Matplotlib, Seaborn e Numpy.
  1. Detecção de Fraudes em Cartãoo de Crédito
  • Neste projeto, iremos abordar o problema das fraudes em cartões de crédito, utilizando algoritmos de Machine Learning visando inibir ou evitar transações fraudulentas.
  • Foram utilizadas as bibliotecas: Pandas, Matplotlib, Seaborn, Numpy e principalmente Scikit-Learn.
  1. Churn Prediction para uma empresa de telecomunicações
  • Neste projeto, iremos abordar o problema cancelamentos de planos, utilizando algoritmos de Machine Learning visando reduzir a quantidade de cancelamentos.
  • Foram utilizadas as bibliotecas: Pandas, Matplotlib, Seaborn, Numpy e principalmente Scikit-Learn.
  1. Previsão de custo de Seguro de Vida
  • Neste projeto, iremos abordar o problema de previsão de valor de um seguro de vida, utilizando algoritmos de Machine Learning visando raumentar o faturamento da empresa, cobrando o valor correto pelo seguro do cliente.
  • Foram utilizadas as bibliotecas: Pandas, Matplotlib, Seaborn, Numpy e PyCaret
  1. Classificação de risco gestacional utilizando PyCaret
  • Este projeto tem como objetivo classificar a saúde gestacional para prevenir a mortalidade infantil e materna, utilizando a bilbioteca PyCaret.
  • Foram utilizadas as bibliotecas: Pandas, Matplotlib, Seaborn, Numpy e PyCaret

Sinta-se à vontade para entrar em contato:

Email: emersonfab06@gmail.com