Sobre mim

Meu nome é Karina Ferreira

Atualmente atuo como analista de dados, onde minha principal função é auxiliar e desenvolver análises e aplicações de modelos. No momento estou em transição de carreira para Ciência de dados, sendo que minha formação inicial é de bióloga e sou doutoranda em ecologia.
Atuei por quase 10 anos na área acadêmica, que me deram experiências com escrita de artigos científicos e projetos, orientação de alunos, coleta e tratamentamento de dados. Além disso, tenho experiência com a solução de problemas usando ferramentas de análise de dados. Procuro uma oportunidade de trabalhar profissionalmente como Cientista de Dados para melhorar a tomada de decisão da empresa, através da construção de soluções usando dados.

Habilidades

Linguagem de programação e banco de dados

  • Python com foco em análise de dados
  • R com foco em análise de dados
  • SQL para extração de dados
  • PostgreSQL e SQLite Databases
  • Estatística e Machine Learning

  • Regressão e classificação
  • Machine Learning(Scikit-learn)
  • Estatística descritiva
  • Métodos estatísticos básicos (correlação parcial e simples, modelo lineares, ANOVA, ANCOVA)
  • Estatísticas multivariadas (PCA, PcoA, NMDS, RDA, CAP)
  • Modelos Lineares Generalizados (GLM), Modelos Lineares Mistos Generalizados (GLMM)
  • Análise de dados espaciais
  • Pacotes: Pandas, numpy, Matplotlib, Seaborn, Sklearn, Flask, Vegan, ggplot2

  • Visualização de dados

  • Matplotlib, Seaborn e Plotly
  • Engenharia de Software

  • Git, Github, Virtual Environment
  • Streamlit
  • Cloud Heroku
  • Experiências

    Projetos completos em Ciências de Dados

    Contrução de soluções de dados para problemas de negócios, próximos dos desafios reais das empresas, utilizando dados públicos de competições de Ciência de Dados. Abordei o problema desde a concepção do desafio do negócio até a publicação do algoritmo treinado em produção utilizando ferramentas de cloud computing.

    Cientista de dados na Comunidade DS (2022 - atual)

    A comunidade DS é uma instituição de ensino e aprendizado que proporciona um ambiente com desenvolvimento de projetos , próximos dos reais, e o ensino de ferramentas para resolução de problemas de negócios.

    Doutorado em Ecologia em andamento (2019 - 2023)

    Busco entender como espécies de plantas da família Rubiaceae influenciam o funcionamento do ecossistema e respondem a eventos de seca. O estudo é realizado em um fragmento de Mata Atlântica, considerado um dos 35 hotspots globais com prioridade para conservação. Utilizei linguagem de programação R e Python, e análises multivariadas.

    Mestrado em Ecologia de Ecossistemas (2017 - 2019)

    Avaliei os padrões de distribuição espacial de espécies filogeneticamente próximas na Mata Atlântica. Utilizei linguagem de programação R, análises espaciais e estatística descritiva.

    Graduação em Biologia (2012 - 2017)

    Em meu trabalho de conclusão de curso (TCC, em 2016), identifiquei as relações entre o dossel florestal e atributos químicos do solo em um fragmento de Floresta Atlântica no sudeste brasileiro. Utilizei linguagem de programação R, estatística descritiva e análises multivariadas (RDA e PCA).

    Projetos em Ciência de dados

    Clustering Projetc

    A Análise da Personalidade do Cliente é uma análise detalhada dos clientes ideais de uma empresa. Ela ajuda uma empresa a entender melhor seus clientes e facilita a modificação de produtos de acordo com as necessidades, comportamentos e preocupações específicas de diferentes tipos de clientes. Aqui, em vez de gastar dinheiro para comercializar um novo produto para cada cliente no banco de dados da empresa, uma empresa pode analisar qual segmento de cliente tem maior probabilidade de comprar o produto e, então, comercializar o produto apenas naquele segmento específico.

    Health Insurance Projetc

    A Health insurance é uma seguradora que fornece seguro de saúde aos seus clientes, e agora busca vender um seguro de veículo. Um pesquisa então foi realizada com os clientes, que compraram o seguro saúde no ano passado, perguntando a cada um se teria interesse em adquirir o novo seguro. A seguradoda obteve retorno de 304 mil clientes sobre o interesse em adquirir um seguro veicular. O novo seguro foi desenvolvido, e está sendo ofertado aos interessados. Existem mais 76 mil clientes, entre novos e antigos, que não responderam a pesquisa. Entretanto, o call center, tem a capacidade de conter apenas alguns clientes. Assim a seguradora deve escolher uma forma de selecionar para quais clientes deve ligar. A equipe de vendas pode fazer um total de 20.000 chamadas, mas pode aumentar para 40.000. Levando em conta o problema apresentado, o cientista de dados (usando machine learning) deve fornecer uma lista ordenada desses novos clientes com base em em sua pontuação de propensão de comprar o novo seguro.

    Projeto Rossmann

    A Rossmann é uma das maiores redes de drogarias e perfumarias da Europa que opera em mais de 3.000 lojas em 7 países europeus. As vendas da Rossmann podem ser ifluenciadas por promoções, competição, feriados escolares e estaduais, sazonalidade, localidade, entre outros. Este projeto de Data Science tem como objetivo resolver a questão a seguir exigida pelo CEO da Rossmann: Qual a previsão de vendas das próximas seis semanas para cada loja, a fim de determinar a melhor alocação de recursos para cada renovação das lojas? Para responder ao CEO o método CRISP foi utilizado incluindo alguns modelos de Machine Learning.

    House rocket project

    A House Rocket é uma empresa fictícia que utiliza a tecnologia para tomar decisões de compra e venda de imóveis. Este projeto de Ciência de Dados tem como objetivo encontrar as melhores oportunidades de negócio para maximizar o faturamento da empresa. A melhor estratégia é a compra de casas em ótimas condições por baixos preços e a venda desses imóveis por um preço superior. Nesse projeto o cientista de dados deve obter insights através da manipulação de dados para auxiliar as melhores decisões da equipe de negócios.

    Contato

    Obrigada por ler este portifólio de projeto! Sinta-se à vontade para entrar em contato!!