Skip to content

andriusdc/Case-Estabelecimentos

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Case-Estabelecimentos

Análise e tratamento de dados de estabelecimentos cadastrados no portal da Receita Federal.

Arquivo escolhido: Dados Abertos CNPJ ESTABELECIMENTO 01 (disponível em: https://www.gov.br/receitafederal/pt-br/assuntos/orientacao-tributaria/cadastros/consultas/dados-publicos-cnpj)

Arquivo auxiliar : Tabela de atributo Município

Arquivos na pasta Código:

1-Pipeline exec.ipynb Jupyter Notebook com carregamento de dados e chamada da pipeline de tratamento dos dados

2- Pipeline.py Arquivo com definições das funções utilizadas na pipeline

Outputs:

  1. Arquivos CSV:
    • Finais.csv :

      Porcentagem Ativos : Porcentagem de empresas ativas ( Situação Cadastral ). Resposta item 4a do desafio Total < 5km : Total de empresas que se localizam dentro de um raio de 5km do CEP 01422000. Resposta item 4c

    • TabelaAno.csv :

      Total de empresas do setor de restaurantes que foram abertas em cada ano. reposta item 4b

    • TabelaCNAE.csv :

      Tabela de correlação de CNAE Primario (Cnae1) e CNAE Secundário (Cnae 2). A coluna 'total' informa quantas ocorrências de cada cobinação de CNAE existem. Resposta item 4d

  2. Arquivo Excel TabelaFinal.xlsx dividido em sheets. Agrega todos os resultados dos arquivos CSV em um unico arquivo Excel:
    • DadosAtivos:

      Resultados referentes ao arquivo Finais.csv

    • TabelaAno:

      Resultados referentes ao arquivo TabelaAno.csv

    • TabelaCNAE :

      Resultados referentes ao arquivo TabelaCNAE.csv

Observações:

  • O tempo necessário para a aplicação da pipeline ao arquivo de dados completo é marjoritariamente dominado pela etapa de geocode, uma vez que o provedor gratuito utilizado permite apenas uma query de endereço por segundo. Para minimizar esse tempo, foi filtrado os endereços a serem consultados por uma lista de CEP's próximos ao local alvo. Também foi utilizado apenas nomes de logradouros únicos.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published