Uma aplicação web interativa para Análise Exploratória de Dados (EDA) automatizada, construída com Gradio e potencializada pelo Google Gemini. Esta ferramenta permite que usuários façam upload de qualquer arquivo CSV e obtenham insights através de relatórios textuais e perguntas em linguagem natural que podem gerar gráficos dinamicamente.
Acesse a Aplicação Online Aqui
- Upload Genérico de CSV: Carrega qualquer arquivo CSV, tratando automaticamente diferentes delimitadores (
,,;,|, etc.), múltiplas codificações de caracteres (utf-8,latin1) e limpando nomes de colunas complexos. - Análise Completa (Apenas Texto): Gera um relatório textual inicial com estatísticas descritivas e análise de valores nulos sobre uma amostra dos dados, ideal para um primeiro diagnóstico rápido.
- Perguntas Específicas com Gráficos: Permite que o usuário faça perguntas em linguagem natural. O agente é capaz de interpretar pedidos de visualização e gerar dinamicamente histogramas, boxplots e gráficos de dispersão.
- Interface Intuitiva: Apresenta respostas e gráficos lado a lado e inclui uma função para "Limpar Sessão", permitindo que o usuário reinicie a análise com um novo arquivo de forma fluida e sem precisar recarregar a página.
Este projeto utiliza uma arquitetura híbrida "Python como Analista, Agente como Curador":
- Backend (Python): Executa toda a manipulação de dados com
Pandase a geração de gráficos comMatplotlib/Seaborn. - Agente (Google Gemini): Atua como o "cérebro" da operação, interpretando as perguntas do usuário em linguagem natural, planejando as ações (como qual gráfico gerar) e gerando relatórios e respostas textuais.
- Interface:
Gradio. - Orquestração do Agente:
Agno Framework.
- Acesse a aba "📁 Carregar Dataset".
- Selecione um arquivo
.csvdo seu computador. Importante: Aguarde o upload completar 100% antes de clicar em "📊 Carregar e Analisar". - Para um relatório textual inicial, vá para a aba "🔍 Análise Completa".
- Para investigações detalhadas e geração de gráficos, vá para "❓ Perguntas Específicas" e digite seu pedido (ex: "crie um boxplot para a coluna 'Idade'").
- Os gráficos gerados aparecerão na galeria ao lado. Clique nos gráficos para expandi-los.
- Para começar de novo, clique em "🧹 Limpar Sessão e Iniciar Nova Análise" na primeira aba.
-
Clone o repositório:
git clone [https://github.com/ericfloriano/processon_challenge.git] cd [NOME_DA_PASTA] -
Crie e ative um ambiente virtual:
python3 -m venv .venv source .venv/bin/activate -
Instale as dependências:
pip install -r requirements.txt
-
Configure sua chave de API:
- Crie um arquivo chamado
.envna raiz do projeto. - Adicione a seguinte linha, substituindo pela sua chave:
GOOGLE_API_KEY=sua_chave_google_aqui
- Crie um arquivo chamado
-
Execute a aplicação:
python app.py
A aplicação estará disponível em
http://localhost:7860.