Coleta de Dados — Consolidação
Esta é a aba de consolidação e deduplicação do painel de Coleta de Dados (Etapa 3). Aqui o sistema unifica todos os documentos coletados — das bases automáticas e das importações manuais — em uma base única, removendo os registros duplicados de forma automática.
Sobre este painel: A Etapa 3 tem três abas — Coleta Automática, Bases Manuais e Consolidação (esta tela). Após concluir as coletas, execute a consolidação para deduplicar os documentos e poder avançar para a etapa de critérios. Com apenas 1 documento a consolidação é dispensável; com 0 documentos não é possível avançar.
📸 Clique para ver a aba de Consolidação

O que você pode fazer nesta tela?
- Executar a consolidação para unificar e deduplicar todos os documentos da sua coleta.
- Acompanhar o progresso em tempo real pelo terminal de log e pela barra de progresso.
- Visualizar o funil de deduplicação, que mostra quantos documentos foram removidos em cada camada.
- Consultar análises de distribuição por ano, autores mais prolíficos e principais periódicos.
- Enriquecer os documentos com dados do DOI (recurso premium) para completar metadados ausentes.
- Finalizar e ir para Critérios quando estiver satisfeito com a base consolidada.
Elementos da Interface
| Elemento | O que é / Para que serve | Observações Importantes |
|---|---|---|
| Painel de regras "Smart Merge" | Exibe as cinco regras de mesclagem inteligente que serão aplicadas durante a consolidação: Título/Resumo, Autores, Ano, Citações e Links. | As regras são aplicadas automaticamente — não é necessário configurá-las manualmente. |
| Botão "Executar Consolidação" | Inicia o processo de deduplicação e unificação dos documentos. | Bloqueado se o total de documentos exceder o limite do seu plano. |
| Botão "Enriquecimento (DOI)" | Complementa metadados ausentes consultando informações públicas de cada DOI. | Recurso premium. Disponível após a consolidação. |
| Botão "Limpar Consolidação" | Desfaz a consolidação e volta ao estado pré-consolidado. | Recurso premium. Pede confirmação antes de executar. |
| Barra de progresso | Mostra o andamento da consolidação nas fases: ANÁLISE → ENRIQUECIMENTO → CONCLUÍDO [X/Y documentos]. | Atualizada em tempo real via evento do sistema. |
| Terminal Log | Exibe as mensagens detalhadas de cada etapa do processamento, com rolagem automática. | Útil para entender o que o sistema está fazendo e diagnosticar situações inesperadas. |
| Aba "Funil" | Gráfico de funil que mostra o total coletado e quantos documentos foram removidos em cada camada de deduplicação. | Disponível após executar a consolidação. Exportável como PNG ou SVG. |
| Aba "Tabela" | Tabela de estatísticas dos documentos consolidados por base e por expressão. | Disponível após a consolidação. |
| Aba "Análises" | Gráficos de distribuição por ano de publicação, ranking dos 20 documentos mais citados, autores mais frequentes e principais periódicos. | Disponível após a consolidação. |
| Botão "Finalizar e Ir para Critérios" | Registra a etapa como concluída e avança para a definição de critérios de inclusão/exclusão. | A habilitação depende do número de documentos: com 2 ou mais é preciso consolidar primeiro; com 1 documento fica liberado direto; com 0 documentos fica bloqueado. |
Cenários de Erro e Estados Especiais
O botão "Executar Consolidação" está bloqueado — limite de documentos atingido
📸 Ver aviso de limite de documentos

Cada plano tem um limite máximo de documentos que podem ser consolidados em uma única rodada. Se o total de documentos coletados ultrapassar esse limite, a consolidação não pode iniciar.
- O que fazer: Revise suas expressões de busca ou os filtros de data para reduzir o volume de documentos coletados, ou consulte a página de Planos e Perfis para ampliar seu limite.
O botão "Finalizar e Ir para Critérios" está desabilitado
A habilitação depende de quantos documentos existem na sua coleta:
- Nenhum documento (0): o botão fica bloqueado — não há o que enviar para os critérios. Volte às abas de coleta e colete ou importe documentos.
- Apenas 1 documento: o botão fica liberado direto. Com um único documento não há o que deduplicar, então a consolidação é dispensável.
- 2 ou mais documentos: é necessário executar a consolidação primeiro (para remover as duplicatas) antes de o botão liberar.
Passando o mouse sobre o botão desabilitado, o sistema mostra o motivo. (Da mesma forma, a consolidação não roda se não houver nenhum documento.)
- O que fazer: com 2+ documentos, clique em "Executar Consolidação" e aguarde concluir; com 0, volte e colete ou importe documentos primeiro.
A consolidação terminou, mas os números parecem diferentes do esperado
A deduplicação é automática e pode remover um volume maior de documentos do que você antecipava, especialmente quando as mesmas referências aparecem em múltiplas bases ou expressões. O funil mostra exatamente onde cada documento foi removido.
- O que fazer: Abra a aba "Funil" para ver quantos documentos foram removidos em cada camada e por qual critério. Se quiser inspecionar os documentos brutos antes e depois da consolidação, use o Visualizador de Coleção (recurso premium).
Comportamentos Automáticos
- Progresso em tempo real: O terminal de log e a barra de progresso são atualizados automaticamente durante a execução — você não precisa recarregar a tela.
- Liberação das abas de análise: Assim que a consolidação é concluída, as abas Funil, Tabela e Análises são desbloqueadas automaticamente.
- Confirmação antes de limpar: Ao acionar "Limpar Consolidação" (premium), o sistema pede confirmação antes de desfazer o processo — protegendo contra limpezas acidentais.
Como as informações são processadas?
Deduplicação automática em 4 camadas
A deduplicação é totalmente automática — o sistema identifica e remove duplicatas sem necessidade de revisão manual de pares. O processo percorre quatro camadas em sequência, do critério mais preciso ao mais flexível:
| Camada | Critério | Como funciona |
|---|---|---|
| 1 — DOI idêntico | DOI exato | Se dois documentos têm o mesmo DOI, um é removido. É o critério mais confiável. |
| 2 — Impressão digital de conteúdo | Título + Resumo normalizados (hash) | O sistema remove acentos e caracteres especiais do título e do resumo, gera uma "impressão digital" e compara. Documentos com texto idêntico mas formatação diferente são detectados aqui. |
| 3 — Título + Resumo direto | Título e resumo sem normalização | Comparação direta para casos que passaram pelas camadas anteriores. |
| 4 — Título + Ano (fallback) | Título e ano de publicação | Usado quando o resumo está ausente. Menos preciso, mas evita duplicatas óbvias. |
O funil de consolidação exibe quantos documentos foram removidos em cada camada, tornando o processo rastreável e documentável — o que é importante para relatórios metodológicos no formato PRISMA.
Enriquecimento por DOI (premium)
Após a consolidação, o enriquecimento consulta bases públicas de dados bibliográficos usando o DOI de cada documento para preencher campos ausentes (como resumo, autores completos, afiliações e citações). Isso melhora a qualidade dos metadados disponíveis para a triagem e a análise.
Fluxo de Passos
- Certifique-se de que a coleta está concluída — tanto a automática (aba Coleta) quanto a manual (aba Bases Manuais), se aplicável.
- Acesse a aba "Consolidação" dentro do painel de Coleta de Dados.
- Verifique o painel de regras Smart Merge para entender os critérios que serão aplicados.
- Clique em "Executar Consolidação" e acompanhe o progresso pelo terminal de log e pela barra de progresso.
- Aguarde o status CONCLUÍDO. As abas Funil, Tabela e Análises serão desbloqueadas automaticamente.
- Revise o funil de deduplicação para entender quantos documentos foram removidos e por qual critério.
- (Opcional, premium) Clique em "Enriquecimento (DOI)" para complementar os metadados dos documentos consolidados.
- Clique em "Finalizar e Ir para Critérios" para avançar para a etapa de definição de critérios de inclusão e exclusão.