Pular para o conteúdo principal

Coleta de Dados — Consolidação

Esta é a aba de consolidação e deduplicação do painel de Coleta de Dados (Etapa 3). Aqui o sistema unifica todos os documentos coletados — das bases automáticas e das importações manuais — em uma base única, removendo os registros duplicados de forma automática.

Sobre este painel: A Etapa 3 tem três abas — Coleta Automática, Bases Manuais e Consolidação (esta tela). Após concluir as coletas, execute a consolidação para deduplicar os documentos e poder avançar para a etapa de critérios. Com apenas 1 documento a consolidação é dispensável; com 0 documentos não é possível avançar.

📸 Clique para ver a aba de Consolidação

Aba de Consolidação — painel de regras Smart Merge, botões de ação e terminal de progresso

O que você pode fazer nesta tela?

  • Executar a consolidação para unificar e deduplicar todos os documentos da sua coleta.
  • Acompanhar o progresso em tempo real pelo terminal de log e pela barra de progresso.
  • Visualizar o funil de deduplicação, que mostra quantos documentos foram removidos em cada camada.
  • Consultar análises de distribuição por ano, autores mais prolíficos e principais periódicos.
  • Enriquecer os documentos com dados do DOI (recurso premium) para completar metadados ausentes.
  • Finalizar e ir para Critérios quando estiver satisfeito com a base consolidada.

Elementos da Interface

ElementoO que é / Para que serveObservações Importantes
Painel de regras "Smart Merge"Exibe as cinco regras de mesclagem inteligente que serão aplicadas durante a consolidação: Título/Resumo, Autores, Ano, Citações e Links.As regras são aplicadas automaticamente — não é necessário configurá-las manualmente.
Botão "Executar Consolidação"Inicia o processo de deduplicação e unificação dos documentos.Bloqueado se o total de documentos exceder o limite do seu plano.
Botão "Enriquecimento (DOI)"Complementa metadados ausentes consultando informações públicas de cada DOI.Recurso premium. Disponível após a consolidação.
Botão "Limpar Consolidação"Desfaz a consolidação e volta ao estado pré-consolidado.Recurso premium. Pede confirmação antes de executar.
Barra de progressoMostra o andamento da consolidação nas fases: ANÁLISE → ENRIQUECIMENTO → CONCLUÍDO [X/Y documentos].Atualizada em tempo real via evento do sistema.
Terminal LogExibe as mensagens detalhadas de cada etapa do processamento, com rolagem automática.Útil para entender o que o sistema está fazendo e diagnosticar situações inesperadas.
Aba "Funil"Gráfico de funil que mostra o total coletado e quantos documentos foram removidos em cada camada de deduplicação.Disponível após executar a consolidação. Exportável como PNG ou SVG.
Aba "Tabela"Tabela de estatísticas dos documentos consolidados por base e por expressão.Disponível após a consolidação.
Aba "Análises"Gráficos de distribuição por ano de publicação, ranking dos 20 documentos mais citados, autores mais frequentes e principais periódicos.Disponível após a consolidação.
Botão "Finalizar e Ir para Critérios"Registra a etapa como concluída e avança para a definição de critérios de inclusão/exclusão.A habilitação depende do número de documentos: com 2 ou mais é preciso consolidar primeiro; com 1 documento fica liberado direto; com 0 documentos fica bloqueado.

Cenários de Erro e Estados Especiais

O botão "Executar Consolidação" está bloqueado — limite de documentos atingido

📸 Ver aviso de limite de documentos

Aviso de limite de documentos atingido na tela de consolidação

Cada plano tem um limite máximo de documentos que podem ser consolidados em uma única rodada. Se o total de documentos coletados ultrapassar esse limite, a consolidação não pode iniciar.

  • O que fazer: Revise suas expressões de busca ou os filtros de data para reduzir o volume de documentos coletados, ou consulte a página de Planos e Perfis para ampliar seu limite.

O botão "Finalizar e Ir para Critérios" está desabilitado

A habilitação depende de quantos documentos existem na sua coleta:

  • Nenhum documento (0): o botão fica bloqueado — não há o que enviar para os critérios. Volte às abas de coleta e colete ou importe documentos.
  • Apenas 1 documento: o botão fica liberado direto. Com um único documento não há o que deduplicar, então a consolidação é dispensável.
  • 2 ou mais documentos: é necessário executar a consolidação primeiro (para remover as duplicatas) antes de o botão liberar.

Passando o mouse sobre o botão desabilitado, o sistema mostra o motivo. (Da mesma forma, a consolidação não roda se não houver nenhum documento.)

  • O que fazer: com 2+ documentos, clique em "Executar Consolidação" e aguarde concluir; com 0, volte e colete ou importe documentos primeiro.

A consolidação terminou, mas os números parecem diferentes do esperado

A deduplicação é automática e pode remover um volume maior de documentos do que você antecipava, especialmente quando as mesmas referências aparecem em múltiplas bases ou expressões. O funil mostra exatamente onde cada documento foi removido.

  • O que fazer: Abra a aba "Funil" para ver quantos documentos foram removidos em cada camada e por qual critério. Se quiser inspecionar os documentos brutos antes e depois da consolidação, use o Visualizador de Coleção (recurso premium).

Comportamentos Automáticos

  • Progresso em tempo real: O terminal de log e a barra de progresso são atualizados automaticamente durante a execução — você não precisa recarregar a tela.
  • Liberação das abas de análise: Assim que a consolidação é concluída, as abas Funil, Tabela e Análises são desbloqueadas automaticamente.
  • Confirmação antes de limpar: Ao acionar "Limpar Consolidação" (premium), o sistema pede confirmação antes de desfazer o processo — protegendo contra limpezas acidentais.

Como as informações são processadas?

Deduplicação automática em 4 camadas

A deduplicação é totalmente automática — o sistema identifica e remove duplicatas sem necessidade de revisão manual de pares. O processo percorre quatro camadas em sequência, do critério mais preciso ao mais flexível:

CamadaCritérioComo funciona
1 — DOI idênticoDOI exatoSe dois documentos têm o mesmo DOI, um é removido. É o critério mais confiável.
2 — Impressão digital de conteúdoTítulo + Resumo normalizados (hash)O sistema remove acentos e caracteres especiais do título e do resumo, gera uma "impressão digital" e compara. Documentos com texto idêntico mas formatação diferente são detectados aqui.
3 — Título + Resumo diretoTítulo e resumo sem normalizaçãoComparação direta para casos que passaram pelas camadas anteriores.
4 — Título + Ano (fallback)Título e ano de publicaçãoUsado quando o resumo está ausente. Menos preciso, mas evita duplicatas óbvias.

O funil de consolidação exibe quantos documentos foram removidos em cada camada, tornando o processo rastreável e documentável — o que é importante para relatórios metodológicos no formato PRISMA.

Enriquecimento por DOI (premium)

Após a consolidação, o enriquecimento consulta bases públicas de dados bibliográficos usando o DOI de cada documento para preencher campos ausentes (como resumo, autores completos, afiliações e citações). Isso melhora a qualidade dos metadados disponíveis para a triagem e a análise.


Fluxo de Passos

  1. Certifique-se de que a coleta está concluída — tanto a automática (aba Coleta) quanto a manual (aba Bases Manuais), se aplicável.
  2. Acesse a aba "Consolidação" dentro do painel de Coleta de Dados.
  3. Verifique o painel de regras Smart Merge para entender os critérios que serão aplicados.
  4. Clique em "Executar Consolidação" e acompanhe o progresso pelo terminal de log e pela barra de progresso.
  5. Aguarde o status CONCLUÍDO. As abas Funil, Tabela e Análises serão desbloqueadas automaticamente.
  6. Revise o funil de deduplicação para entender quantos documentos foram removidos e por qual critério.
  7. (Opcional, premium) Clique em "Enriquecimento (DOI)" para complementar os metadados dos documentos consolidados.
  8. Clique em "Finalizar e Ir para Critérios" para avançar para a etapa de definição de critérios de inclusão e exclusão.