Pular para o conteúdo principal

Fase 2 — Termos de Busca e Expressões

A definição dos termos de busca é o coração da estratégia de uma Revisão Sistemática da Literatura: é aqui que o vocabulário controlado da pesquisa (sinônimos, variações e termos relacionados de cada conceito) se transforma em lógica booleana executável contra as bases científicas. Uma escolha de termos malfeita não é corrigida depois — ela compromete a coleta inteira, seja por trazer ruído em excesso, seja por deixar evidência relevante de fora.

Por isso, esta fase exige equilibrar dois objetivos que tensionam entre si: sensibilidade (recall — não perder estudos relevantes, o que pede expressões mais abrangentes) e especificidade (precisão — não afogar a triagem em resultados irrelevantes, o que pede expressões mais restritivas). O Tykyra estrutura esse equilíbrio em dois passos sequenciais — Palavras-Chave e Expressões de Busca — que, juntos, produzem as strings finais que serão executadas na Fase 3 (Coleta).


Palavras-Chave e Grupos de Sinônimos

O primeiro passo é organizar o vocabulário da revisão em grupos de sinônimos: cada grupo reúne os termos e variações que representam um único conceito da pergunta de pesquisa (ex.: um grupo para a intervenção, outro para a população, outro para o desfecho — espelhando, na prática, os elementos PICO já registrados no Protocolo da Fase 1). Dentro de um grupo, qualquer um dos termos é aceito como equivalente; entre grupos, a busca depende da combinação booleana definida no passo seguinte.

No Tykyra, cada pesquisa admite até 10 grupos, com até 20 termos por grupo. Os termos são normalizados automaticamente (minúsculas, sem duplicatas) para evitar inconsistências, e uma lista de stopwords (com um conjunto científico padrão) filtra termos de baixo valor discriminativo que poderiam gerar ruído na busca. Para concluir esta etapa, é necessário ter pelo menos um termo em pelo menos um grupo — grupos deixados vazios são descartados ao salvar.

O Tykyra também oferece apoio à Mineração de Termos: o pesquisador pode indicar um diretório local de documentos (PDFs), respeitando o limite de upload manual do seu plano (ver Planos e Perfis de Acesso), e o sistema extrai os termos mais frequentes desses arquivos, com progresso acompanhado em tempo real e uma pontuação de similaridade em relação aos grupos já criados. Essa mineração é um recurso de apoio — útil para descobrir variações terminológicas que o pesquisador não tinha previsto —, mas a decisão de incorporar ou não cada termo sugerido permanece com o pesquisador.

A assertividade na escolha dos termos é decisiva — mais termos nem sempre significam uma busca melhor. Grupos e termos em excesso produzem expressões longas e complexas demais para algumas bases científicas, que podem rejeitá-las (erros de sintaxe ou de limite da base) ou retorná-las sem resultados. Por isso, uma boa prática antes de montar os grupos é fazer uma busca exploratória: levantar, em dissertações, teses e artigos já publicados sobre o tema, as palavras-chave que esses trabalhos efetivamente utilizam, e usá-las para orientar um conjunto enxuto, efetivo e eficiente de grupos de sinônimos — cobrindo os conceitos centrais da pergunta de pesquisa sem inflar a expressão a ponto de inviabilizar sua execução nas bases.

Tela correspondente: Palavras-Chave


Expressões de Busca (Lógica Booleana)

Com os grupos de sinônimos definidos, o segundo passo é combiná-los em uma ou mais expressões de busca. A lógica segue um padrão consolidado em revisões sistemáticas: dentro de cada grupo, os termos são unidos por OR (qualquer sinônimo serve); entre grupos, a combinação mais comum é o AND (a busca precisa atender a todos os conceitos), com NOT disponível para excluir termos indesejados e parênteses para controlar a precedência entre operadores.

No Tykyra, essa montagem é feita por um console de combinação lógica: o pesquisador seleciona grupos e operadores (AND, OR, NOT, parênteses) por meio de botões dedicados, e a expressão resultante é exibida em um campo de visualização. Essa montagem guiada — em vez de digitação livre — é uma decisão deliberada de produto. Mais do que reduzir o risco de erros de sintaxe (parênteses desbalanceados, operadores soltos) que poderiam gerar strings de busca inválidas sem que o pesquisador percebesse, ela mantém a lógica conceitual em um formato estruturado — o que permite que essa mesma lógica seja adaptada automaticamente para a sintaxe e a semântica corretas de cada base científica, exatamente o que a próxima seção (Tradução por Base de Dados) detalha.

Cada expressão criada é salva e contabilizada contra o limite de expressões do seu plano (ver Planos e Perfis de Acesso); para finalizar esta etapa e seguir para a Coleta, é necessário ter pelo menos uma expressão salva. O suporte a caracteres curinga (*) permite capturar variações morfológicas de um termo (plurais, sufixos) sem multiplicar manualmente as entradas do grupo.

Tela correspondente: Expressões de Busca


Tradução por Base de Dados

Cada base científica tem sua própria sintaxe de busca — e exigir que o pesquisador conheça e escreva manualmente cada uma delas é uma fonte comum de erro e de inconsistência entre bases em revisões sistemáticas. Por isso, o Tykyra traduz automaticamente a lógica booleana genérica montada no passo anterior para a sintaxe específica de cada base selecionada na Configuração (Fase 1), gerando uma string de busca dedicada por base.

Essa tradução cobre, por exemplo, a sintaxe de campo (título, resumo, palavras-chave) de bases como Scopus, Web of Science, PubMed e Science Direct, entre outras configuradas para a pesquisa, preservando os curingas e a estrutura lógica (grupos, AND/OR/NOT, parênteses) definida na expressão genérica. O resultado é um conjunto de strings prontas, uma por base, que o pesquisador pode revisar antes de avançar — garantindo que a mesma lógica conceitual seja aplicada de forma equivalente em todas as fontes.


Entradas, Processamento e Saídas

  • Entradas: conceitos e elementos da pergunta de pesquisa definidos na Fase 1 (objetivo, escopo, PICO); opcionalmente, um diretório de documentos locais para mineração de termos.
  • Processamento: agrupamento de sinônimos por conceito (com normalização e stopwords); combinação booleana dos grupos (AND/OR/NOT e parênteses) em expressões de busca; tradução automática de cada expressão para a sintaxe de cada base selecionada.
  • Saídas: expressões de busca validadas e suas respectivas strings por base, prontas para execução na Fase 3 (Coleta).

Decisões Metodológicas

DecisãoJustificativa
Usar OR dentro do grupo e AND entre gruposMaximizar a sensibilidade (recall) dentro de cada conceito, sem perder a interseção temática exigida pela pergunta de pesquisa
Montagem da expressão guiada por botões, sem digitação livre na caixa de lógicaReduzir erros de sintaxe booleana (parênteses desbalanceados, operadores soltos) que gerariam strings de busca inválidas sem aviso
Registrar todas as expressões e suas strings por baseGarantir rastreabilidade e reprodutibilidade da estratégia de busca, em linha com o relato exigido pelo PRISMA 2020

Próximos Passos

Com os grupos de sinônimos definidos e ao menos uma expressão de busca salva — já traduzida para a sintaxe de cada base configurada —, o pesquisador avança para a Fase 3 — Coleta, onde essas expressões são efetivamente executadas contra as bases científicas selecionadas na Configuração. Veja a visão geral das fases em Visão Geral da Metodologia e os pré-requisitos desta etapa em Fase 1 — Configuração.


Referências

Estratégias de busca bem documentadas e reproduzíveis — com os grupos de termos, a lógica booleana e as strings finais por base registradas de forma explícita — são um dos pilares de transparência metodológica cobrados tanto pelo PRISMA 2020 quanto pelo Cochrane Handbook, permitindo que terceiros auditem ou repliquem a busca a partir do relato publicado.