A seguinte mensagem é a primeira comunicação da série Perguntas
Frequentes em Bioestatística, da autoria de membros do Laboratório de
Bioestatística e Informática Médica da Faculdade de Medicina da Universidade de
Coimbra. Pretende-se fomentar uma discussão sobre as melhores práticas
estatísticas na área da saúde.
Perguntas frequentes em
bioestatística #1. Que
dados se deverá recolher para fazer uma análise estatística?
Francisco Caramelo e Miguel Patrício
Uma análise estatística é sempre precedida de uma questão de investigação.
Há algo que se quer estudar, eventualmente uma conjetura que se pretende
comprovar. Exemplificando com uma questão simples, talvez se queira perceber se
beber café preserva a inteligência.
O primeiro passo para abordar a questão de investigação é defini-la
claramente, balizá-la, retirar-lhe ambiguidade. Queremos considerar todos os
tipos de grão de café, ou só alguns? E como definimos inteligência? Deverá
identificar-se uma medida principal (main outcome measure) a analisar. Esta
reflectirá os objetivos estabelecidos na questão de investigação e aportará uma
forma de quantificação objetiva. A medida principal depende, naturalmente, do
tipo de estudo que se pretenda efetuar. No exemplo que propusemos, a medida
principal poderá ser o QI mensurado por um determinado tipo de teste proposto
na literatura.
A definição da medida principal deve ser cuidada, uma vez que tem um peso
enorme na estratégia de investigação. Em particular, é determinante no cálculo
do número de sujeitos a testar, no
estabelecimento das medidas a efetuar e no protocolo da experiência. Se nada
mais fosse medido além da “main outcome measure”, esta deveria ser suficiente
para dar uma resposta à questão de investigação.
Tipicamente, num estudo não se obtém apenas uma variável. Para além da “main
outcome measure” recolhem-se outros dados que ajudam à resposta da questão de
investigação, genericamente designados por medidas secundárias (secondary
outcome measures). As medidas secundárias são usadas para avaliar outros
potenciais efeitos importantes, concorrentes para a hipótese primária. Podem
ser variáveis que permitam ter uma avaliação mais completa da questão de
investigação. Poderão eventualmente exprimir possíveis fatores condicionantes
da relação beneficio/risco. No exemplo da associação entre café e QI, poderá
ser relevante registar as idades e níveis de escolaridade dos participantes no
estudo, que são elementos que poderão afetar os resultados nos testes de
inteligência. Também podem ser recolhidos dados de variáveis associadas a
segurança ou efeitos adversos. Ou variáveis medidas com o intuito de tentar
perceber um mecanismo envolvido na questão de investigação.
Paralelamente à definição clara de uma questão de investigação objetiva e
relevante, a escolha da “main outcome measure” é um dos aspectos centrais de um
estudo estatístico. Deverá ter-se em consideração alguns aspetos:
1.
A
medida principal deve ser definida a
priori, isto é, na fase de desenho do estudo que ocorre antes de se começar
a coligir os dados. Quando a definição da medida principal é guiada pela
observação dos dados serão produzidos vieses, falseando irremediavelmente as
conclusões que se obtenham.
2.
O
processo de medida associado à “main outcome measure” deve ser exato, preciso e
de elevada confiabilidade, devendo ser aplicado uniformemente para todos os
elementos do estudo. Em cada área do conhecimento, é preferível adoptar como
medida principal algo aceite pela comunidade científica, evitando novas
técnicas que ainda não foram completamente comprovadas.
3.
A
medida principal deve ser independente dos elementos de estudo. A sua definição
ou processo de medição não deverá ser adaptado aos diferentes subgrupos.
4.
Considerações
de potência devem ser tidas em conta, isto é, diferenças entre grupos e a
variabilidade nos grupos.
FAQ:
1-
Quantas
“main outcome measures” se devem considerar?
Deverá haver apenas uma medida principal, a qual deverá observar
estritamente as qualidades discutidas anteriormente.
2-
Quantas
secondary outcome measures se devem considerar?
As que contribuam para responder à questão de investigação de uma forma
objetiva. Deverá ser-se o mais criterioso e parcimonioso possível na escolha de
variáveis a incluir no estudo. Não incluir uma variável que seja importante
para explicar os resultados prejudica a análise dos dados, pois faltarão fatores
que permitam explicar os mesmos. Por outro lado, incluir variáveis inúteis ou
pouco relevantes é contraproducente. De uma forma geral, quantos menos testes
estatísticos forem realizados, mais robusta será a análise. Como regra prática a
lembrar, quer-se sempre ter muito mais sujeitos no estudo que variáveis
medidas. A inclusão de mais variáveis poderá obrigar também à inclusão de mais
sujeitos.
3-
Qual
deve ser o número de sujeitos a incluir na experiência?
Depende do tamanho do efeito (o qual depende das diferenças estimadas e a
variabilidade nos grupos) que se pretende observar. Espera-se que beber café
tenha um grande efeito? Então não são precisos muitos sujeitos. Espera-se que
haja uma grande variabilidade nos resultados? Teremos então de incluir mais
pessoas. Há formulas para calcular o “n” de uma experiência, mas o uso das
mesmas depende do conhecimento (ou suposição de conhecimento) a priori de alguns elementos.
Na próxima edição do Perguntas Frequentes em Bioestatística: “Qual é
a população no meu estudo? E a amostra?”