sexta-feira, 12 de dezembro de 2014

Perguntas frequentes em bioestatística #1. Que dados se deverá recolher para fazer uma análise estatística?



A seguinte mensagem é a primeira comunicação da série Perguntas Frequentes em Bioestatística, da autoria de membros do Laboratório de Bioestatística e Informática Médica da Faculdade de Medicina da Universidade de Coimbra. Pretende-se fomentar uma discussão sobre as melhores práticas estatísticas na área da saúde.




Perguntas frequentes em bioestatística #1. Que dados se deverá recolher para fazer uma análise estatística?
Francisco Caramelo e Miguel Patrício
 
Uma análise estatística é sempre precedida de uma questão de investigação. Há algo que se quer estudar, eventualmente uma conjetura que se pretende comprovar. Exemplificando com uma questão simples, talvez se queira perceber se beber café preserva a inteligência.

O primeiro passo para abordar a questão de investigação é defini-la claramente, balizá-la, retirar-lhe ambiguidade. Queremos considerar todos os tipos de grão de café, ou só alguns? E como definimos inteligência? Deverá identificar-se uma medida principal (main outcome measure) a analisar. Esta reflectirá os objetivos estabelecidos na questão de investigação e aportará uma forma de quantificação objetiva. A medida principal depende, naturalmente, do tipo de estudo que se pretenda efetuar. No exemplo que propusemos, a medida principal poderá ser o QI mensurado por um determinado tipo de teste proposto na literatura. 

A definição da medida principal deve ser cuidada, uma vez que tem um peso enorme na estratégia de investigação. Em particular, é determinante no cálculo do  número de sujeitos a testar, no estabelecimento das medidas a efetuar e no protocolo da experiência. Se nada mais fosse medido além da “main outcome measure”, esta deveria ser suficiente para dar uma resposta à questão de investigação.

Tipicamente, num estudo não se obtém apenas uma variável. Para além da “main outcome measure” recolhem-se outros dados que ajudam à resposta da questão de investigação, genericamente designados por medidas secundárias (secondary outcome measures). As medidas secundárias são usadas para avaliar outros potenciais efeitos importantes, concorrentes para a hipótese primária. Podem ser variáveis que permitam ter uma avaliação mais completa da questão de investigação. Poderão eventualmente exprimir possíveis fatores condicionantes da relação beneficio/risco. No exemplo da associação entre café e QI, poderá ser relevante registar as idades e níveis de escolaridade dos participantes no estudo, que são elementos que poderão afetar os resultados nos testes de inteligência. Também podem ser recolhidos dados de variáveis associadas a segurança ou efeitos adversos. Ou variáveis medidas com o intuito de tentar perceber um mecanismo envolvido na questão de investigação. 

Paralelamente à definição clara de uma questão de investigação objetiva e relevante, a escolha da “main outcome measure” é um dos aspectos centrais de um estudo estatístico. Deverá ter-se em consideração alguns aspetos:

1.      A medida principal deve ser definida a priori, isto é, na fase de desenho do estudo que ocorre antes de se começar a coligir os dados. Quando a definição da medida principal é guiada pela observação dos dados serão produzidos vieses, falseando irremediavelmente as conclusões que se obtenham.

2.      O processo de medida associado à “main outcome measure” deve ser exato, preciso e de elevada confiabilidade, devendo ser aplicado uniformemente para todos os elementos do estudo. Em cada área do conhecimento, é preferível adoptar como medida principal algo aceite pela comunidade científica, evitando novas técnicas que ainda não foram completamente comprovadas.

3.      A medida principal deve ser independente dos elementos de estudo. A sua definição ou processo de medição não deverá ser adaptado aos diferentes subgrupos. 

4.      Considerações de potência devem ser tidas em conta, isto é, diferenças entre grupos e a variabilidade nos grupos.

FAQ:

1-     Quantas “main outcome measures” se devem considerar?
Deverá haver apenas uma medida principal, a qual deverá observar estritamente as qualidades discutidas anteriormente.

2-     Quantas secondary outcome measures se devem considerar?
As que contribuam para responder à questão de investigação de uma forma objetiva. Deverá ser-se o mais criterioso e parcimonioso possível na escolha de variáveis a incluir no estudo. Não incluir uma variável que seja importante para explicar os resultados prejudica a análise dos dados, pois faltarão fatores que permitam explicar os mesmos. Por outro lado, incluir variáveis inúteis ou pouco relevantes é contraproducente. De uma forma geral, quantos menos testes estatísticos forem realizados, mais robusta será a análise. Como regra prática a lembrar, quer-se sempre ter muito mais sujeitos no estudo que variáveis medidas. A inclusão de mais variáveis poderá obrigar também à inclusão de mais sujeitos.

3-     Qual deve ser o número de sujeitos a incluir na experiência?
Depende do tamanho do efeito (o qual depende das diferenças estimadas e a variabilidade nos grupos) que se pretende observar. Espera-se que beber café tenha um grande efeito? Então não são precisos muitos sujeitos. Espera-se que haja uma grande variabilidade nos resultados? Teremos então de incluir mais pessoas. Há formulas para calcular o “n” de uma experiência, mas o uso das mesmas depende do conhecimento (ou suposição de conhecimento) a priori de alguns elementos.

Na próxima edição do Perguntas Frequentes em Bioestatística: “Qual é a população no meu estudo? E a amostra?”

Sem comentários:

Publicar um comentário