sexta-feira, 12 de dezembro de 2014

Perguntas frequentes em bioestatística #2. Qual é a população no meu estudo? E a amostra?



A seguinte mensagem é a segunda comunicação da série Perguntas Frequentes em Bioestatística, da autoria de membros do Laboratório de Bioestatística e Informática Médica da Faculdade de Medicina da Universidade de Coimbra. Pretende-se fomentar uma discussão sobre as melhores práticas estatísticas na área da saúde.






Perguntas frequentes em bioestatística #2. Qual é a população no meu estudo? E a amostra?
Francisco Caramelo e Miguel Patrício




O desenho de um estudo pode ser encarado como a definição de um conjunto de fatores. Tendo como ponto de partida uma questão de investigação bem formulada, deverão tornar-se claros, entre outros, aspectos como qual é a população a ser estudada, como deve ser escolhida a amostra ou qual a “main outcome measure” (variável principal) a medir ou observar. Relembramos que na comunicação anterior havíamos focado a questão “Que dados se deverá recolher para fazer uma análise estatística?”. Pretendemos na presente comunicação discutir a definição de população e de amostra, bem como a relação entre as duas. 

Os itens da lista de elementos a definir na fase de desenho do estudo não são independentes entre si, existindo conexões que devem ser tidas em conta. Em particular, a definição da variável principal é crucial para o cálculo do tamanho da amostra. Por outro lado, a definição da população restringe a amostra. Pode-se pensar em população como sendo o grupo de pessoas – ou animais ou outros objectos, consoante o estudo - para o qual quereremos aplicar as conclusões do nosso estudo e para o qual pensamos virem estas a ser válidas. Nem todos os elementos da população estarão necessariamente disponíveis para participar no estudo, sendo a sua disponibilidade afectada por diversos factores - geográficos, éticos ou outros. Assim, é usual distinguir-se população alvo de população acessível, sendo esta última um subconjunto da primeira, para a qual por sua vez quereremos tirar conclusões. Como exemplo de uma população alvo podemos considerar os consumidores habituais de café residentes em Portugal e como população acessível os clientes de uma cadeia de estabelecimentos de restauração que colabora no estudo.

Para além de população alvo e população acessível, deverá ainda definir-se o conceito de amostra. Nem todas as pessoas pertencentes à população acessível participarão no estudo. Designa-se este último subgrupo que participa no estudo como a amostra. Assume-se então que as conclusões que se venham a tirar no estudo a partir da amostra deverão ser válidas para a população alvo. A validade deste processo carece de alguns requisitos e alguns cuidados que devem ser tidos em conta. Desde logo a forma como é escolhida a amostra tem um papel de grande relevância. É também nesta fase que devem ser definidos os critérios de inclusão e exclusão, os quais devem ser norteados pela representatividade da amostra. Ou seja, pela capacidade das conclusões retiradas serem válidas para a população definida.

FAQ:

1-     Como escolher a amostra?
Existem várias técnicas de amostragem sendo genericamente divididas em métodos probabilísticos e não probabilísticos. Um método probabilístico é tal que cada um dos seus sujeitos apresenta uma probabilidade finita não nula de ser escolhido e esta probabilidade é determinável. Este método produz amostras não enviesadas que representam os traços presentes na população. Já um método não probabilístico é tal que existem elementos com probabilidade nula de serem escolhidos. Assim, neste caso são produzidos vieses de exclusão colocando balizas nas extrapolações que se podem fazer a partir da amostra.

2-     Quão grande deve ser a amostra?
A dimensão da amostra é determinada para a questão principal e partindo do conhecimento de alguns parâmetros que dependem da natureza da questão, mas que geralmente envolvem o tamanho do efeito e a dispersão nas medidas. Este valor é calculado caso a caso usando expressões estabelecidas. Por facilidade, é usual recorrer a programas computacionais.

Na próxima edição do Perguntas Frequentes em Bioestatística: “Como estruturar os dados para análise estatística?”
 

Sem comentários:

Publicar um comentário