segunda-feira, 7 de dezembro de 2015

Perguntas frequentes em bioestatística #10. Como determinar o tamanho da amostra?



Miguel Patrício e Francisco Caramelo



Um dos aspectos importantes no desenho de um estudo estatístico (de carácter não meramente exploratório) é a determinação do tamanho da amostra, habitualmente denotado por n. Este número deverá ser tal que seja possível, a partir dos dados recolhidos no estudo, responder de forma cabal à questão de investigação. A escolha de uma amostra demasiado grande, em contextos clínicos, é geralmente pouco ética e demasiado onerosa em tempo e dinheiro. Por outro lado, uma amostra demasiado pequena também implica desperdício de recursos, pois o estudo não responderá de forma convincente à questão de investigação colocada. Corre-se nesse caso o risco, tratando-se de um estudo reportado num artigo, do mesmo ser rejeitado por não ter potência estatística suficiente; tratando-se de uma proposta de projecto submetida a financiamento, poderá ser rejeitada pela mesma razão. 

Antes de discutir como pode ser efectuado o cálculo do tamanho da amostra para um estudo, é importante estabelecer uma distinção entre significância estatística e significância clínica. Tomemos para tanto o exemplo da comparação entre a diminuição do inchaço entre sujeitos que utilizaram uma pomada A e outros que usaram uma pomada B. As médias de uma medida da diminuição do inchaço podem ser comparadas directamente entre os dois grupos sujeitos a tratamentos (A e B). Contudo, esta informação circunscreve-se à amostra e as conclusões apenas são válidas para aquele conjunto de pessoas. O fabricante da pomada com pior desempenho poderia sempre contrapor que o resultado observado se deve ao acaso e que apenas se verifica naquela amostra. Para contrariar este argumento legítimo recorre-se a um teste estatístico, que consegue avaliar qual é a probabilidade das diferenças observadas entre tratamentos serem reais e não se deverem apenas a mero acaso. O valor-p resultante do teste é, neste contexto, uma medida dessa probabilidade, tendo-se significância estatística (i.e., rejeitando-se a hipótese do acaso) quando o valor-p é menor do que um limiar pré-estabelecido (p<α), tipicamente 5% (α=0.05). O valor-p nada exprime sobre as magnitudes das diferenças: se o tratamento A for apenas marginalmente superior ao B, a atribuição de uma chancela estatística à diferença não obvia a pouca relevância do achado.  Diria o fabricante de B que a diferença para a outra pomada é tão pequena que ninguém seria capaz de notar. Por outras palavras, pode-se ter um resultado estatisticamente significativo mas este não ser clinicamente significativo – neste caso, a conclusão é que as diferenças encontradas entre os tratamentos não são apenas válidas para a amostra mas para toda a população, sendo porém irrelevantes. O contrário também pode suceder: encontrarem-se entre grupos da amostra diferenças médias clinicamente muito significativas mas estas não serem generalizáveis por ser válido o argumento do mero acaso da amostra, que é o mesmo que dizer não haver significância estatística. Citando a este propósito um estatístico americano, Gene Glass: “Statistical significance is the least interesting thing about the results. You should describe the results in terms of measures of magnitude –not just, does a treatment affect people, but how much does it affect them”, [1].

Tendo este prelúdio em conta, há ainda várias questões que têm de ser respondidas para se poder determinar o tamanho de uma amostra:

  • Qual é o teste estatístico que mais directamente responde à questão do estudo?
  • Qual é o nível de significância desejado?
  • Qual é a potência exigida para o teste?
  • Qual é o menor efeito que se deseja conseguir detectar?

Relativamente à escolha do teste estatístico, recorde-se que o ponto de partida no desenho de um estudo estatístico é a definição da questão de investigação e a escolha de uma medida como sendo a principal. Tendo estes pontos bem claros será fácil, na maioria dos casos, indicar-se qual é o teste estatístico que mais directamente responde à questão de investigação. Quando esta escolha do teste é difícil, parecendo haver vários com igual importância, será aconselhável fazer-se uma opção por um único teste, tendo por guia a questão de investigação.

O nível de significância, usualmente denotado por α, define quão disponível se está para cometer erros do tipo I, i.e., acidentalmente rejeitar a hipótese nula quando esta é verdadeira. Note-se que num processo de inferência estatística (em que dos dados amostrais se retiram conclusões relativas à população), é impossível assegurar que não se cometem erros. Aquilo que se pode fazer é escolher qual a força que tem de ter o nível da evidência (observada na amostra) para se aceitar uma inferência. No exemplo da comparação entre os dois tratamentos, cometer um erro do tipo I seria concluir que  haveria diferenças entre as eficácias das pomadas A e B quando na verdade não existem. O valor de α é usado como limiar (limite máximo) para o valor-p, que exprime a força da evidência estatística: quando menor o valor-p, mais forte esta é. Na interpretação dos resultados de um teste estatístico, tendo-se p<α rejeita-se a hipótese nula. Tipicamente, α=0.05, embora haja situações em que se poderá escolher outros valores para α. 

Tomando novamente como exemplo a comparação da eficácia entre dois tratamentos (duas pomadas), há sempre a possibilidade de cometermos o erro de não concluir que há diferenças quando de facto as há. Este erro é expresso numericamente por b e denominado por erro tipo II. Já a potência, 1-b, de um teste mede a sua capacidade de rejeitar a hipótese nula quando esta não é de facto verdadeira. O que se pretende de um teste é que tenha uma potência o mais elevada possível, sendo o limiar mínimo aceitável para a potência usualmente definido como 80%. A potência de um teste cresce com o tamanho da amostra, o que é natural: amostras grandes mais facilmente demonstrarão a existência de diferenças (quando de facto existem). 

Finalmente, o tamanho do efeito (em inglês, effect size) mede a magnitude de um fenómeno e existem várias fórmulas para o calcular. É equivalente afirmar que existe uma diferença grande entre tratamentos ou que o effect size é grande. O cálculo do tamanho do efeito é tipicamente baseado em dados preliminares, estudos anteriores publicados na literatura ou educated guesses (suposições abalizadas). Por exemplo, ao realizar um teste de comparação de médias entre duas amostras independentes, o effect size depende não apenas da média mas também do desvio-padrão de cada grupo. Na prática, mesmo que os grupos difiram muito em média, sendo os respectivos desvios-padrão muito elevados, o efeito será pequeno. Já diferindo pouco em média mas havendo muito pouca variabilidade dentro de cada grupo, o efeito será grande. Exemplificando, se se espera que fazer dieta irá permitir ao grupo de pessoas A (sem exercício físico) diminuir a massa gorda num ano em 15% (±DP=2%) e ao grupo B (com exercício físico) uma diminuição da massa gorda em 20% (±DP=2%), o tamanho do efeito pode neste caso fazendo aproximações razoáveis ser determinado pelo quociente entre a diferença das médias e o desvio padrão comum a ambos os grupos: (20-15)/2=2.5. O resultado obtido tem no caso apresentado o significado de número de desvios padrão, ou seja, o tamanho do efeito é de 2.5 desvios padrão. Há diferentes fórmulas para calcular o effect size, dependendo da situação em concreto. Em todo o caso, ao fazer-se um cálculo do tamanho da amostra, terá de se indicar qual o menor tamanho do efeito que ainda corresponde a uma diferença clinicamente significativa.

O cálculo do tamanho amostral será efectuado de forma a que se consiga que o teste estatístico que mais directamente responde à questão de investigação consiga, com a potência definida, ser capaz de detectar o tamanho de efeito determinado, ao nível de significância escolhido. Sobra então a questão de como efectuar o cálculo do tamanho do efeito e do tamanho amostral. Existem vários programas que permitem fazer este cálculo, como o Gpower [2-4], o PS [5] ou o NCSS [6], entre outros [7]. Os dois primeiros são gratuitos, o último oferece um período de teste (free trial). 

Ao apresentar os resultados do cálculo do tamanho amostral, além de se apresentar o tamanho amostral resultante também devem ser indicadas as escolhas efectuadas que levaram ao número apurado. Em particular, deverá explicitar-se quais são o teste estatístico considerado, o nível de significância, a potência e o effect size, justificando a escolha deste último. Deverá ainda indicar-se a fórmula de cálculo ou o software utilizado.

Finalmente, note-se que o raciocínio exposto acima aplica-se ao cálculo a priori do tamanho da amostra. Uma vez um estudo realizado, é possível efectuar o cálculo da potência que se obteve (post hoc). É usual considerar-se que estudos com potência inferior a 80% não têm potência estatística suficiente (em inglês, um estudo assim é dito underpowered), correndo o risco de não serem bem aceites.

  FAQ:

1- Nalgumas situações, a escolha do teste estatístico depende da normalidade dos dados quantitativos, que não é conhecida a priori. Devem ser considerados testes paramétricos ou não paramétricos?



Na maioria dos casos é possível assumir que os valores que a variável quantitativa toma são normalmente distribuídos na população em estudo (ou, querendo comparar-se entre grupos, em cada grupo da população). Quando há razões para acreditar que esta hipótese não é razoável, pode-se calcular o tamanho da amostra para um teste não paramétrico.

2- Que acontece quando não é possível conseguir-se ter um tamanho de amostra como o calculado?



Há diversos factores, como custo, tempo ou mesmo disponibilidade de sujeitos, que podem condicionar o número de elementos que na prática uma amostra poderá ter. Porém, estes factores não são considerados no cálculo do tamanho que a amostra precisa de ter. Se não é possível atingir este número, há duas possibilidades para além da implementação de um estudo multicêntrico. A primeira passa por tentar diminuir a variabilidade dentro de cada grupo, eventualmente escolhendo grupos mais homogéneos ou escolhendo uma medida mais adequada. Estas escolhas irão repercurtir-se no tamanho amostral, que deverá ser recalculado considerando as mesmas. Se nem assim for possível, na prática, ter uma amostra do tamanho calculado, é aconselhável não prosseguir com o estudo. Não há interesse em realizar um estudo inconclusivo, que não permite responder à questão de investigação. De facto, deve-se evitar entrar num círculo vicioso em que se justifica a não obtenção de significância estatística com o tamanho amostral, ver Figura 1.
 


Figura 1. Círculo vicioso em que se fica satisfeito com a obtenção de significância estatística e se justifica a não obtenção da mesma com o tamanho da amostra, sugerindo a repetição do estudo. Este procedimento leva a que haja um enviezamento na literatura, pois mais facilmente se publicam resultados falsos positivos.

3- Os possíveis desistentes num estudo devem ser incluídos no cálculo do tamanho da amostra?



Sim. Os desistentes (dropouts) devem ser tidos em consideração. Se existe informação que num dado centro é usual ter uma percentagem de 5% de participantes no estudo que acabam por o abandonar, o tamanho da amostra deve estar “inflacionado” desta taxa por forma a manter a garantia de potência que se pretende atingir.

4- Como fazer se não for possível escolher um único teste que se dirá que responde mais directamente à questão de investigação?



Nem sempre esta escolha é fácil. Há quem defenda que deverá ainda assim ser feita uma escolha por um único teste, assumindo-se as consequências da escolha nos objectivos do estudo. Uma alternativa a que alguns investigadores recorrem é considerar os vários testes que mais directamente respondem à questão de investigação e fazer o cálculo da amostra para cada um. Disto resultarão várias estimativas para o tamanho amostral, entre as quais será necessário escolher. Não há uma regra categórica para esta escolha. Uma possibilidade será escolher o menor tamanho amostral calculado para que haja significância estatística em pelo menos um dos testes. Outra será escolher o maior dos tamanhos amostrais calculados, para se ter potência estatística para qualquer um dos testes. Nalguns casos, opta-se por um compromisso entre estes dois cenários. Como exemplo, consideremos uma situação em que se pretende estudar a eficácia de três tratamentos para uma mesma doença, não sendo possível eleger um dos tratamentos como preferencial devido a outros factores. Poderá ser defensável fazer o cálculo do tamanho da amostra tendo em conta três testes, um por tratamento. Para cada um dos testes, será calculado o tamanho mínimo da amostra que permitirá detectar-se com significância estatística se há um efeito clinicamente significativo. Destes três números que se obtêm, fará então sentido tomar-se como tamanho da amostra o maior entre eles.
 


[1] G. Sullivan, R. Feinn, UsingEffect Size—or Why the P Value Is Not Enough. Journal of Graduate Medical Education, 4 (3) 279-282, 2012
[7] E. McCrum-Gardner, Sample size and power calculations madesimple. International Journal of Therapy and Rehabilitation, 17:10-14, 2010


Na próxima edição do Perguntas Frequentes em Bioestatística: “Como apresentar dados obtidos num estudo clínico?”


segunda-feira, 16 de novembro de 2015

Inquérito sobre hábitos tabágicos


Os estudantes mais novos, com idades compreendidas entre os 12 e os 13 anos, são "os que mais relatam ter começado a fumar na escola, sendo a tendência maior nas raparigas", concluiu um estudo sobre hábitos tabágicos em meio escolar, afirma a Universidade de Coimbra (UC), numa nota hoje divulgada. 

De acordo com a investigação, "a grande maioria (79%) de estudantes não fuma" e, entre os 21% de fumadores, "cerca de metade (10,2%) fá-lo regularmente, consumindo em média meio maço de cigarros por dia".

Desenvolvido pela delegação em Coimbra da Fundação Portuguesa do Pulmão (FPP) e pelo Laboratório de Bioestatística e Informática Médica (LBIM) da Faculdade de Medicina da UC (FMUC), o estudo envolveu 3.289 alunos (1.584 do sexo masculino e 1.705 do sexo feminino) do terceiro ciclo do ensino básico (7º, 8º e 9º anos de escolaridade)e do ensino secundário (10º, 11º e 12º anos) de vinte escolas do concelho de Coimbra.

Os resultados do inquérito, aprovado pelo Ministério da Educação e Ciência, que também avalia o conhecimento dos alunos relativamente à relação entre doenças pulmonares e o tabaco, vão ser apresentados terça-feira, 17 de novembro, às 17:30, na delegação da FPP em Coimbra, no âmbito da III Semana do Pulmão.

As conclusões da pesquisa alertam, designadamente, para "a necessidade de se apostar em campanhas de sensibilização nas escolas sobre os malefícios do tabaco" e de "sensibilizar os pais para esta realidade, dado que a maioria dos alunos fumadores (51,9%) diz que os pais fumam em casa", salienta João Rui de Almeida, presidente da FPP em Coimbra.

"Este estudo revela ainda que é nas escolas que os alunos mais jovens (12-13 anos) começam a fumar", adverte aquele responsável.

Francisco Caramelo, coordenador da equipa do LBIM* que realizou a análise dos dados, sublinhou, por seu lado, o facto de se observar nestes alunos "um padrão de crescimento do número de fumadores com a idade".

O fenómeno significa que "existe um efeito cumulativo, ou seja, quem começa a fumar dificilmente deixa de o fazer, e a probabilidade de fumar aumenta cerca de 1,5 vezes por cada ano", adiantou Francisco Caramelo.

A maioria dos alunos fumadores (51,9%) refere ter familiares na sua residência que fumam, mas esta percentagem desce (para 40, 6%) no caso dos não fumadores, notando-se que há "uma grande prevalência de alunos fumadores passivos".

Embora a generalidade dos alunos (95,8%) afirma ter consciência dos malefícios do tabaco, só 57,9% dos fumadores revelou que gostaria de deixar de fumar, refere a nota da UC.

* [Nota: Bárbara Oliveiros, Marisa Loureiro e Miguel Patrício]

quarta-feira, 4 de novembro de 2015

Perguntas frequentes em bioestatística #9. Que aspectos estatísticos se deve ter em conta para desenhar um projecto de investigação?

Miguel Patrício e Francisco Caramelo
 
A investigação científica é, em termos práticos, realizada com base em projectos que combinados podem levar a uma alteração do paradigma científico, o que tende a acontecer por acumulação sucessiva de conhecimento. O sucesso de um projecto científico pode ser medido pela consistência e clareza das suas conclusões e estas dependem grandemente da forma como este é construído. Infelizmente, os projectos tendem a ser avaliados relativamente à sua ambição, por vezes em desprimor do que realmente atingem, levando frequentemente a construções pouco produtivas ou mesmo estéreis [1]. A elaboração de um projecto de investigação é pensada muitas vezes de forma imediatista a partir de problemas que surgem num qualquer estudo prévio, sem haver a devida e atempada ponderação que garanta resultados efectivamente úteis. Estes constrangimentos podem porém ser mitigados se se partir do conhecimento dos diferentes elementos que concorrem para a arquitectura de um estudo antes de se o propôr.

Apesar de existirem inúmeros cambiantes para a estrutura de um estudo de investigação, é possível identificar alguns elementos em comum e sobre cuja importância interessa reflectir. Um dos aspectos primordiais é a questão de investigação, a qual constitui o real motivo do estudo. Note-se que esta é uma faceta primordial, no sentido de originária, primitiva, pelo que imprime desde logo, ou não, relevância face ao paradigma científico. A questão de investigação é então objecto de análise e a forma de a encarar dá origem a diferentes tipos de estudo. Existem várias taxonomias relativas a tipos de estudo, sendo geralmente aceite que a variável tempo e a intervenção do observador conduzem a diferentes planos de investigação. Esta ideia encontra-se expressa na figura seguinte.


Figura 1 – Tipo de estudos de investigação [2].

A intervenção activa ou a inacção do investigador sobre o objecto de estudo determina dois tipos de estudos diferentes: estudo experimental e estudo observacional. No primeiro caso (estudo experimental) o investigador tem um papel activo impondo, criando, escolhendo e controlando condições diferentes que determinam a constituição de grupos visando algum tipo de comparação entre estes. Já num estudo observacional, o investigador limita-se a contemplar de forma organizada e quantitativa a realidade com que se depara. Embora se diga que o observador permanece inactivo, tal não é completamente correcto uma vez que existe sempre selecção dos dados. A forma de selecção das observações é assim um ponto verdadeiramente determinante para a credibilidade das conclusões, uma vez que os critérios de inclusão e exclusão das observações podem produzir vieses desmesurados. Esta é uma razão para que muitas vezes este tipo de estudos seja desconsiderado relativamente aos estudos experimentais. No entanto, recorrendo a técnicas validadas de selecção (e.g., aleatorização) as conclusões são igualmente legítimas, tendo a vantagem de serem estudos menos onerosos – e frequentemente mais exequíveis - do que os experimentais.

A variável tempo pode ser considerada activamente, quando existem comparações de variáveis medidas em diferentes pontos do tempo. Pode, ao invés, não ser considerada no caso em que as comparações são realizadas numa mesma janela temporal, de forma independente do tempo. No primeiro caso, denominam-se frequentemente os estudos por longitudinais (alternativamente, temporais) e, no segundo, por transversais (alternativamente, seccionais). Este tipo de divisão tem particular importância prática, impactando em aspectos como a inserção de dados numa base de dados ou o tamanho amostral.

Nos estudos longitudinais o sentido temporal – do presente para o passado ou do presente para o futuro –, dá origem a duas classificações distintas: estudos retrospectivos e prospectivos, respectivamente. 

Cada área (por exemplo, a epidemiologia) tem especificidades próprias pelo que, naturalmente, os estudos de investigação apresentam uma estrutura adequada à mesma. Ainda assim, estes contêm as variáveis anteriormente discutidas, como se pode depreender do esquema seguinte onde se apresentam diferentes tipos de estudos epidemiológicos:



Figura 2 – Tipo de estudos epidemiológicos [3].

Um tipo de estudo com particular interesse na área da saúde são os ensaios clínicos, que têm particularidades estreitamente ligadas ao acto médico que se reflectem em diferentes pontos do projecto. São disto exemplo conceitos como a fase de um ensaio clínico (I, II, III ou IV), as hipóteses de investigação (equivalência, superioridade e não inferioridade) ou as estruturas de comparação (por exemplo, paralelo, cruzado, em cluster). Estes aspectos determinam os objectivos, os métodos estatísticos e o tipo de conclusão a que é possível chegar. A aleatorização e os diferentes métodos de a realizar ganham singular importância nos ensaios clínicos, na medida em que a intenção de tratamento se encontra intrinsecamente presente. Estes e outros aspectos revestem-se de grande interesse mas ultrapassam largamente o âmbito do presente documento, não podendo ser aqui explorados com a profundidade adequada.

O nome dado ao tipo de estudo a realizar apenas define alguns aspectos formais do mesmo. É a procura de resposta à questão de investigação que enforma o estudo científico concomitante, comportando os seguintes elementos essenciais: a medida principal, a população, a amostragem e o tamanho da amostra. Demasiadas vezes a atenção do investigador foca-se no tamanho amostral sem compreender que o número de elementos da amostra é fundamentalmente determinado pelas características da medida principal. Neste sentido, para o cálculo do tamanho amostral, a medida julgada principal num estudo é única e deve ser definida a priori, tendo em conta algumas características. Em particular, deve ser avaliada sem vieses em todos os elementos do estudo, ser precisa e exacta e contribuir para que se atinja a potência estatística adoptada.

Note-se que os estudos são geralmente realizados tendo por base uma amostra mas com o intuito de obter conclusões válidas para a população. É, assim, de extrema importância saber qual é a população sobre a qual se está a tirar conclusões.  Apenas depois da definição da população é possível delinear uma estratégia de amostragem. É crucial que esta seja de boa qualidade, pois as técnicas estatísticas que permitem a generalização do que se observa na amostra para uma população em nada ajudam no caso da amostra se encontrar enviesada (uma expressão tipicamente usada para descrever os resultados de um estudo mal planeado é Garbage In Garbage Out). 

Finalmente, um aspecto que deve ser pensado e discutido na elaboração de um desenho de estudo são os instrumentos de medida. Estes traduzem uma realidade mensurável numa quantidade. Por exemplo, a intensidade de luz pode ser medida por um dispositivo electrónico que transforma a luz em corrente eléctrica. Esta última é comparada com uma referência, permitindo a sua tradução numa quantidade (genericamente estes dispositivos electrónicos costumam designar-se por transdutores). Não havendo instrumentos de medida perfeitos, as medidas resultantes destes últimos não são livres de erros. 

Também num estudo estatístico, os resultados obtidos são uma representação da realidade, apresentando erros de qualidades diferentes. Deverão distinguir-se erros sistemáticos de erros acidentais. Os primeiros estão usualmente associados a calibrações deficientes, fazendo com que o erro da medida mantenha a sua grandeza independentemente das condições de medida. Diz-se neste caso que a medida não é exacta, uma vez que se afasta do valor real. Porém, detectando-se este erro e havendo a possibilidade do mesmo ser medido, pode introduzir-se uma correcção ao instrumento de medida. Os erros acidentais ou aleatórios têm uma natureza estocástica cuja dispersão é associada à precisão do instrumento de medida. Desta forma, um instrumento preciso produz medidas consecutivas muito próximas entre si. Ou, dito de outra forma, um instrumento preciso apresenta uma grande reprodutibilidade. Estes erros, não sendo passíveis de serem evitados, podem ser controlados aumentando o número de medidas.

A noção de resolução de um instrumento de medida também deve ser tida em conta pelo investigador no momento da comparação entre grupos. A resolução pode ser aplicada a qualquer natureza de sinal que esteja a ser medido, consubstanciando-se na capacidade de discriminar dois sinais que estejam próximos entre si. Um exemplo exagerado seria a tentativa de discriminar dois pontos à distância de 1 mm com recurso a instrumento cuja resolução fosse de 1 mm. A mensagem central é que deve ser conhecido (ou pelo menos estimado) o tamanho do efeito que se prevê encontrar e, para isso, usar um instrumento de medida com uma resolução adequada.


[2] Eurotrials, 3Aª, Pedro Aguiar, Catarina Silva, Filipa Chaves, 2005
[3] http://pt.slideshare.net/FClinico/tipos-de-estudos-epidemiolgicos-26672507

Na próxima edição do Perguntas Frequentes em Bioestatística: “Como determinar o tamanho da amostra?”



Como gerar dados aleatoriamente com Excel

A necessidade de gerar aleatoriamente bases de dados surge quer no ensino da Bioestatística quer em estudos de simulação. O ponto de partida é o conhecimento das variáveis que se querem criar, definido-se:
  • Para cada variável qualitativa - quais são as possíveis categorias que a variável pode tomar, expressas por números. Por exemplo, para uma variável "grupo" que exprima o estado de saúde, as categorias poderão ser 1=Controlo e 2=Paciente.
  • Para cada variável quantitativa, qual é o valor mínimo e máximo que a mesma pode tomar. Por exemplo, para uma variável "idade" que exprima o número de anos de vida de um sujeito do estudo, poderemos definir como mínimo 0 anos e máximo 120 anos.
Tomemos como exemplo uma base de dados em que temos dois grupos (variável "grupo": 1=Controlo, 2=Paciente). Para cada sujeito regista-se a sua idade (variável "idade", que para o estudo assumimos estar compreendida entre 35 e 45 anos) e a sua frequência cardíaca (variável "freq", que para o estudo assumimos estar compreendida entre 60 e 100 batimentos por minuto). A base de dados a preencher (gerar aleatoriamente) terá o seguinte aspecto:


A geração da variável grupo é simples. Basta definir quantos controlos saudáveis (grupo=1) se quer ter na base de dados e quantos pacientes (grupo=2) se pretende inserir. Para este exemplo, considerarmos ter 14 controlos saudáveis e apenas 9 pacientes.


Relativamente à variável idade, iremos recorrer à função do Excel RANDBETWEEN(., .) - ou, em português, ALEATÓRIOENTRE(.; .). Esta é uma função que gera números aleatoriamente. Funciona de uma forma muito simples. Escrevendo numa célula do Excel "=RANDBETWEEN(35, 45)", este irá gerar números inteiros entre 35 e 45:


Procedendo como na animação em cima, as idades são geradas de forma igual para doentes e controlos. Suponhamos que relativamente às frequências cardíacas se espera que os doentes tenham valores elevados (entre 70 e 120 batimentos por minutos) quando comparados com os controlos (entre 60 e 100 batimentos por minuto). Nesse caso, deverá usar-se a função RANDBETWEEN(60, 100) para gerar dados de controlos e RANDBETWEEN(70, 120) para gerar dados de doentes:


 Notas:
  • Podem-se ainda querer acrescentar-se valores fora dos intervalos definidos para um ou dois sujeitos (acrescentando valores atípicos ou outliers). Tal poderá ser feito manualmente: após a geração de dados para a variável, alguns destes poderão ser substituídos como se entender. Por exemplo, poderemos querer considerar um controlo com frequência cardíaca reduzida (36 batimentos por minuto) e um paciente com frequência cardíaca alta (140 batimentos por minuto):
  •  Suponhamos que queríamos ser muito precisos na idade. Em vez de números inteiros entre 35 e 45, queríamos números com uma casa decimal. Nesse caso, basta usar a função "RANDBETWEEN(350, 450)/10":

  • A função RANDBETWEEN(., .) gera números uniformemente distribuídos. Podemos ainda querer gerar números normalmente distribuídos. Tal é possível com a função NORMINV(RAND(), ., .) - em português, INV.NORMAL(ALEATÓRIO(); .; .). Por exemplo, escrevendo numa célula "=NORMINV(RAND(), 10, 1)" e arrastando para gerar novos números, estes serão gerados seguindo uma distribuição normal com média 10 e desvio padrão 1.
  •  Cada vez que há mudanças à base de dados, os números aleatórios são gerados de novo.