Medidas de Tendência Central em Bioestatística

Medidas de Tendência Central em Bioestatística: Entendendo Média, Mediana e Moda

Tipos de Variáveis

Antes de explorar as medidas de tendência central, é importante entender os tipos de variáveis que encontramos em bioestatística: quantitativas e qualitativas. As variáveis quantitativas são numéricas e representam quantidades mensuráveis, como altura, pressão arterial ou número de consultas médicas. Elas podem ser contínuas (valores em uma escala infinita, como 165,2 cm) ou discretas (valores específicos, como 3 consultas). Já as variáveis qualitativas são categóricas e descrevem características, não quantidades. Elas se dividem em nominais (sem ordem, como tipo sanguíneo: A, B, AB, O) e ordinais (com ordem, como nível de dor: leve, moderado, grave). Essa distinção é essencial, pois o tipo de variável determina quais medidas de tendência central podemos usar.

O que são Medidas de Tendência Central?

As medidas de tendência central são valores que representam o “centro” de um conjunto de dados. Elas condensam grandes quantidades de informações em um único número, facilitando a análise e a comparação entre grupos ou condições. As três principais medidas são:

  • Média: A soma de todos os valores dividida pelo número de observações.

  • Mediana: O valor que separa o conjunto em duas partes iguais, com 50% dos dados abaixo e 50% acima.

  • Moda: O valor mais frequente no conjunto.


Média: A Medida Mais Comum

A média é amplamente usada em pesquisas médicas por sua simplicidade e facilidade de cálculo, especialmente para variáveis quantitativas contínuas ou discretas. Por exemplo, em um estudo sobre níveis de colesterol em pacientes com doenças cardiovasculares, a média pode indicar o valor típico do grupo. Ela é calculada assim:

\[\bar{x} = \frac{\sum x_i}{n}\]

Onde:

  • \(\bar{x}\) é a média.
  • \(n\) é o número total de observações.
  • \(x_i\) são os valores individuais.
  • \(\sum x_i\) é a soma desses valores.

Vantagens:

  • Considera todos os valores do conjunto.

  • Fácil de calcular e interpretar.

  • Ideal para dados com distribuição normal (simétrica, em forma de sino, como a “curva de Gauss”).

Desvantagens:

  • Sensível a valores extremos (outliers). Por exemplo, um paciente com colesterol excepcionalmente alto pode inflar a média, distorcendo o resultado.

  • Menos eficaz para dados assimétricos.

Exemplo Prático:

Imagine 10 observações, todas com valor 10 (média = 10). Se alterarmos a última para 11, a nova média será 10,1. Em um conjunto com \(n\) observações, uma mudança de 1 unidade em um valor altera a média em \(1/n\). Essa sensibilidade torna a média útil em cálculos matemáticos, mas vulnerável a distorções.

Quando Usar:

A média é ideal para variáveis quantitativas simétricas, sem outliers, como em estudos com dados contínuos em grandes populações seguindo uma distribuição normal. Curiosidade: na década de 1980, a média de salário inicial de formados em Geografia na Universidade da Carolina do Norte era a mais alta — provavelmente por causa de Michael Jordan!


Mediana: A Medida Robusta

A mediana é preferida para variáveis quantitativas quando os dados são assimétricos ou têm outliers. Por exemplo, em pesquisas sobre tempo de sobrevivência de pacientes com câncer, ela é mais representativa, já que alguns indivíduos podem viver muito mais que a maioria, criando uma distribuição desigual. Para variáveis qualitativas ordinais (como nível de dor), a mediana também pode ser usada, indicando a categoria central.

Vantagens:

  • Não é afetada por valores extremos.

  • Melhor para dados assimétricos.

Desvantagens:

  • Ignora a magnitude dos valores, focando apenas na posição central.

  • Menos útil para análises estatísticas complexas.

Quando Usar:

A mediana é a escolha certa para estudos de sobrevivência, renda médica ou situações em que outliers possam distorcer os resultados de variáveis quantitativas. Para variáveis ordinais, ela destaca o ponto médio ordenado.


Moda: A Medida de Frequência

A moda é usada principalmente para variáveis qualitativas, nominais ou ordinais, e menos comum em variáveis quantitativas na pesquisa médica. Por exemplo, em estudos sobre tipos sanguíneos ou o antibiótico mais prescrito para uma doença, ela destaca a categoria mais comum.

Vantagens:

  • Ideal para dados categóricos ou nominais.

  • Simples de identificar em distribuições com picos claros.

Desvantagens:

  • Pode não existir (se todos os valores forem únicos) ou haver várias modas.

  • Não informa sobre a dispersão dos dados.

Quando Usar:

A moda é perfeita para variáveis qualitativas, como tipos de doenças ou preferências de tratamento, onde o objetivo é identificar o mais frequente.


Conclusão

  • Média: Use para variáveis quantitativas simétricas e sem outliers.

  • Mediana: Prefira em variáveis quantitativas assimétricas ou com valores extremos, ou em variáveis ordinais.

  • Moda: Aplique a variáveis qualitativas para identificar o mais frequente.

Cada medida tem seu lugar em bioestatística, dependendo do tipo de variável e do objetivo da análise. Escolher a certa é essencial para interpretar os resultados de forma precisa e útil.

Existem menções a esta nota nos seguintes artigos:

Nenhuma nota mencionou esse artigo ainda. 🤔