Matemáticas

Calculadora de desviación estándar

¿Cuál es la desviación estándar y la varianza de estos datos?

Por Equipo Calculika · EditorActualizado:

Sepáralos con comas, puntos y coma, espacios o saltos de línea.

Tipo de datos
Insertar

Copia este código y pégalo en tu sitio:

<iframe src="https://calculika.com/co/desviacion-estandar/?embed=1" width="100%" height="540" style="border:0;border-radius:12px" loading="lazy" title="Calculadora de desviación estándar y varianza"></iframe>

Gratis para uso personal y educativo. Para uso comercial, consulta nuestras condiciones de uso.

Actualizado

Concepto

¿Qué son la desviación estándar y la varianza?

Calcula la desviación estándar, la varianza y la media de un conjunto de datos, eligiendo si se trata de toda la población o solo de una muestra. La desviación estándar mide cuánto se separan los datos de su media: un valor pequeño indica datos muy agrupados y uno grande, datos muy dispersos. La varianza es su cuadrado. Estas medidas de dispersión completan a la media: dos conjuntos pueden tener la misma media y, sin embargo, comportarse de forma muy distinta.

Método

¿Cómo se calcula la desviación estándar?

Varianza = Σ(x − media)² / n · Desviación estándar = √varianza · muestra: divide entre n − 1
  1. Escribe los datos separados por comas, espacios o saltos de línea, y elige población o muestra.
  2. Calcula la media (suma de todos los valores dividida entre la cantidad).
  3. Resta la media a cada dato, eleva cada diferencia al cuadrado y suma todos esos cuadrados.
  4. Divide esa suma entre n (población) o entre n − 1 (muestra) para obtener la varianza; su raíz cuadrada es la desviación estándar.

¿Por qué este resultado?

  1. Tipopoblación (n)
  2. Cantidad de datos (n)8
  3. MediaΣx ÷ n = 40 ÷ 85
  4. Suma de cuadrados de las diferenciasΣ(x − media)²32
  5. Varianza32 ÷ 84
  6. Desviación estándar√varianza2

Casos

Ejemplos resueltos de desviación estándar

  1. Colombia

    Notas de un grupo (población)

    Tienes las notas de los 8 alumnos de un grupo: 2, 4, 4, 4, 5, 5, 7 y 9. La media es (2+4+4+4+5+5+7+9)/8 = 5. La suma de los cuadrados de las diferencias es (9+1+1+1+0+0+4+16)/8 = 4, que es la varianza de población. La desviación estándar es la raíz de 4, es decir 2.

  2. Colombia

    Muestra frente a población

    Para el conjunto 1, 2, 3, 4 y 5 la media es (1+2+3+4+5)/5 = 3 y la suma de cuadrados es 4+1+0+1+4 = 10. Como población, divides entre 5 y obtienes una varianza de 2; como muestra, divides entre 4 (n − 1) y la varianza sale algo mayor. La diferencia importa cuando hay pocos datos.

  3. Colombia

    Misma media, distinta dispersión

    El conjunto 7, 7, 7 tiene desviación estándar 0: todos los datos son iguales. En cambio, 4, 7, 10 tiene la misma media 7 pero su varianza de población es (9+0+9)/3 = 6, así que está mucho más disperso. La media sola no distingue estos dos casos; la desviación estándar sí.

Referencia

Tabla de ejemplos de dispersión

DatosMediaVarianzaDesviación
7, 7, 7700
2, 4, 4, 4, 5, 5, 7, 9542
4, 7, 1076√6
10, 20, 3020200/3√(200/3)

Aplicaciones

¿Para qué sirve la desviación estándar?

  • Comparar la dispersión de dos grupos con la misma media.
  • Controlar la calidad de un proceso (cuánto varían las medidas respecto al objetivo).
  • Analizar notas, sueldos o tiempos para ver si son homogéneos o muy desiguales.
  • Calcular la base de muchas pruebas estadísticas y del cálculo de errores.
  • Estimar el riesgo o la volatilidad de una serie de valores.
  • Resumir un conjunto de datos junto con la media en informes y trabajos escolares.

Dudas

Preguntas frecuentes sobre desviación estándar y varianza

¿Cuál es la diferencia entre población y muestra?

La población son TODOS los elementos que te interesan; la muestra es solo una parte tomada de esa población. Si tienes los datos completos, usa la fórmula de población (dividir entre n). Si tus datos son una muestra con la que quieres estimar la población entera, usa la de muestra (dividir entre n − 1).

¿Qué es la desviación estándar?

Es una medida de cuánto se alejan los datos de su media, expresada en las mismas unidades que los datos. Si la media de unas notas es 7 y la desviación estándar es 1, la mayoría de las notas están aproximadamente entre 6 y 8. Cuanto mayor es, más dispersos están los datos.

¿Qué es la varianza?

Es el promedio de los cuadrados de las diferencias respecto a la media, es decir, la desviación estándar elevada al cuadrado. Mide la misma dispersión, pero en unidades al cuadrado, por lo que suele ser menos intuitiva que la desviación estándar para interpretar resultados.

¿Por qué en la muestra se divide entre n − 1?

Es la corrección de Bessel. Una muestra tiende a estar más agrupada que la población completa, así que dividir entre n subestimaría la dispersión real. Dividir entre n − 1 corrige ese sesgo y da una mejor estimación de la varianza de la población a partir de la muestra.

¿Cuándo uso muestra y cuándo población?

Usa población cuando tienes absolutamente todos los datos del grupo (por ejemplo, las notas de TODOS los alumnos de una clase). Usa muestra cuando solo tienes una parte y quieres sacar conclusiones sobre el total (por ejemplo, una encuesta a 100 personas para estimar a toda una ciudad).

¿Qué significa una desviación estándar de cero?

Que todos los datos son iguales: no hay ninguna dispersión. Por ejemplo, el conjunto formado por 7, 7 y 7 tiene media 7 y desviación estándar 0, porque ningún valor se separa de la media.

¿Por qué se elevan al cuadrado las diferencias?

Para que las diferencias positivas y negativas no se cancelen entre sí (la suma de las diferencias respecto a la media siempre es cero) y para penalizar más los valores muy alejados. Al final se toma la raíz cuadrada para volver a las unidades originales en la desviación estándar.

¿La desviación estándar se ve afectada por los valores extremos?

Sí, bastante. Como las diferencias se elevan al cuadrado, un solo dato muy alejado de la media puede aumentar mucho la desviación estándar. Por eso conviene mirarla junto con la media y la mediana para entender bien la forma de los datos.

¿Qué relación tiene con la media?

La media indica el centro de los datos y la desviación estándar indica cuánto se alejan de ese centro. Son complementarias: para describir un conjunto con una sola cifra se usa la media, pero para saber si esa media es representativa hace falta la desviación estándar.

Sigue explorando

Calculadoras relacionadas

Lectura

Artículos relacionados