02 Apr
02Apr

PRUEBAS DE VARIABLES DE PROBABILIDAD (Chi cuadrada, Kolmogorov-Smirnov, Anderson Darling)

1.- Prueba Chi-cuadrada.

Se trates de una prueba de hipótesis a partir de datos, basada en el cálculo de un valor llamado estadístico de prueba, al cual suele comparársele con un valor cocido como valor crítico, mismo que se obtiene, generalmente, de tablas estadísticas.

El procedimiento general de la prueba es:

  • Obtener al menos 30 datos de la variable aleatoria a analizar
  • Calcular la media y varianza de los datos
  • Crear un histograma de m = intervalos, y obtener la frecuencia observada en cada intervalo 0i
  • Establecer explícitamente la hipótesis nula, proponiendo una distribución de probabilidad que se ajuste a la forma del histograma.
  • Calcular la frecuencia esperada, Ei a partir de la función de probabilidad propuesta
  • Calcular en estadístico de prueba:

  • Definir el nivel de significancia de la prueba, α, y determinar el valor crítico de la prueba, X2α,m-k-1 (k es el número de parámetros estimados en la distribución propuesta).
  • Comparar el estadístico de prueba con dl valor crítico. Si el estadístico de prueba es menor que el valor crítico no se puede rechazar la hipótesis nula

Ejemplo:

Chi cuadrada.xlsx

2.-Prueba de Kolmorogov-Smirnov

Esta prueba fue desarrollada en la década de los 30s del siglo xx y al igual que la prueba de chi-cuadrada sirve para determinar la distribución de probabilidad de una serie de datos.Tiene un limitante la cual es que solamente se puede aplicar al análisis de variables continuas.

Procedimiento paso a paso:

  • Obtener 30 datos de la variable aleatoria a analizar.
  • Calcular la media y la varianza de los datos.
  • Crear un histograma de (m = √ n ) intervalos, y obtener la frecuencia observada en cada intervalo Oi.
  • Calcular la probabilidad observada en cada intervalo PO= Oi/n, dividir la frecuencia observada Oentre el número total de datos n.
  • Acumular las probabilidades POpara obtener la probabilidad observada hasta el i-enésimo intervalo POAi.
  • Establecer la hipótesis nula con una distribución que se ajuste a la forma del histograma.
  • Calcular la probabilidad estimada acumulada para cada intervalo PEAi, a partir de la función de probabilidad propuesta
  • Calcular el estadístico de prueba ( C = max [ PEAi  - POA]   i = 1, 2, 3, …,k ).
  • Definir el nivel de significancia de la prueba α, y determinar el valor crítico de la prueba Dα,n.
  • Comparar el estadístico de prueba con el valor crítico, si el estadístico de prueba es menor que el valor crítico no se puede rechazar la hipótesis nula.

Ejemplo:

Kolmogrov.xlsx

3.- Prueba de Anderson Darling

Dada a conocer en 1954, esta prueba tiene como propósito corroborar si una muestra de variables aleatorias provienen de una población con una distribución de probabilidad específica. En realidad se trata de una modificación de la prueba de Kolmogorov-Smirnov, aunque tiene la virtud de detectar las discrepancias en los extremos de las distribuciones. La principal desventaja de la prueba de Anderson Darling estriba en que es necesario calcular los valores críticos para cada distribución. La prueba es muy sensible en los extremos de la distribución, por lo que debe ser usada con mucho cuidado en distribuciones con límite inferior acotado, y no es confiable para distribuciones de tipo discreto. Actualmente es posible encontrar tablas de valores críticos para las distribuciones normal, lognormal, exponencial, log-logística, de Weibull y valor extremo tipo I. El procedimiento general de la prueba es:

  • Obtener n datos de la variable aleatoria a analizar.
  • Calcular la media y la varianza de los datos.
  • Organizar los datos en forma ascendente: Yi       i=1,2,…,n
  • Ordenar los datos en forma descendente Yn+1-i    i=1,2,…,n
  • Establecer explícitamente  la hipótesis nula, proponiendo una distribución de probabilidad.
  • Calcular la probabilidad esperada acumulada para cada número Yi, PEA(YI), y la probabilidad esperada acumulada para cada número, PEA(Yn+1-i), a partir de la función de probabilidad propuesta.
  • Calcular el estadístico de prueba: A 2/n=-[n + 1/n ∑ (2i-1)[1nPEA(Yi) + 1n(1-PEA(Yn+1-i)]]
  • Ajustar el estadístico de prueba de acuerdo con la distribución de probabilidad propuesta.
  • Definir el nivel de significancia de la prueba α,
  • Comparar el estadístico de prueba con valor crítico. Si el estadístico de prueba es menor que el valor crítico no se puede rechazar la hipótesis nula.

Tabla: Estadísticos de prueba y valores críticos para la prueba de Anderson-Darling

Distribución

Estadístico de prueba ajustado

Valores críticos α

0.1

0.05

0.025

0.001

Parámetros conocidos n>=5

A2n

1.933

2.492

3.070

3.857

Normal

A2(1+4/n-25/n2)

0.632

0.751

0.870

1.029

Exponencial

A2 (1+3/5n)

1.070

1.326

1.587

1.943

De Weibull

A2n (1+1/5(n)½)

0.637

0.757

0.877

1.038

Log-logística

A2 (1+1/a(n)½)

0.563

0.660

0.769

0.906


Ejemplo:

Anderson.xlsx

Análisis en Stat-Fit

StatFit.docx

Bibliografía: 

Simulación y análisis de los sistemas con Promodel, García Dunna Eduardo, García Reyes Heriberto, Cárdenas Barrón Leopoldo E. Editorial: Pearson.

Comentarios
* No se publicará la dirección de correo electrónico en el sitio web.
ESTE SITIO FUE CONSTRUIDO USANDO