Modelos Matemáticos Empresariales de Simulación, Predicción y Optimización.

Prueba De KOLMOGOROV-SMIRNOV



La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada.
Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas (ft) con la distribución acumulada de las frecuencias observadas (f obs), se encuentra el punto de divergencia máxima y se determina qué probabilidad existe de que una diferencia de esa magnitud se deba al azar.

En las tareas de investigación se pudo obtener un conjunto de observaciones, en las cuales se supone que tienen una distribución normal, binomial, de Poisson, etc. Para el caso, las frecuencias de las distribuciones teóricas deben contrastar con las frecuencias observadas, a fin de conocer cuál distribución se adecua mejor al modelo.
Pasos:
  1. Calcular las frecuencias esperadas de la distribución teórica específica por considerar para determinado número de clases, en un arreglo de rangos de menor a mayor.
  2. Arreglar estos valores teóricos en frecuencias acumuladas.
  3. Arreglar acumulativamente las frecuencias observadas.
  4. Aplicar la ecuación D = ft - f obs, donde D es la máxima discrepancia de ambas.
  5. Comparar el valor estadístico D de Kolmogorov-Smirnov en la tabla de valores críticos de D.
  6. Decidir si se acepta o rechaza la hipótesis.
Ecuación:
D = ft - fobs
En esta ecuación se aprecia que el procedimiento es muy simple y quizá lo que parezca más complicado corresponde al cálculo de la frecuencia esperada de cada tipo de distribución teórica. Por lo tanto, en la marcha de los ejercicios se presentará cada uno de ellos y la manera de aplicar la prueba estadística.



Ejemplo:
En una investigación, consistente en medir la talla de 100 niños de 5 años de edad, se desea saber si las observaciones provienen de una población normal.
Elección de la prueba estadística.
El modelo experimental tiene una muestra y es factible un arreglo en el carácter ordinal o en los rangos de las series de clases. Véase: Flujograma 1

Planteamiento de la hipótesis.
  • Hipótesis alterna (Ha). Los valores observados de las frecuencias para cada clase son diferentes de las frecuencias teóricas de una distribución normal.
  • Hipótesis nula (Ho). Las diferencias entre los valores observados y los teóricos de la distribución normal se deben al azar.

Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Tabla de 100 niños. Los valores X + s son 99.2 ± 2.85.


Aplicación de la prueba estadística.
Primero se elaboran los cálculos de los valoreseóricos esperados para la distribución normal.
Inicialmente se determina el valor Z de los límites de cada clase en la serie, por ejemplo: en la primera clase se determinan el límite inferior y el superior (90 y 93), y en las subsecuentes sólo los límites superiores (97, 101, 105 y 109). Para cada valor de Z, se localiza el área bajo la curva norma tipificada. (Véase: tabla de áreas bajo la curva normal tipificada de 0 a 2).
Los cálculos de valores Z, son de la forma siguiente:


Y así sucesivamente.
Para cada valor Z, se localiza el área de la curva tipificada de la tabla de números aleatorios. A partir de estos valores, se obtiene la diferencia entre los límites de clases entre el superior y el inferior, por ejemplo: 0.4997 - 0.4793 = 0.020, 0.4793 - 0.2357 = 0.2436, 0.2357 - (-0.2794) = 0.5151, -0.2794 - (-0.4854) = 0.206 y -0.4854 - (-0.4994) = 0.014.
Estos resultados de diferencias se multiplican por el tamaño de la muestra (100 niños), luego se obtienen las frecuencias teóricas y después se arreglan en frecuencias acumuladas.
Cálculos de los valores teóricos.

Las frecuencias acumuladas teóricas y las observadas se arreglan en los rangos correspondientes, como se muestra en la siguiente tabla, y posteriormente se aplica la fórmula de Kolmogorov-Smirnov.
Cálculo estadístico D de Kolmogorov-Smirnov.

D = ft - fobs = - 0.036
La diferencia máxima D es igual a -0.049, valor que se compara con los valores críticos de D en la prueba muestral de Kolmogorov-Smirnov y se obtiene la probabilidad de la existencia de esa magnitud de acuerdo con la prueba de Kolmogorov-Smirnov. El valor N es 100 y el mayor número de N en la tabla es 35, por lo cual se aplica la fórmula al pie de la tabla:
Para la probabilidad de 
Lo anterior quiere decir que para todo valor menor que el crítico para una probabilidad de 0.05, la probabilidad correspondiente es mayor que 0.05, y todo valor mayor que D al calculado tinen una probabilidad menor que 0.05, o sea, es inversamente proporcional al crítico determinado o localizado en la tabla.
Decisión.
En virtud de lo anterior, el estadístico de Kolmogorov-Smirnov obtendo es menor que el crítico y su probabilidad mayor que 0.05, por lo tanto, se acepta Ho y se rechaza Ha.
Interpretación.
Las frecuencias observadas y las teóricas calculadas no difieren significativamente. Por lo tanto, las observaciones tienen una distribución normal.

Medidas De Variacion


Las medidas de variabilidad, también llamadas medidas de dispersión , muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.


RANGO ESTADÍSTICO

El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios. Se le suele simbolizar con R.

 

Requisitos del rango

  • Ordenamos los números según su tamaño.
  • Restamos el valor mínimo del valor máximo

Ejemplo Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de:
Rango = 6

MEDIO RANGO
El medio rango de un conjunto de valores numéricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia el medio rango es: 





VARIANZA

La varianza (también denominada variancia, aunque esta denominación es menos utilizada) es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.


COVARIANZA
La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (σ) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra "sxy".
La formula suele aparecer expresada como: 






Medidas De Tendencia Central

Con frecuencia al describir grupos de observaciones es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas.



Entre las medidas de tendencia central tenemos:



A MEDIA ARITMÉTICA

Es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos. Es, probablemente, uno de los parámetros estadísticos más extendidos Se le llama también promedio o, simplemente, media.


Por ejemplo, las notas de 5 alumnos en una prueba:
Alumno   Nota
 1       6,0    ·Primero, se suman las notas:
 2       5,4        6,0+5,4+3,1+7,0+6,1 = 27,6
 3       3,1    ·Luego el total se divide entre la cantidad de alumnos:
 4       7,0         27,6/5=5,52
 5       6,1    ·La media aritmética en este ejemplo es 5,52

MEDIA ARITMÉTICA PONDERADA
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.
Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus "pesos" respectivos, la media ponderada se define de la siguiente forma:

MEDIANA
En el ámbito de la estadística, la mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

MODA
En estadística, la moda es el valor con una mayor frecuencia en una distribución de datos. 

Referencia:  Férnandez Fernández, Santiago; Alejandro Córdoba, José María Cordero Sánchez, Alejandro Córdoba (2002). «3.3. Medidas de posición». Estadística Descriptiva (2ª edición). ESIC Editorial. p. 134. ISBN 8473563069. http://books.google.es/books?id=31d5cGxXUnEC&printsec=frontcover#PPA134,M1.



Modelos y su Clasificación







UN MODELO MENTAL
Es un mecanismo del pensamiento mediante el cual un ser humano, u otro animal, intenta explicar como funciona el mundo real. Es un tipo de símbolo interno o representación de la realidad externa, hipotética que juega un papel importante en la cognición. La idea se cree que fue originada por Kenneth Craik en su libro publicado en el año 1943 titulado The Nature of Explanation


MODELO FÍSICO
Se refiere a una construcción teórica con objetos reales que trata de reproducir el comportamiento de algunos aspectos de un sistema físico o mecánico más complejo. El término aparece con diferentes acepciones en el ámbito de la física o en el ámbito de la ingeniería.

Modelo icónico ofrece una representación pictórica del objeto. El objeto se suele presentar como una proyección bidimensional; la escala y los colores con frecuencia se cambian, los detalles menos interesantes se omiten, y la presentación se concentra en aquellos detalles del objeto que son interesantes -- estos son con frecuencia aquellas invariantes que son comunes a todos o la mayor parte de los objetos que fueron estudiados.

Modelo digital; el objeto se cifra en cifras organizadas, en estructura de datos. las relaciones de correspondencia son matemáticas, estadísticas  o geométricas.

Modelo análogo; En ciencia, un modelo análogo (a veces llamado analógico o también modelo físico práctico) es una representación material de un objeto o un proceso para entender mejor su origen, formación o funcionamiento. Es usado en ciencia e ingeniería para validar las hipótesis y aproximaciones que forman un modelo conceptual de cierto proceso u objeto mediante el cálculo numérico. La validación se produce cuando el modelo análogo es capaz de reproducir el conjunto de observaciones considerado.


MODELOS SIMBÓLICOS
Es una representación de la realidad a través de símbolos, los que tienen generalmente un carácter matemático o lógico. Un tipo de modelo simbólico es una ecuación. Una ecuación es fácil de comprender y de manejar, prestándose además para procesos computacionales.


Modelos verbal es cualitativo por naturaleza, las palabras se usan para describir las reacciones del sistema frente a un estímulo. La regla “Si un individuo es alto, entonces puede ser buen jugador de baloncesto” es parte de un modelo. El conjunto de reglas borrosas (como uno de los varios tipos de sistemas basados en el conocimiento que existen) es un ejemplo de modelo verbal.

Modelo matemático: Es aquel donde la relación entre las diferentes variables en un sistema se formaliza a través de relaciones matemáticas (normalmente ecuaciones). Los modelos matemáticos son generalmente muy informativos, pero en una forma más limitada que los modelos mentales o verbales, puesto que son sólo interpretables desde un punto de vista matemático. Los modelos borrosos, por ejemplo, son usualmente descritos por reglas borrosas; estos poseen un significado más preciso una vez que han sido trasladados al contexto matemático.

  • Modelo determinantico es un modelo matemático donde las mismas entradas producirán invariablemente las mismas salidas, no contemplándose la existencia del azar ni el principio de incertidumbre. Está estrechamente relacionado con la creación de entornos simulados a través de simuladores para el estudio de situaciones hipotéticas, o para crear sistemas de gestión que permitan disminuir la incertidumbre.
  • Modelo descriptivo es cuando el modelo describe una situación del mundo real en términos matemáticos, descripción que p0uede emplearse para exponer una situación con mayor claridad para indicar como pueden reajustarse o aun para determinar los valores de ciertos aspectos de la situación.
  • Modelo optimizador corr4esponde al modelo ideado para seleccionan entre varias alternativas, de acuerdo a determinados criterios. La más optima.
·         Modelo cuantitativo es aquel cuyos principales símbolos representan números. Son los más comunes y útiles en los negocios.
·         Modelo cualitativo aquel modelo cuyos símbolos representan en su mayoría a Cualidades no numéricas. Una fuente importante es la teoría de conjuntos.
·         Modelo dinámico  es el que describe cómo responde la comunidad de objetos a un estimulo especifico, ya sea este un estimulo interno, es decir generado dentro de la misma clase, o un estimula externo. Este puede ser numérico o analítico.
·         Modelo Probabilístico aquellos basados en la estadística y probabilidades (donde se incorpora las incertidumbres que por lo general acompañan nuestras observaciones de eventos reales). Este puede ser continuo, discreto o estocástico.
·         Modelo estático es utilizado para representar sistemas cuyo estado es invariable a través del tiempo. Y este puede ser numérico o analítico.

Simulación Vs Experimentación




SIMULACIÓN


Definición
Simular, es reproducir artificialmente un fenómeno o las relaciones entrada-salida de un sistema.

Ventajas: 
  • Es un proceso relativamente eficiente y flexible.
  • Puede ser usada para analizar y sintetizar una compleja y extensa situación real, pero no puede ser empleada para solucionar un modelo de análisis cuantitativo convencional.
  • En algunos casos la simulación es el único método disponible.
  • Los modelos de simulación se estructuran y nos resuelve en general problemas trascendentes.
  • Los directivos requieren conocer como se avanza y que opciones son atractivas; el directivo con la ayuda del computador puede obtener varias opciones de decisión.
  • La simulación no interfiere en sistemas del mundo real.
  • La simulación permite estudiar los efectos interactivos de los componentes individuales o variables para determinar las más importantes.
  • La simulación permite la inclusión de complicaciones del mundo real.
Desventajas:
  • Un buen modelo de simulación puede resultar bastante costoso; a menudo el proceso de desarrollar un modelo es largo y complicado.
  • La simulación no genera soluciones óptimas a problemas de análisis cuantitativos, en técnicas como cantidad económica de pedido, programación lineal o PERT. Por ensayo y error se producen diferentes resultados en repetidas corridas en el computador.
  • Los directivos generan todas las condiciones y restricciones para analizar las soluciones. El modelo de simulación no produce respuestas por si mismo.
  • Cada modelo de simulación es único. Las soluciones e inferencias no son usualmente transferibles a otros problemas.
  • Siempre quedarán variables por fuera y esas variables (si hay mala suerte) pueden cambiar completamente los resultados en la vida real que la simulación no previó… en ingeniería se “minimizan riesgos, no se evitan”.

EXPERIMENTACIÓN:

Definición:
Es un método común de las ciencias y las tecnologías, consiste en el estudio de un fenómeno, reproducido generalmente en un laboratorio repetidas veces en las condiciones particulares de estudio que interesan, eliminando o introduciendo aquellas variables que puedan influir en él.

Ventajas:
  • La asignación aleatoria de las unidades de análisis a los grupos experimental y control permite controlar la validez interna del experimento.
  • Las posibles diferencias que manifiesten en los grupos son producto de la casualidad.
  • La utilización de la preprueba permite cuantificar el cambio inducido por el tratamiento experimental.
  • La asignación por pareamiento aleatorio permite controlar las diferencias entre las unidades de análisis.


Desventajas:
  • La validez interna pudiera ser afectada por la preprueba.
  • El pareamiento aleatorio es útil cuando se trabaja un experimento en el que los grupos están integrados por 12 o 14 unidades de análisis, es decir, es aplicable en grupos pequeños.