Glosario de Estadistica: 2015

miércoles, 3 de junio de 2015

Hipótesis estadística:

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones.

En estadística, una hipótesis nula es una hipótesis construida para anular o refutar, con el objetivo de apoyar una hipótesis alternativa. Cuando se utiliza, la hipótesis nula se presume verdadera hasta que una prueba estadística en la forma de una prueba empírica de la hipótesis indique lo contrario. la hipótesis nula no es rechazada, esto no quiere decir que sea verdadera.

Hipótesis alternativa:

Son posibilidades alternas ante las hipótesis de investigación y nula, ofrecen otra descripción o explicación distintas a las que proporcionan estos tipos de hipótesis.

En estadística, un resultado es estadísticamente significativo cuando no es probable que haya sido debido al azar. Una "diferencia estadísticamente significativa" solamente significa que hay evidencias estadísticas de que hay una diferencia; no significa que la diferencia sea grande, importante, o significativa en el sentido estricto de la palabra.

La regla de decisión queda definida siempre (aunque sea implícitamente) de acuerdo a una región crítica. A esta región crítica le corresponde un determinado nivel de significación.

La información contenida en la muestra se resume mediante un estadístico de test, así que una práctica habitual es definir la región crítica en función del estadístico de test empleado.

Un estadístico de test es una variable aleatoria y, como tal, tiene asociada una ley de distribución que juega un papel capital en el contraste.

Intervalo de confianza

En estadística, se llama a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional.

Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el parámetro desconocido de la población. Al valor usado se le llama estimador.

La media de la población se puede estimar puntualmente mediante la media de la muestra:
La proporción de la población se puede estimar puntualmente mediante la proporción de la muestra:
La desviación típica de la población se puede estimar puntualmente mediante la desviación típica de la muestra, aunque hay mejores estimadores:

Estimación por intervalos:

A veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un cierto nivel de confianza, en este caso hablamos de estimación por intervalos.

Una permutación es una combinación en donde el orden es importante. La notación para permutaciones es P(n,r) que es la cantidad de permutaciones de “n” elementos si solamente se seleccionan “r”.

Una combinación es un arreglo donde el orden NO es importante. La notación para las combinaciones es C(n,r) que es la cantidad de combinaciones de “n” elementos seleccionados, “r” a la vez. Es igual a la cantidad de permutaciones de “n” elementos tomados “r” a la vez dividido por “r” factorial. Esto sería P(n,r)/r! en notación matemática.

martes, 12 de mayo de 2015

Unidad 4

Principio aditivo:

Dado que la probabilidad se refiere a la potencialidad de ocurrencia de un evento, el principio aditivo se refiere a las formas que ese evento puede ser realizado. Por ejemplo, una persona que define viajar desde Santiago al Litoral Central puede hacerlo por Línea de Buses A, Línea de Buses B, Línea de Buses C, Línea de Buses D. El principio aditivo, sería que cada línea de buses representa una alternativa:

L A= 1 ; L B = 1 ; L C = 1 ; L D = 1, (significa que cada línea de buses tiene una línea disponible al litoral central)

El principio multiplicativo:

Consiste en que, si existen distintas formas de que un evento suceda, y a su vez estas distintas formas tienen subformas de realizarse, se utiliza la multiplicación: se utiliza la cantidad de formas, por la cantidad de sub formas.

Por ejemplo, en el caso anterior, dado que existen cuatro líneas de buses, suponiendo que la línea A tenga cinco buses, la línea B tenga cuatro buses, la línea C tenga dos buses y la línea D tenga ocho buses, entonces la forma de llegar a L, aplicando el principio multiplicativo, sería:

L = 1 x 5 + 1 x 4 + 1 x 2 + 1 x 8

Entonces el resultado sería L = 19

Regla de la suma:

Este artículo presenta los aspectos fundamentales para aplicar la ley aditiva de la probabilidad en la unión de 2 ó más eventos, siendo un método utilizado para calcular probabilidades expresadas de la forma P(A o B), es decir, la probabilidad de que ocurra el suceso A ó B ó de que ocurran ambos, como el resultado de un experimento. Un procedimiento se descompone en eventos mutuamente excluyentes, permitiendo listar los puntos que conforman el espacio muestral relacionado con el experimento, utilizando diagramas de Venn y del árbol; procediendo a calcular la probabilidad de la unión de 2 ó más eventos.

De la definición de probabilidad condicional se tienen los siguientes resultados al despejar $P(A\cap B):$

Las relaciones $\left( 1\right)$ y $\left( 2\right)$ son casos especiales de la llamada Regla de la multiplicación, la cual es útil para:

Calcular probabilidades de intersecciones de eventos

con base en probabilidades condicionales.

Esta regla de manera general se puede expresar como:

Sea

eventos tales que

El teorema de Bayes:

En la teoría de la probabilidad, es una proposición planteada por el filósofo inglés Thomas Bayes ( 1702-1761)¹ en 1763,² que expresa la probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de sólo A.

El enfoque clásico:

Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo tiempo), entonces la probabilidad de que ocurra A es:

El enfoque clásico de la probabilidad se basa en la suposición de que cada resultado sea igualmente posible.

Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda aplicarse) calcular el valor de probabilidad antes de observar cualquier evento demuestra.

El enfoque subjetivo:

Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte de un individuo de que un evento ocurra, basado en toda la evidencia a su disposición. Bajo esta premisa se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de ocurrencia del evento. Es decir, que el evento ocurrirá o no ocurrirá esa sola vez. El valor de probabilidad bajo este enfoque es un juicio personal.

ENFOQUE DE FRECUENCIA RELATIVA

Este enfoque permite determinar la probabilidad con base en la proporción de veces que ocurre un resultado favorable en cierto número experimentos.

No implica ningún supuesto previo de igualdad de probabilidades.

A este enfoque se le denomina también enfoque empírico debido a que para determinar los valores de probabilidad se requiere de la observación y de la recopilación de datos. También se le denomina a posteriori, ya que el resultado se obtiene después de realizar el experimento un cierto número de veces.

Un evento o suceso es un subconjunto de un espacio muestral, es decir, un conjunto de posibles resultados que se pueden dar en un experimento aleatorio. Son aquellos hechos en los que no se sabe con certeza lo que va a suceder, dependen del azar y no se puede determinar sus resultados aun repitiéndolo en varias ocasiones.

Evento dependiente:

: Evento cuyo resultado se ve afectado por el resultado de otro(s) evento(s).Sacar una segunda carta es un evento dependiente cuando se sacó una primera carta sin regresarla al paquete.; Eventos mutuamente excluyentes y no excluyentes

Eventos mutuamente excluyentes y no excluyentes

Eventos mutuamente excluyentes y eventos no excluyentes

Dos o más eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir simultáneamente. Es decir, la ocurrencia de un evento impide automáticamente la ocurrencia del otro evento (o eventos).

Dos o más eventos son no excluyentes, o conjuntos, cuando es posible que ocurran ambos. Esto no indica que necesariamente deban ocurrir estos eventos en forma simultánea.

La regla de la Adición expresa que: la probabilidad de ocurrencia de al menos dos sucesos A y B es igual a:

P(A o B) = P(A) U P(B) = P(A) + P(B)

Si A y B son mutuamente excluyente:

P(A o B) = P(A) + P(B)  P(A y B)

Si A y B son no excluyentes Siendo:

P(A) = probabilidad de ocurrencia del evento

AP (B) = probabilidad de ocurrencia del evento

BP(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B Eventos Independientes
Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se regresa de nuevo a la población donde se obtuvo.

miércoles, 25 de marzo de 2015

Estadística

Glosario

Estadística: Es una ciencia que se encarga de la recolección, clasificación, presentación, organización, análisis e interpretación de un conjunto de fenómenos, de manera metódica y numérica, permite extraer conclusiones de un hecho, y así poder tomar decisiones valederas.

Población: Conjunto limitado de individuos o elementos con una característica común que son objeto de estudio estadístico.

Muestra: Una muestra es una porción representativa de una determinada población, cuando no se puede realizar un censo, se recurre al muestreo.

Estadístico: es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una población o modelo estadístico.

Parámetro: Es un número que se obtiene a partir de los datos distribución estadística. También sirven para sintetizar información dada por una tabla o gráfica.

Estadística descriptiva: Se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este.

Estadística inferencial: Estudia como sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado fiabilidad o significación de los datos obtenidos.

Media aritmética: Es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

Moda: Es el valor que tiene mayor frecuencia absoluta, se representa por Mo.

Mediana: Es el valor que ocupa el lugar central de todos los datos cuando estos están ordenados de mayor a menor.

La estadística descriptiva: Es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este.

Una distribución de frecuencias o tabla de frecuencias: Es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

La estadística inferencial o Inferencia estadística:estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

La ojiva: Es el polígono frecuencial acumulado, es decir, que permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo.

Marca de clase: es el punto medio de una clase y se obtiene sumando los límites inferiores (LIA) y superiores de una clase (LSA) y dividiendo el resultado entre dos. La marca de clase la denotaremos como MC=LSA+LIA/2. MC=Marca de clase.

LIA= Límite inferior aparente.

LSA= Límite superior aparente.

El diagrama “tallo y hojas”: permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para construirlo basta separar en cada dato el último digito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formara el tallo).

Un diagrama de árbol es una herramienta que se utiliza para determinar todos los posibles resultados de un experimento aleatorio. En el cálculo de la probabilidad se requiere conocer el número de objetos que forman parte del espacio muestral, estos se pueden determinar con la construcción de un diagrama de árbol.

Varianza: En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

La desviación típica o desviación estándar: (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

Percentil: El percentil es una medida no central usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20º es el valor debajo del cual se encuentran el 20 por ciento de las observaciones.

· P₂₅ = Q₁.

· P₅₀ = Q₂ = mediana.

· P₇₅ = Q₃

Cuartiles: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.

Un Diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".

Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes.

Rango: Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.

Decil: Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.

Brianda Isamara Mendoza Lemus 2 AM

viernes, 13 de febrero de 2015