Cómo encontrar el valor medio. Media aritmética simple. Uso de la función promedio

17.02.2017

Excel es una hoja de cálculo. Se puede utilizar para crear una variedad de informes. En este programa, es muy conveniente realizar varios cálculos. Muchos no usan ni la mitad de las capacidades de Excel.

Es posible que deba encontrar el valor promedio de los números en la escuela, así como durante el trabajo. La forma clásica determinar la media aritmética sin el uso de programas es sumar todos los números, y luego la cantidad resultante debe dividirse por el número de términos. Si los números son lo suficientemente grandes, o si la operación debe realizarse muchas veces para generar informes, los cálculos pueden llevar mucho tiempo. Esta es una pérdida irracional de tiempo y esfuerzo, es mucho mejor usar las capacidades de Excel.

Encontrar la media aritmética

Muchos datos ya están registrados inicialmente en Excel, pero si esto no sucede, es necesario transferir los datos a una tabla. Cada número para el cálculo debe estar en una celda separada.

Método 1: Calcule el valor promedio a través del "Asistente de funciones"

En este método, debe escribir una fórmula para calcular la media aritmética y aplicarla a las celdas especificadas.



El principal inconveniente de este método es que debe ingresar celdas manualmente para cada término. En la presencia de un número grande números no es muy conveniente.

Método 2: Cálculo automático del resultado en celdas seleccionadas

En este método, el cálculo de la media aritmética se realiza con solo un par de clics del mouse. Muy útil para cualquier número de números.



La desventaja de este método es el cálculo del valor promedio solo para números ubicados cerca. Si los términos necesarios están dispersos, no se pueden seleccionar para el cálculo. Ni siquiera es posible seleccionar dos columnas, en cuyo caso los resultados se presentarán por separado para cada una de ellas.

Método 3: Usar la barra de fórmulas

Otra forma de ir a la ventana de funciones:



Mayoría manera rápida, en el que no necesita buscar elementos en el menú durante mucho tiempo.

Método 4: entrada manual

No es necesario usar las herramientas en el menú de Excel para calcular el valor promedio, puede escribir manualmente la función necesaria.



Rápido y manera conveniente para aquellos que prefieren crear fórmulas con sus propias manos, en lugar de buscar programas listos para usar en el menú.

Gracias a estas características, es muy fácil calcular el valor promedio de cualquier número, independientemente de su número, y también puede compilar estadísticas sin calcularlas manualmente. Con la ayuda de las herramientas del programa Excel, cualquier cálculo es mucho más fácil de hacer que mentalmente o usando una calculadora.

Para encontrar el valor promedio en Excel (ya sea un valor numérico, textual, porcentual u otro), hay muchas funciones. Y cada uno de ellos tiene sus propias características y ventajas. Después de todo, se pueden establecer ciertas condiciones en esta tarea.

Por ejemplo, los valores medios de una serie de números en Excel se calculan mediante funciones estadísticas. También puede ingresar manualmente su propia fórmula. Consideremos varias opciones.

¿Cómo encontrar la media aritmética de los números?

Para encontrar la media aritmética, sumas todos los números del conjunto y divides la suma por el número. Por ejemplo, las calificaciones de un estudiante en informática: 3, 4, 3, 5, 5. Lo que vale para un trimestre: 4. Encontramos la media aritmética usando la fórmula: \u003d (3 + 4 + 3 + 5 + 5) / 5.

¿Cómo hacerlo rápidamente usando las funciones de Excel? Tomemos, por ejemplo, una serie de números aleatorios en una cadena:

O: active la celda y simplemente ingrese manualmente la fórmula: =PROMEDIO(A1:A8).

Ahora veamos qué más puede hacer la función PROMEDIO.



Halla la media aritmética de los dos primeros y los tres últimos números. Fórmula: =PROMEDIO(A1:B1;F1:H1). Resultado:

Promedio por condición

La condición para encontrar la media aritmética puede ser un criterio numérico o de texto. Usaremos la función: =PROMEDIO.SI().

Encuentra la media aritmética de números que son mayores o iguales a 10.

Función: =PROMEDIO.SI(A1:A8,">=10")



El resultado de usar la función PROMEDIO.SI en la condición ">=10":

El tercer argumento - "Rango promedio" - se omite. Primero, no es obligatorio. En segundo lugar, el rango analizado por el programa contiene SÓLO valores numéricos. En las celdas especificadas en el primer argumento, la búsqueda se realizará de acuerdo con la condición especificada en el segundo argumento.

¡Atención! El criterio de búsqueda se puede especificar en una celda. Y en la fórmula para hacer referencia a ella.

Encontremos el valor promedio de los números por el criterio del texto. Por ejemplo, las ventas promedio del producto "mesas".

La función se verá así: =PROMEDIOSI($A$2:$A$12;A7;$B$2:$B$12). Rango: una columna con nombres de productos. El criterio de búsqueda es un enlace a una celda con la palabra "tablas" (puede insertar la palabra "tablas" en lugar del enlace A7). Rango promedio: aquellas celdas de las que se tomarán datos para calcular el valor promedio.

Como resultado del cálculo de la función, obtenemos el siguiente valor:

¡Atención! Para un criterio de texto (condición), se debe especificar el rango promedio.

¿Cómo calcular el precio promedio ponderado en Excel?

¿Cómo sabemos el precio medio ponderado?

Fórmula: =SUMAPRODUCTO(C2:C12,B2:B12)/SUMA(C2:C12).



Usando la fórmula SUMPRODUCT, encontramos el ingreso total después de la venta de la cantidad total de bienes. Y la función SUMA - resume la cantidad de bienes. Al dividir el ingreso total de la venta de bienes por el número total de unidades de bienes, encontramos el precio promedio ponderado. Este indicador tiene en cuenta el "peso" de cada precio. Su participación en la masa total de valores.

Desviación estándar: fórmula en Excel

Distinguir entre la desviación estándar para la población general y para la muestra. En el primer caso, esta es la raíz de la varianza general. En el segundo, a partir de la varianza muestral.

Para calcular este indicador estadístico, se compila una fórmula de dispersión. La raíz se toma de ella. Pero en Excel hay una función preparada para encontrar la desviación estándar.



La desviación estándar está vinculada a la escala de los datos de origen. Esto no es suficiente para una representación figurativa de la variación del rango analizado. Para obtener el nivel relativo de dispersión en los datos, se calcula el coeficiente de variación:

desviación estándar / media aritmética

La fórmula en Excel se ve así:

STDEV (rango de valores) / PROMEDIO (rango de valores).

El coeficiente de variación se calcula como un porcentaje. Por lo tanto, establecemos el formato de porcentaje en la celda.

Para solución exitosa problema 19 de la parte 3 necesitas saber algo funciones de excel. Una de estas funciones es PROMEDIO. Considerémoslo con más detalle.

sobresalir le permite encontrar la media aritmética de los argumentos. La sintaxis de esta función es:

PROMEDIO(número1, [número2],…)

No olvide que ingresar una fórmula en una celda comienza con el signo "=".

Entre paréntesis, podemos enumerar los números cuyo promedio queremos encontrar. Por ejemplo, si escribimos en una celda =PROMEDIO(1, 2, -7, 10, 7, 5, 9), luego obtenemos 3.857142857. Esto es fácil de comprobar: si sumamos todos los números entre paréntesis (1 + 2 + (-7) + 10 + 7 + 5 + 9 = 27) y los dividimos por su número (7), obtenemos 3,857142857142857.

Fíjate en los números entre paréntesis separados por un punto y coma (; ). Así, podemos especificar hasta 255 números.

Por ejemplo, estoy usando Microsort Excel 2010.

Además, con la ayuda funciones PROMEDIO podemos encontrar valor promedio de un rango de celdas. Supongamos que tenemos algunos números almacenados en el rango A1:A7 y queremos encontrar su media aritmética.

Pongamos en la celda B1 la media aritmética del rango A1:A7. Para hacer esto, coloque el cursor en la celda B1 y escriba =PROMEDIO(A1:A7). Entre paréntesis, indiqué el rango de celdas. Tenga en cuenta que el delimitador es el carácter colon (: ). Sería aún más fácil de hacer: escriba en la celda B1 =PROMEDIO( y luego seleccione el rango deseado con el mouse.

Como resultado, en la celda B1 obtendremos el número 15.85714286; esta es la media aritmética del rango A1:A7.

Como calentamiento, propongo encontrar el valor promedio de los números del 1 al 100 (1, 2, 3, etc. hasta el 100). La primera persona que responda correctamente en los comentarios recibirá 50 rublos al teléfono Estamos trabajando.

Instrucción

Sea un conjunto de cuatro números. Necesito encontrar promedio sentido este conjunto. Para hacer esto, primero encontramos la suma de todos estos números. Digamos que estos números son 1, 3, 8, 7. Su suma es S = 1 + 3 + 8 + 7 = 19. El conjunto de números debe consistir en números del mismo signo, de lo contrario, el significado de calcular el valor promedio es perdió.

Promedio sentido conjunto de números es igual a la suma de los números S dividida por el número de estos números. Es decir, resulta que promedio sentido es igual a: 19/4 = 4,75.

Para configurar el número también se puede encontrar no solo promedio aritmética, pero promedio geométrico. La media geométrica de varios números reales positivos es un número que puede reemplazar a cada uno de estos números para que su producto no cambie. La media geométrica G se encuentra mediante la fórmula: la raíz del grado N del producto de un conjunto de números, donde N es el número de números del conjunto. Considere el mismo conjunto de números: 1, 3, 8, 7. Encuéntrelos promedio geométrico. Para ello calculamos el producto: 1 * 3 * 8 * 7 = 168. Ahora del número 168 hay que sacarle la raíz de 4º grado: G = (168)^1/4 = 3,61. De este modo promedio el conjunto geométrico de números es 3.61.

Promedio la media geométrica generalmente se usa con menos frecuencia que la media aritmética, pero puede ser útil al calcular el promedio de indicadores que cambian con el tiempo (el salario de un empleado individual, la dinámica del rendimiento académico, etc.).

Necesitará

  • Calculadora de ingeniería

Instrucción

Para encontrar la media geométrica de una serie de números, primero debes multiplicar todos estos números. Por ejemplo, te dan un conjunto de cinco indicadores: 12, 3, 6, 9 y 4. Multipliquemos todos estos números: 12x3x6x9x4=7776.

Ahora, del número resultante, debe extraer la raíz del grado igual a la cantidad de elementos en la serie. En nuestro caso, del número 7776, deberá extraer la raíz de quinto grado con una calculadora de ingeniería. El número obtenido después de esta operación, en este caso el número 6, será la media geométrica del grupo original de números.

Si no tiene una calculadora de ingeniería a mano, puede calcular la media geométrica de una serie de números usando la función CPGEOM en Excel o usando una de las calculadoras en línea diseñadas específicamente para calcular valores medios geométricos.

Nota

Si necesita encontrar la media geométrica de solo dos números, entonces no necesitará una calculadora de ingeniería: puede extraer la raíz de segundo grado (raíz cuadrada) de cualquier número usando la calculadora más común.

Consejo útil

A diferencia de la media aritmética, la media geométrica no está tan fuertemente influenciada por grandes desviaciones y fluctuaciones entre valores individuales en el conjunto de indicadores estudiado.

Fuentes:

  • Calculadora online que calcula la media geométrica
  • fórmula media geométrica

Promedio El valor es una de las características de un conjunto de números. Representa un número que no puede estar fuera del rango definido por los valores mayor y menor de este conjunto de números. Promedio valor aritmético - la variedad de promedios más utilizada.

Instrucción

Sume todos los números del conjunto y divídalos por el número de términos para obtener la media aritmética. Dependiendo de las condiciones específicas del cálculo, a veces es más fácil dividir cada uno de los números por el número de valores del conjunto y sumar el resultado.

Utilice, por ejemplo, la calculadora incluida con Windows si no es posible calcular la media aritmética en su cabeza. Puede abrirlo utilizando el cuadro de diálogo del iniciador de programas. Para hacer esto, presione las "teclas de acceso rápido" WIN + R o haga clic en el botón "Inicio" y seleccione el comando "Ejecutar" en el menú principal. Luego escriba calc en el campo de entrada y presione Entrar en el teclado o haga clic en el botón Aceptar. Lo mismo se puede hacer a través del menú principal: ábralo, vaya a la sección "Todos los programas" y en la sección "Estándar" y seleccione la línea "Calculadora".

Ingrese todos los números en el conjunto en sucesión presionando la tecla Más en el teclado después de cada uno de ellos (excepto el último) o haciendo clic en el botón correspondiente en la interfaz de la calculadora. También puede ingresar números tanto desde el teclado como haciendo clic en los botones de interfaz correspondientes.

Presione la tecla de barra o haga clic en este icono en la interfaz de la calculadora después de ingresar el último valor del conjunto e imprimir el número de números en la secuencia. Luego presione el signo igual y la calculadora calculará y mostrará la media aritmética.

Puede usar un editor de hojas de cálculo para el mismo propósito. Microsoft Excel. En este caso, inicie el editor e ingrese todos los valores de la secuencia de números en las celdas adyacentes. Si después de ingresar cada número presiona Entrar o la tecla de flecha hacia abajo o hacia la derecha, el propio editor moverá el foco de entrada a la celda adyacente.

Seleccione todos los valores ingresados ​​​​y en la esquina inferior izquierda de la ventana del editor (en la barra de estado) verá la media aritmética de las celdas seleccionadas.

Haga clic en la celda junto al último número que ingresó, si no desea ver solo la media aritmética. Expanda la lista desplegable con la imagen de la letra griega sigma (Σ) en el grupo de comandos Edición en la pestaña Inicio. Seleccione la línea " Promedio” y el editor insertará la fórmula deseada para calcular la media aritmética en la celda seleccionada. Presione la tecla Enter y se calculará el valor.

La media aritmética es una de las medidas de tendencia central, muy utilizada en matemáticas y cálculos estadísticos. Encontrar el promedio aritmético de varios valores es muy simple, pero cada tarea tiene sus propios matices, que simplemente es necesario conocer para realizar los cálculos correctos.



cual es la media aritmetica

La media aritmética determina el valor promedio de toda la matriz original de números. En otras palabras, de un determinado conjunto de números, se selecciona un valor común a todos los elementos, cuya comparación matemática con todos los elementos es aproximadamente igual. La media aritmética se utiliza principalmente en la preparación de informes financieros y estadísticos o para calcular los resultados cuantitativos de dichos experimentos.

Cómo encontrar la media aritmética

La búsqueda de la media aritmética de una matriz de números debe comenzar con la determinación de la suma algebraica de estos valores. Por ejemplo, si la matriz contiene los números 23, 43, 10, 74 y 34, entonces su suma algebraica será 184. Al escribir, la media aritmética se indica con la letra μ (mu) o x (x con una barra) . Luego, la suma algebraica debe dividirse por la cantidad de números en la matriz. En este ejemplo, había cinco números, por lo que la media aritmética será 184/5 y será 36,8.

Características de trabajar con números negativos.

Si hay números negativos en la matriz, la media aritmética se encuentra utilizando un algoritmo similar. Hay una diferencia solo cuando se calcula en el entorno de programación, o si hay condiciones adicionales en la tarea. En estos casos, encontrar la media aritmética de números con diferentes signos se reduce a tres pasos:

1. Encontrar la media aritmética común por el método estándar;
2. Encontrar la media aritmética de números negativos.
3. Cálculo de la media aritmética de números positivos.

Las respuestas de cada una de las acciones se escriben separadas por comas.

Fracciones naturales y decimales

Si la matriz de números está representada por fracciones decimales, la solución ocurre de acuerdo con el método de cálculo de la media aritmética de números enteros, pero el resultado se reduce de acuerdo con los requisitos del problema para la precisión de la respuesta.

Al trabajar con fracciones naturales, deben reducirse a un denominador común, que se multiplica por la cantidad de números en la matriz. El numerador de la respuesta será la suma de los numeradores dados de los elementos fraccionarios originales.

La media geométrica de los números depende no solo del valor absoluto de los números en sí, sino también de su número. No confundas la media geométrica y la media aritmética de los números, ya que se encuentran usando métodos diferentes. La media geométrica siempre es menor o igual que la media aritmética.

Para encontrar la media geométrica de más de dos números, también usa la regla básica. Para hacer esto, encuentre el producto de todos los números para los que desea encontrar la media geométrica. Del producto resultante, extrae la raíz del grado igual al número de números. Por ejemplo, para encontrar la media geométrica de los números 2, 4 y 64, encuentra su producto. 2•4•64=512. Como necesitas encontrar el resultado de la media geométrica de tres números, extrae la raíz de tercer grado del producto. Es difícil hacer esto verbalmente, así que use una calculadora de ingeniería. Para ello, dispone de un botón "x^y". Marque el número 512, presione el botón "x^y", luego marque el número 3 y presione el botón "1/x", para encontrar el valor 1/3, presione el botón "=". Obtenemos el resultado de elevar 512 a la potencia de 1/3, que corresponde a la raíz de tercer grado. Obtenga 512^1/3=8. Esta es la media geométrica de los números 2.4 y 64.

Usando una calculadora de ingeniería, puedes encontrar la media geométrica de otra manera. Encuentra el botón de registro en tu teclado. Después de eso, toma el logaritmo de cada uno de los números, encuentra su suma y divídela por la cantidad de números. Del número resultante, tome el antilogaritmo. Esta será la media geométrica de los números. Por ejemplo, para encontrar la media geométrica de los mismos números 2, 4 y 64, haga un conjunto de operaciones en la calculadora. Escriba el número 2, luego presione el botón log, presione el botón "+", escriba el número 4 y presione log y "+" nuevamente, escriba 64, presione log y "=". El resultado será un número igual a la suma de los logaritmos decimales de los números 2, 4 y 64. Divide el número resultante entre 3, ya que este es el número de números por los que se busca la media geométrica. Del resultado, tome el antilogaritmo alternando la clave de registro y use la misma clave de registro. El resultado es el número 8, esta es la media geométrica deseada.

Nota

La media no puede ser mayor que el número más grande del conjunto ni menor que el más pequeño.

Consejo útil

En estadística matemática, el valor promedio de una cantidad se llama expectativa matemática.

Fuentes:

  • como calcular el promedio
  • Encuentra la media aritmética de todos los números enteros del 1 al 1000
  • Encontrar la media geométrica

En la mayoría de los casos, los datos se concentran alrededor de algún punto central. Así, para describir cualquier conjunto de datos, basta con indicar el valor medio. Considere sucesivamente tres características numéricas que se utilizan para estimar el valor medio de la distribución: media aritmética, mediana y moda.

Promedio

La media aritmética (a menudo denominada simplemente media) es la estimación más común de la media de una distribución. Es el resultado de dividir la suma de todos los valores numéricos observados por su número. Para una muestra de números X 1, X 2, ..., Xnorte, la media de la muestra (indicada por el símbolo ) es igual \u003d (X 1 + X 2 + ... + Xnorte) / norte, o

donde es la media muestral, norte- tamaño de la muestra, Xii-ésimo elemento muestras

Descargar nota en o formato, ejemplos en formato

Considere calcular el promedio aritmético de los rendimientos anuales promedio de cinco años de 15 fondos mutuos de muy alto riesgo (Figura 1).

Arroz. 1. Rentabilidad anual promedio de 15 fondos mutuos de muy alto riesgo

La media muestral se calcula de la siguiente manera:

Esta es una buena rentabilidad, especialmente si se compara con la rentabilidad del 3-4% que recibieron los depositantes de bancos o cooperativas de ahorro y crédito durante el mismo período. Si ordena los valores de retorno, es fácil ver que ocho fondos tienen un retorno por encima y siete por debajo del promedio. La media aritmética actúa como un punto de equilibrio, de modo que los fondos de bajos ingresos equilibren los fondos de altos ingresos. Todos los elementos de la muestra están involucrados en el cálculo del promedio. Ninguno de los otros estimadores de la media de distribución tiene esta propiedad.

Cuándo calcular la media aritmética. Dado que la media aritmética depende de todos los elementos de la muestra, la presencia de valores extremos afecta significativamente el resultado. En tales situaciones, la media aritmética puede distorsionar el significado de los datos numéricos. Por lo tanto, al describir un conjunto de datos que contiene valores extremos, es necesario indicar la mediana o la media aritmética y la mediana. Por ejemplo, si se elimina de la muestra la rentabilidad del fondo RS Emerging Growth, la media muestral de la rentabilidad de los 14 fondos disminuye casi un 1 % hasta el 5,19 %.

Mediana

La mediana es el valor medio de una matriz ordenada de números. Si la matriz no contiene números repetidos, la mitad de sus elementos serán menores y la otra mitad mayores que la mediana. Si la muestra contiene valores extremos, es mejor usar la mediana en lugar de la media aritmética para estimar la media. Para calcular la mediana de una muestra, primero se debe ordenar.

Esta fórmula es ambigua. Su resultado depende de si el número es par o impar. norte:

  • Si la muestra contiene un número impar de elementos, la mediana es (n+1)/2-ésimo elemento.
  • Si la muestra contiene un número par de elementos, la mediana se encuentra entre los dos elementos centrales de la muestra y es igual a la media aritmética calculada sobre estos dos elementos.

Para calcular la mediana de una muestra de 15 fondos mutuos de muy alto riesgo, primero debemos clasificar los datos sin procesar (Figura 2). Entonces la mediana será opuesta al número del elemento medio de la muestra; en nuestro ejemplo número 8. Excel tiene una función especial =MEDIAN() que también funciona con matrices desordenadas.

Arroz. 2. Mediana de 15 fondos

Así, la mediana es 6,5. Esto quiere decir que la mitad de los fondos de muy alto riesgo no superan el 6,5, mientras que la otra mitad sí lo hace. Tenga en cuenta que la mediana de 6,5 es ligeramente mayor que la mediana de 6,08.

Si eliminamos la rentabilidad del fondo RS Emerging Growth de la muestra, entonces la mediana de los 14 fondos restantes disminuirá a 6.2%, es decir, no tan significativamente como la media aritmética (Fig. 3).


Arroz. 3. Mediana de 14 fondos

Moda

El término fue introducido por primera vez por Pearson en 1894. La moda es el número que aparece con mayor frecuencia en la muestra (el más de moda). La moda describe bien, por ejemplo, la típica reacción de los conductores ante un semáforo para detener el tráfico. Un ejemplo clásico del uso de la moda es la elección del tamaño del lote de zapatos producido o el color del papel tapiz. Si una distribución tiene múltiples modos, entonces se dice que es multimodal o multimodal (tiene dos o más "picos"). La multimodalidad de la distribución da información importante sobre la naturaleza de la variable en estudio. Por ejemplo, en las encuestas sociológicas, si una variable representa una preferencia o actitud hacia algo, la multimodalidad podría significar que hay varias opiniones claramente diferentes. La multimodalidad también es un indicador de que la muestra no es homogénea y que las observaciones pueden ser generadas por dos o más distribuciones "superpuestas". A diferencia de la media aritmética, los valores atípicos no afectan a la moda. Para las variables aleatorias distribuidas continuamente, como los rendimientos anuales promedio de los fondos mutuos, la moda a veces no existe en absoluto (o no tiene sentido). Dado que estos indicadores pueden tomar una variedad de valores, los valores repetidos son extremadamente raros.

Cuartiles

Los cuartiles son medidas que se usan más comúnmente para evaluar la distribución de datos al describir las propiedades de muestras numéricas grandes. Mientras que la mediana divide la matriz ordenada por la mitad (el 50 % de los elementos de la matriz son menores que la mediana y el 50 % son mayores), los cuartiles dividen el conjunto de datos ordenado en cuatro partes. Los valores de Q 1 , mediana y Q 3 son los percentiles 25, 50 y 75, respectivamente. El primer cuartil Q 1 es un número que divide la muestra en dos partes: el 25% de los elementos son menores y el 75% son mayores que el primer cuartil.

El tercer cuartil Q 3 es un número que también divide la muestra en dos partes: el 75% de los elementos son menores y el 25% son mayores que el tercer cuartil.

Para el cálculo de cuartiles en versiones de Excel anteriores a 2007 se utilizaba la función =CUARTIL(matriz, parte). A partir de Excel 2010, se aplican dos funciones:

  • =CUARTIL.ON(matriz, parte)
  • =CUARTIL.EXC(matriz, parte)

Estas dos funciones dan valores ligeramente diferentes (Figura 4). Por ejemplo, al calcular los cuartiles de una muestra que contiene datos sobre el rendimiento anual promedio de 15 fondos mutuos de muy alto riesgo, Q 1 = 1.8 o -0.7 para QUARTILE.INC y QUARTILE.EXC, respectivamente. Por cierto, la función QUARTILE utilizada anteriormente corresponde a la función moderna QUARTILE.ON. Para calcular cuartiles en Excel usando las fórmulas anteriores, la matriz de datos se puede dejar sin ordenar.


Arroz. 4. Calcula cuartiles en Excel

Hagamos hincapié de nuevo. Excel puede calcular cuartiles para univariado serie discreta, que contiene los valores de una variable aleatoria. El cálculo de los cuartiles para una distribución basada en frecuencias se proporciona en la sección a continuación.

significado geometrico

A diferencia de la media aritmética, la media geométrica mide cuánto ha cambiado una variable con el tiempo. La media geométrica es la raíz. norte grado del producto norte valores (en Excel, se usa la función = CUGEOM):

GRAMO= (X 1 * X 2 * ... * X n) 1/n

Un parámetro similar, la media geométrica de la tasa de rendimiento, está determinado por la fórmula:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

donde yo- tasa de retorno i-ésimo periodo de tiempo.

Por ejemplo, suponga que la inversión inicial es de $100 000. Al final del primer año, se reduce a $50 000 y al final del segundo año se recupera a los $100 000 originales. La tasa de rendimiento de esta inversión en un período de dos años año es igual a 0, ya que la cantidad inicial y final de fondos son iguales entre sí. Sin embargo, la media aritmética de las tasas de rendimiento anuales es = (-0,5 + 1) / 2 = 0,25 o 25 %, ya que la tasa de rendimiento en el primer año R 1 = (50 000 - 100 000) / 100 000 = -0,5 , y en el segundo R 2 = (100 000 - 50 000) / 50 000 = 1. Al mismo tiempo, la media geométrica de la tasa de rendimiento para dos años es: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Por lo tanto, la media geométrica refleja con mayor precisión el cambio (más precisamente, la ausencia de cambio) en el volumen de inversiones durante el bienio que la media aritmética.

Datos interesantes. Primero, la media geométrica siempre será menor que la media aritmética de los mismos números. Excepto en el caso en que todos los números tomados sean iguales entre sí. En segundo lugar, habiendo considerado las propiedades de un triángulo rectángulo, uno puede entender por qué la media se llama geométrica. La altura de un triángulo rectángulo, bajado a la hipotenusa, es la media proporcional entre las proyecciones de los catetos sobre la hipotenusa, y cada cateto es la media proporcional entre la hipotenusa y su proyección sobre la hipotenusa (Fig. 5). Esto brinda una forma geométrica de construir la media geométrica de dos segmentos (longitudes): debe construir un círculo sobre la suma de estos dos segmentos como un diámetro, luego la altura, restaurada desde el punto de su conexión hasta la intersección con el círculo, dará el valor requerido:

Arroz. 5. La naturaleza geométrica de la media geométrica (figura de Wikipedia)

La segunda propiedad importante de los datos numéricos es su variación caracterizando el grado de dispersión de los datos. Dos muestras diferentes pueden diferir tanto en valores medios como en variaciones. Sin embargo, como se muestra en la fig. 6 y 7, dos muestras pueden tener la misma variación pero medias diferentes, o la misma media y variación completamente diferente. Los datos correspondientes al polígono B de la Fig. 7 cambian mucho menos que los datos a partir de los cuales se construyó el polígono A.

Arroz. 6. Dos distribuciones simétricas en forma de campana con la misma dispersión y diferentes valores medios

Arroz. 7. Dos distribuciones simétricas en forma de campana con los mismos valores medios y diferente dispersión

Hay cinco estimaciones de variación de datos:

  • lapso,
  • rango intercuartil,
  • dispersión,
  • Desviación Estándar,
  • el coeficiente de variación.

alcance

El rango es la diferencia entre los elementos más grandes y más pequeños de la muestra:

Deslizar = XMax-Xmínimo

El rango de una muestra que contiene los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo se puede calcular utilizando una matriz ordenada (consulte la Figura 4): rango = 18,5 - (-6,1) = 24,6. Esto significa que la diferencia entre la rentabilidad media anual máxima y mínima de los fondos de muy alto riesgo es del 24,6 %.

El rango mide la dispersión general de los datos. Aunque el rango de la muestra es una estimación muy simple de la dispersión total de los datos, su debilidad es que no tiene en cuenta exactamente cómo se distribuyen los datos entre los elementos mínimo y máximo. Este efecto se ve bien en la Fig. 8 que ilustra muestras que tienen el mismo rango. La escala B muestra que si la muestra contiene al menos un valor extremo, el rango de la muestra es una estimación muy imprecisa de la dispersión de los datos.

Arroz. 8. Comparación de tres muestras con el mismo rango; el triángulo simboliza el apoyo de la balanza, y su ubicación corresponde al valor medio de la muestra

Rango intercuartil

El rango intercuartílico o medio es la diferencia entre el tercer y el primer cuartil de la muestra:

Rango intercuartil \u003d Q 3 - Q 1

Este valor permite estimar la dispersión del 50% de los elementos y no tener en cuenta la influencia de elementos extremos. El rango intercuartílico para una muestra que contiene datos sobre los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo se puede calcular utilizando los datos de la figura. 4 (por ejemplo, para la función CUARTIL.EXC): Rango intercuartílico = 9,8 - (-0,7) = 10,5. El intervalo entre 9,8 y -0,7 suele denominarse la mitad del medio.

Cabe señalar que los valores de Q 1 y Q 3, y por tanto el rango intercuartílico, no dependen de la presencia de outliers, ya que en su cálculo no se tiene en cuenta ningún valor que sea inferior a Q 1 o superior a Q 3 . Las características cuantitativas totales, como la mediana, el primer y tercer cuartil y el rango intercuartílico, que no se ven afectadas por los valores atípicos, se denominan indicadores robustos.

Si bien el rango y el rango intercuartílico proporcionan una estimación de la dispersión total y media de la muestra, respectivamente, ninguna de estas estimaciones tiene en cuenta exactamente cómo se distribuyen los datos. Varianza y desviación estándar libre de este defecto. Estos indicadores le permiten evaluar el grado de fluctuación de los datos alrededor de la media. Varianza de la muestra es una aproximación de la media aritmética calculada a partir de las diferencias al cuadrado entre cada elemento de la muestra y la media de la muestra. Para una muestra de X 1 , X 2 , ... X n la varianza de la muestra (denotada por el símbolo S 2 está dada por la siguiente fórmula:

En general, la varianza de la muestra es la suma de las diferencias al cuadrado entre los elementos de la muestra y la media de la muestra, dividida por un valor igual al tamaño de la muestra menos uno:

donde - significado aritmetico, norte- tamaño de la muestra, X yo - i-ésimo elemento de muestra X. En Excel antes de la versión 2007 se usaba la función =VAR() para calcular la varianza muestral, desde la versión 2010 se usa la función =VAR.V().

La estimación más práctica y ampliamente aceptada de la dispersión de datos es Desviación Estándar. Este indicador se denota con el símbolo S y es igual a la raíz cuadrada de la varianza de la muestra:

En Excel antes de la versión 2007, se usaba la función =STDEV() para calcular la desviación estándar, desde la versión 2010 se usa la función =STDEV.V(). Para calcular estas funciones, la matriz de datos se puede desordenar.

Ni la varianza de la muestra ni la desviación estándar de la muestra pueden ser negativas. La única situación en la que los indicadores S 2 y S pueden ser cero es si todos los elementos de la muestra son iguales. En este caso completamente improbable, el rango y el rango intercuartílico también son cero.

Los datos numéricos son inherentemente volátiles. Cualquier variable puede tomar un conjunto valores diferentes. Por ejemplo, diferentes fondos mutuos tienen diferentes tasas de rendimiento y pérdida. Debido a la variabilidad de los datos numéricos, es muy importante estudiar no solo las estimaciones de la media, que son de naturaleza sumativa, sino también las estimaciones de la varianza, que caracterizan la dispersión de los datos.

La varianza y la desviación estándar nos permiten estimar la dispersión de los datos alrededor de la media, en otras palabras, determinar cuántos elementos de la muestra son menores que la media y cuántos son mayores. La dispersión tiene algunas propiedades matemáticas valiosas. Sin embargo, su valor es el cuadrado de una unidad de medida: un porcentaje cuadrado, un dólar cuadrado, una pulgada cuadrada, etc. Por lo tanto, una estimación natural de la varianza es la desviación estándar, que se expresa en las unidades de medida habituales: porcentaje de ingresos, dólares o pulgadas.

La desviación estándar le permite estimar la cantidad de fluctuación de los elementos de la muestra alrededor del valor medio. En casi todas las situaciones, la mayoría de los valores observados se encuentran dentro de más o menos una desviación estándar de la media. Por lo tanto, conociendo la media aritmética de los elementos de la muestra y la desviación estándar de la muestra, es posible determinar el intervalo al que pertenece la mayor parte de los datos.

La desviación estándar de los rendimientos de 15 fondos mutuos de muy alto riesgo es 6.6 (Figura 9). Esto significa que la rentabilidad de la mayor parte de los fondos difiere del valor promedio en no más del 6,6% (es decir, fluctúa en el rango de - S= 6,2 – 6,6 = –0,4 a + S= 12,8). De hecho, este intervalo contiene un rendimiento anual promedio de cinco años del 53,3% (8 de 15) de los fondos.


Arroz. 9. Desviación estándar

Tenga en cuenta que en el proceso de sumar las diferencias al cuadrado, los elementos que están más alejados de la media ganan más peso que los elementos que están más cerca. Esta propiedad es la razón principal por la cual la media aritmética se usa con mayor frecuencia para estimar la media de una distribución.

El coeficiente de variación

A diferencia de las estimaciones de dispersión anteriores, el coeficiente de variación es una estimación relativa. Siempre se mide como un porcentaje, no en las unidades de datos originales. El coeficiente de variación, indicado por los símbolos CV, mide la dispersión de los datos alrededor de la media. El coeficiente de variación es igual a la desviación estándar dividida por la media aritmética y multiplicada por 100%:

donde S- desviación estándar de la muestra, - muestra promedio.

El coeficiente de variación le permite comparar dos muestras, cuyos elementos se expresan en diferentes unidades de medida. Por ejemplo, el gerente de un servicio de entrega de correo tiene la intención de actualizar la flota de camiones. Al cargar paquetes, hay dos tipos de restricciones a considerar: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. Suponga que en una muestra de 200 bolsas, el peso promedio es de 26,0 libras, la desviación estándar del peso es de 3,9 libras, el volumen promedio del paquete es de 8,8 pies cúbicos y la desviación estándar del volumen es de 2,2 pies cúbicos. ¿Cómo comparar la distribución de peso y volumen de los paquetes?

Dado que las unidades de medida de peso y volumen difieren entre sí, el gerente debe comparar la dispersión relativa de estos valores. El coeficiente de variación de peso es CV W = 3,9 / 26,0 * 100% = 15%, y el coeficiente de variación de volumen CV V = 2,2 / 8,8 * 100% = 25%. Por lo tanto, la dispersión relativa de los volúmenes de los paquetes es mucho mayor que la dispersión relativa de sus pesos.

Formulario de distribución

La tercera propiedad importante de la muestra es la forma de su distribución. Esta distribución puede ser simétrica o asimétrica. Para describir la forma de una distribución, es necesario calcular su media y mediana. Si estas dos medidas son iguales, se dice que la variable está distribuida simétricamente. Si el valor medio de una variable es mayor que la mediana, su distribución tiene una asimetría positiva (Fig. 10). Si la mediana es mayor que la media, la distribución de la variable tiene un sesgo negativo. La asimetría positiva ocurre cuando la media aumenta a valores inusualmente altos. La asimetría negativa ocurre cuando la media disminuye a valores inusualmente pequeños. Una variable se distribuye simétricamente si no toma ningún valor extremo en ninguna dirección, de modo que los valores grandes y pequeños de la variable se cancelen entre sí.

Arroz. 10. Tres tipos de distribuciones

Los datos representados en la escala A tienen un sesgo negativo. Esta figura muestra una cola larga y un sesgo a la izquierda causado por valores inusualmente pequeños. Estos valores extremadamente pequeños desplazan el valor medio hacia la izquierda y se vuelve menor que la mediana. Los datos que se muestran en la escala B se distribuyen simétricamente. Las mitades izquierda y derecha de la distribución son sus imágenes especulares. Los valores grandes y pequeños se equilibran entre sí, y la media y la mediana son iguales. Los datos que se muestran en la escala B tienen un sesgo positivo. Esta figura muestra una cola larga y sesgada a la derecha, causada por la presencia de valores inusualmente altos. Estos valores demasiado grandes desplazan la media hacia la derecha y se vuelve más grande que la mediana.

En Excel, las estadísticas descriptivas se pueden obtener usando el complemento Paquete de análisis. Ir a través del menú DatosAnálisis de los datos, en la ventana que se abre, seleccione la línea Estadísticas descriptivas y haga clic OK. En la ventana Estadísticas descriptivas asegúrese de indicar intervalo de entrada(Figura 11). Si desea ver estadísticas descriptivas en la misma hoja que los datos originales, seleccione el botón de radio intervalo de salida y especifique la celda donde desea colocar la esquina superior izquierda de las estadísticas mostradas (en nuestro ejemplo, $C$1). Si desea generar datos en una nueva hoja o en un nuevo libro de trabajo, simplemente seleccione el botón de opción apropiado. Marque la casilla junto a Estadísticas finales. Opcionalmente, también puede elegir Nivel de dificultad,k-ésimo más pequeño yk-ésimo mayor.

Si en deposito Datos en la zona Análisis no ves el icono Análisis de los datos, primero debe instalar el complemento Paquete de análisis(ver, por ejemplo,).


Arroz. 11. Estadísticas descriptivas de la rentabilidad anual media de cinco años de fondos con niveles de riesgo muy altos, calculada mediante el complemento Análisis de los datos programas de excel

Excel calcula una serie de estadísticas discutidas anteriormente: media, mediana, moda, desviación estándar, varianza, rango ( intervalo), mínimo, máximo y tamaño de la muestra ( controlar). Además, Excel calcula algunas estadísticas nuevas para nosotros: error estándar, curtosis y asimetría. Error estándar es igual a la desviación estándar dividida por la raíz cuadrada del tamaño de la muestra. Asimetría caracteriza la desviación de la simetría de la distribución y es una función que depende del cubo de las diferencias entre los elementos de la muestra y el valor medio. La curtosis es una medida de la concentración relativa de datos alrededor de la media frente a las colas de la distribución, y depende de las diferencias entre la muestra y la media elevada a la cuarta potencia.

Cálculo de estadísticas descriptivas para la población general

La media, la dispersión y la forma de la distribución discutida anteriormente son características basadas en muestras. Sin embargo, si el conjunto de datos contiene medidas numéricas de toda la población, entonces se pueden calcular sus parámetros. Estos parámetros incluyen la media, la varianza y la desviación estándar de la población.

Valor esperado es igual a la suma de todos los valores de la población general dividida por el volumen de la población general:

donde µ - valor esperado, Xi- i-ésima observación variable X, norte- el volumen de la población general. En Excel, para calcular la esperanza matemática se utiliza la misma función que para la media aritmética: =PROMEDIO().

Varianza de la población igual a la suma de las diferencias al cuadrado entre los elementos de la población general y mat. expectativa dividida por el tamaño de la población:

donde σ2 es la varianza de la población general. Excel antes de la versión 2007 usa la función =VAR() para calcular la varianza de la población, a partir de la versión 2010 =VAR.G().

desviación estándar de población es igual a la raíz cuadrada de la varianza de la población:

Excel antes de la versión 2007 usa =STDEV() para calcular la desviación estándar de la población, a partir de la versión 2010 =STDEV.Y(). Tenga en cuenta que las fórmulas para la varianza de la población y la desviación estándar son diferentes de las fórmulas para la varianza de la muestra y la desviación estándar. Al calcular estadísticas de muestra S2 y S el denominador de la fraccion es n - 1, y al calcular los parámetros σ2 y σ - el volumen de la población general norte.

regla de oro

En la mayoría de las situaciones, una gran proporción de observaciones se concentran alrededor de la mediana, formando un conglomerado. En conjuntos de datos con asimetría positiva, este grupo se ubica a la izquierda (es decir, debajo) de la expectativa matemática, y en conjuntos con asimetría negativa, este grupo se ubica a la derecha (es decir, arriba) de la expectativa matemática. Los datos simétricos tienen la misma media y mediana, y las observaciones se agrupan alrededor de la media, formando una distribución en forma de campana. Si la distribución no tiene un sesgo pronunciado y los datos se concentran alrededor de un cierto centro de gravedad, se puede usar una regla general para estimar la variabilidad, que dice: si los datos tienen una distribución en forma de campana, entonces aproximadamente el 68 % de las observaciones están a menos de una desviación estándar de la expectativa matemática, aproximadamente el 95 % de las observaciones están dentro de dos desviaciones estándar del valor esperado y el 99,7 % de las observaciones están dentro de tres desviaciones estándar del valor esperado.

Por lo tanto, la desviación estándar, que es una estimación de la fluctuación promedio en torno a la expectativa matemática, ayuda a comprender cómo se distribuyen las observaciones e identificar valores atípicos. De la regla empírica se deduce que, para las distribuciones en forma de campana, solo un valor entre veinte difiere de la expectativa matemática en más de dos desviaciones estándar. Por lo tanto, valores fuera del intervalo µ ± 2σ, pueden considerarse valores atípicos. Además, solo tres de 1000 observaciones difieren de la expectativa matemática en más de tres desviaciones estándar. Así, valores fuera del intervalo µ ± 3σ son casi siempre valores atípicos. Para distribuciones muy sesgadas o sin forma de campana, se puede aplicar la regla general de Biename-Chebyshev.

Hace más de cien años, los matemáticos Bienamay y Chebyshev descubrieron de forma independiente una propiedad útil de la desviación estándar. Descubrieron que para cualquier conjunto de datos, independientemente de la forma de la distribución, el porcentaje de observaciones que se encuentran a una distancia que no exceda k desviaciones estándar de la expectativa matemática, no menos (1 – 1/ 2)*100%.

Por ejemplo, si k= 2, la regla de Biename-Chebyshev establece que al menos (1 - (1/2) 2) x 100% = 75% de las observaciones deben estar en el intervalo µ ± 2σ. Esta regla es válida para cualquier k superior a uno. La regla de Biename-Chebyshev es de carácter muy general y es válida para distribuciones de cualquier tipo. Indica el número mínimo de observaciones, la distancia a partir de la cual la esperanza matemática no supera un valor dado. Sin embargo, si la distribución tiene forma de campana, la regla general estima con mayor precisión la concentración de datos alrededor de la media.

Cálculo de estadísticas descriptivas para una distribución basada en frecuencias

Si los datos originales no están disponibles, la distribución de frecuencias se convierte en la única fuente de información. En tales situaciones, puede calcular los valores aproximados de los indicadores cuantitativos de la distribución, como la media aritmética, la desviación estándar, los cuartiles.

Si los datos de la muestra se presentan como una distribución de frecuencias, se puede calcular un valor aproximado de la media aritmética, suponiendo que todos los valores dentro de cada clase se concentran en el punto medio de la clase:

donde - muestra promedio, norte- número de observaciones, o tamaño de la muestra, Con- el número de clases en la distribución de frecuencias, mj- Punto Medio j-ésima clase, Fj- frecuencia correspondiente a j-ésima clase.

Para calcular la desviación estándar de la distribución de frecuencias, también se supone que todos los valores dentro de cada clase se concentran en el punto medio de la clase.

Para comprender cómo se determinan los cuartiles de la serie en función de las frecuencias, consideremos el cálculo del cuartil inferior a partir de los datos de 2013 sobre la distribución de la población rusa por ingreso medio per cápita en efectivo (Fig. 12).


Arroz. 12. La proporción de la población de Rusia con ingresos monetarios per cápita en promedio por mes, rublos

Para calcular el primer cuartil de la serie de variación del intervalo, puede usar la fórmula:

donde Q1 es el valor del primer cuartil, xQ1 es el límite inferior del intervalo que contiene el primer cuartil (el intervalo está determinado por la frecuencia acumulada, la primera superior al 25%); i es el valor del intervalo; Σf es la suma de las frecuencias de toda la muestra; probablemente siempre igual al 100%; SQ1–1 es la frecuencia acumulada del intervalo que precede al intervalo que contiene el cuartil inferior; fQ1 es la frecuencia del intervalo que contiene el cuartil inferior. La fórmula para el tercer cuartil difiere en que en todos los lugares, en lugar de Q1, debe usar Q3 y sustituir ¾ en lugar de ¼.

En nuestro ejemplo (Fig. 12), el cuartil inferior está en el rango 7000.1 - 10,000, cuya frecuencia acumulada es 26.4%. El límite inferior de este intervalo es 7000 rublos, el valor del intervalo es 3000 rublos, la frecuencia acumulada del intervalo que precede al intervalo que contiene el cuartil inferior es 13,4%, la frecuencia del intervalo que contiene el cuartil inferior es 13,0%. Por lo tanto: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13.4) / 13 \u003d 9677 rublos.

Peligros asociados con las estadísticas descriptivas

En esta nota, analizamos cómo describir un conjunto de datos usando varias estadísticas que estiman su media, dispersión y distribución. El siguiente paso es analizar e interpretar los datos. Hasta ahora, hemos estudiado las propiedades objetivas de los datos y ahora pasamos a su interpretación subjetiva. Dos errores acechan al investigador: un tema de análisis elegido incorrectamente y una interpretación incorrecta de los resultados.

Un análisis del desempeño de 15 fondos mutuos de muy alto riesgo es bastante imparcial. Llevó a conclusiones completamente objetivas: todos los fondos mutuos tienen rendimientos diferentes, el diferencial de rendimiento de los fondos varía de -6.1 a 18.5 y el rendimiento promedio es de 6.08. La objetividad del análisis de datos está asegurada por la elección correcta de los indicadores cuantitativos totales de la distribución. Se consideraron varios métodos para estimar la media y la dispersión de datos, y se indicaron sus ventajas y desventajas. ¿Cómo elegir las estadísticas adecuadas que proporcionen un análisis objetivo e imparcial? Si la distribución de datos está ligeramente sesgada, ¿debería elegirse la mediana sobre la media aritmética? ¿Qué indicador caracteriza con mayor precisión la dispersión de los datos: la desviación estándar o el rango? ¿Debe indicarse la asimetría positiva de la distribución?

Por otro lado, la interpretación de datos es un proceso subjetivo. Diferentes personas llegan a diferentes conclusiones, interpretando los mismos resultados. Todo el mundo tiene su propio punto de vista. Alguien considera que la rentabilidad media anual total de 15 fondos con un nivel de riesgo muy alto es buena y está bastante satisfecho con los ingresos recibidos. Otros pueden pensar que estos fondos tienen rendimientos demasiado bajos. Así, la subjetividad debe ser compensada por la honestidad, la neutralidad y la claridad de las conclusiones.

Cuestiones éticas

El análisis de datos está indisolublemente ligado a cuestiones éticas. Se debe ser crítico con la información que difunden los periódicos, la radio, la televisión e Internet. Con el tiempo, aprenderá a ser escéptico no solo sobre los resultados, sino también sobre los objetivos, el tema y la objetividad de la investigación. El famoso político británico Benjamin Disraeli lo dijo mejor: “Hay tres tipos de mentiras: mentiras, malditas mentiras y estadísticas”.

Como se señala en la nota, surgen cuestiones éticas al elegir los resultados que deben presentarse en el informe. Tanto los resultados positivos como los negativos deben ser publicados. Además, al realizar un informe o informe escrito, los resultados deben presentarse de manera honesta, neutral y objetiva. Distinguir entre presentaciones malas y deshonestas. Para ello, es necesario determinar cuáles fueron las intenciones del hablante. A veces, el hablante omite información importante por ignorancia y, a veces, deliberadamente (por ejemplo, si usa la media aritmética para estimar la media de datos claramente sesgados para obtener el resultado deseado). También es deshonesto suprimir resultados que no corresponden al punto de vista del investigador.

Se utilizan materiales del libro Levin et al., Estadísticas para gerentes. - M.: Williams, 2004. - p. 178–209

Función CUARTIL retenida para alinearse con versiones anteriores de Excel