Skip to content

Commit 301b854

Browse files
committed
Estadistica
1 parent faca50f commit 301b854

File tree

3 files changed

+71
-1
lines changed

3 files changed

+71
-1
lines changed

_posts/2024-04-02-estadistica.md

+71-1
Original file line numberDiff line numberDiff line change
@@ -323,26 +323,96 @@ Si $X$ e $Y$ no son independientes.
323323

324324
![Diagrama de Dispersión Ejemplo B](../assets/img/diagrama_dispersion.png)
325325

326+
### Covarianza
327+
328+
La covarianza es una medida estadística que indica el grado de variación conjunta entre dos variables aleatorias. En otras palabras, la covarianza mide cómo cambian dos variables juntas. Si la covarianza es positiva, significa que cuando una variable aumenta, es probable que la otra también aumente. Por el contrario, si la covarianza es negativa, indica que cuando una variable aumenta, es probable que la otra disminuya. Si la covarianza es cercana a cero, las variables están poco correlacionadas.
329+
330+
$$S_xy = \frac{1}{N}\sum_{i=1}^h\sum_{j=1}^kx_iy_j - \bar{x}\bar{y}$$
331+
332+
Ejemplo A:
333+
334+
Supongamos que tenemos una empresa de desarrollo de software que vende dos productos: un software de gestión de proyectos y un software de gestión de recursos humanos. Queremos entender cómo se relacionan las ventas mensuales de estos dos productos.
335+
336+
Para ello, registramos las ventas mensuales de ambos productos durante un año y calculamos la covarianza entre las ventas del software de gestión de proyectos (variable X) y las ventas del software de gestión de recursos humanos (variable Y).
337+
338+
Interpretación:
339+
340+
* Una covarianza positiva significa que cuando las ventas del software de gestión de proyectos aumentan en un mes, es probable que las ventas del software de gestión de recursos humanos también aumenten en ese mismo mes.
341+
342+
* Una covarianza negativa implicaría lo contrario: cuando las ventas del software de gestión de proyectos aumentan, las ventas del software de gestión de recursos humanos tienden a disminuir en ese mes.
343+
344+
* Una covarianza cercana a cero indicaría que no hay una relación clara entre las ventas de ambos productos en un mes determinado.
345+
346+
Ejemplo B:
347+
348+
Imaginemos una empresa de tecnología que fabrica dispositivos electrónicos, como smartphones y tabletas. La empresa desea analizar la relación entre la cantidad de publicidad en línea que realiza mensualmente (en euros gastados) y la cantidad de unidades de productos vendidos cada mes.
349+
350+
Durante un período de varios meses, la empresa registra el gasto mensual en publicidad en línea y las ventas mensuales de sus productos. Luego, calcula la covarianza entre el gasto en publicidad en línea (variable X) y las ventas de productos (variable Y). Supongamos que la covarianza resultante es positiva, lo que indica una relación creciente entre ambas variables.
351+
352+
Interpretación:
353+
354+
* Una covarianza positiva sugiere que cuando la empresa invierte más en publicidad en línea en un mes determinado, las ventas de productos tienden a aumentar en ese mismo mes.
355+
356+
* Esto podría indicar que la publicidad en línea tiene un impacto positivo en las ventas de la empresa.
357+
326358
## Regresión lineal y correlación.
327359

328-
### Covarianza
360+
La relación estadística entre variables se refiere al estudio de cómo dos o más variables están relacionadas entre sí. Hay dos conceptos fundamentales para comprender esta relación: correlación y regresión.
361+
362+
La correlación es una medida estadística que indica el grado de dependencia o relación entre dos variables. Se utiliza para determinar si y cómo las variables cambian juntas. Una correlación puede ser positiva, negativa o neutra (cercana a cero).
363+
364+
Coeficiente de correlación lineal:
365+
366+
$$r=\frac{S_xy}{S_x S_y}$$
367+
368+
* Si $-1 <= r < 0$ la correlación lineal es negativa y las rectas de regresión (diferentes) serán decrecientes
329369

370+
* Si $0 < r <= 1$ la correlación lineal es positiva y las rectas de regresión (diferentes) serán crecientes.
330371

372+
* Si $r = 0$ las rectas son paralelas
331373

374+
La regresión es un análisis estadístico que se utiliza para entender la relación entre una variable dependiente (la variable que se quiere predecir) y una o más variables independientes (las variables que se utilizan para predecir). La regresión permite determinar y obtener la estructura de dependencia que mejor exprese el tipo de relación entre las variables.
332375

333376

377+
LLamaremos regresión de $Y$ sobre $X$ a la función que explica la variable $Y$ para cada valor de $X$. La regresion de $X$ sobre $Y$ nos hablará del comportamiento de $X$ para cada valor de $Y$
334378

379+
La recta de regresión de $Y$ sobre $X$:
335380

381+
$$(y - \bar{y}) = \frac{S_xy}{S^2_x}(x - \bar{x})$$
336382

383+
La recta de regresión de $X$ sobre $Y$:
337384

385+
$$(x - \bar{x}) = \frac{S_xy}{S^2_x}(y - \bar{y})$$
338386

387+
Se cortan en el punto $(\bar{x},\bar{y})$
339388

389+
Las pendientes de las rectas tendrán el mismo signo que tenga la covarianza.
340390

391+
* Si $S_xy > 0 =>$ las rectas son crecientes
392+
* Si $S_xy < 0 =>$ las rectas son decrecientes
393+
* Si $S_xy = 0 =>$ las rectas son paralelas a los ejes de coordenadas y perpendiculares entre sí.
394+
395+
### Consideraciones sobre la regresión y la predicción
396+
397+
La predicción de $Y$ para $X = x_0$ será:
398+
399+
$$y_0 = \bar{y} + \frac{S_xy}{S^2_x}(x_0 - \bar{x})$$
400+
401+
Esta predicción será tanto más fiable cuando mejor sea la correlación lineal entre las varibles, luego una medida aproximada de la bonda de la predicción es $r$ coeficiente de coorrelación lineal-
402+
403+
Ejemplo:
341404

405+
Imagina una empresa de desarrollo de software que está interesada en entender la relación entre el tamaño del equipo de desarrollo y la velocidad de entrega de proyectos de software. La empresa quiere determinar si hay alguna relación entre estas dos variables y cómo pueden utilizar esa información para mejorar su proceso de desarrollo.
342406

407+
**Correlación**:
343408

409+
* La empresa comienza analizando la correlación entre el tamaño del equipo de desarrollo (número de desarrolladores) y la velocidad de entrega de proyectos (medida en la cantidad de funcionalidades implementadas por mes, por ejemplo). Si encuentran una correlación positiva significativa, esto indicaría que a medida que el tamaño del equipo aumenta, la velocidad de entrega tiende a aumentar también. Una correlación negativa sugeriría lo contrario, mientras que una correlación cercana a cero indicaría una relación débil o inexistente.
344410

345411

412+
**Regresión**:
346413

414+
* Después de determinar la correlación, la empresa decide utilizar la regresión para modelar la relación de manera más detallada. Podrían ajustar un modelo de regresión lineal para predecir la velocidad de entrega de proyectos en función del tamaño del equipo de desarrollo. Esto les permitiría obtener una ecuación que relacione estas dos variables y usarla para hacer predicciones sobre la velocidad de entrega esperada para diferentes tamaños de equipo.
347415

416+
![Regresión lineal correlación con buen ajuste](../assets/img/regresion_lineal_correlacion_buen_ajuste.png)
348417

418+
![Regresión lineal correlación con mal ajuste](../assets/img/regresion_lineal_correlacion_mal_ajuste)
Loading
Binary file not shown.

0 commit comments

Comments
 (0)