exаmen.xlsx En unа оrgаnización, la ciberseguridad depende de diversоs factоres como: el comportamiento de los usuarios, el tiempo de respuesta ante incidentes y las medidas preventivas implementadas. En esta actividad, se analiza una base de datos de 300 usuarios para estudiar cómo variables como la interacción con correos sospechosos, el tiempo de respuesta, las actualizaciones de seguridad y la capacitación influyen en el nivel de riesgo de ciberseguridad. El objetivo es aplicar herramientas estadísticas para identificar relaciones y construir un modelo predictivo del riesgo. RiskScore: Puntaje de riesgo de ciberseguridad (mayor valor = mayor vulnerabilidad). PClicks: Número de veces que el usuario hace clic en correos de phishing al mes. TiempoR: Tiempo promedio (en minutos) para responder a incidentes de seguridad. Actualizaciones: Número de actualizaciones de seguridad instaladas mensualmente. Entrenamiento: Horas mensuales de capacitación en ciberseguridad. Problema 01 (10 puntos) Para la variable RiskScore, calcule media , mediana y desviación estándar , interprete el comportamiento de esta variable con estas medidas. Realice un histograma de la variable RiskScore, asegure de poner adecuadamente títulos , ¿ que puede indicar respecto a su distribución? Realice un boxplot de la variable RiskScore , que hallazgo adicional encuentra ¿ Que puede concluir con respecto a las medidas estadísticas (media , mediana, desviación estándar ) Histograma y Boxplot , en el sentido de si se complementa el análisis o es redundante respecto a la variable a analizar ? Problema 02 (10 puntos) Se cree que el tiempo promedio de respuesta a incidentes (TiempoR) es significativamente menor a 25 minutos. Realizar un test de hipótesis para la media, indicando: Hipótesis nula y alternativa Estadístico de prueba p-valor Conclusión contextualizada en ciberseguridad Problema 03 (10 puntos) Evaluar si existe correlación significativa entre: TiempoR y RiskScore Hipótesis nula y alternativa -Test de correlación de Pearson Coeficiente de correlación p-valor ¿Qué decisión se toma? Interpretación en contexto de riesgo digital Gráfico de dispersión Problema 04 (30 puntos) Evaluar modelo de Regresión lineal múltiple Se desea evaluar cómo las variables: interacción con correos sospechosos, el tiempo de respuesta, las actualizaciones de seguridad y la capacitación influyen en el nivel de riesgo de ciberseguridad. Presente la ecuación del modelo completo donde la variable dependiente es RiskScore, interprete los coeficientes. Analice el modelo en términos de R² ajustado. Determine si todas las variables independientes son significativas. Si no lo son, elimine las no significativas y presente el nuevo modelo. Compare el R² ajustado de ambos modelos. ¿Cuál es mejor? Evalúe la normalidad de los residuos mediante el test de Shapiro-Wilk con el modelo inicial Plantee las hipótesis, indique el p-valor, construya QQ - plot y concluya si los residuos siguen una distribución normal. Para todas las actividades considerar un nivel de significancia α=0,05