Maestría en Analítica e Inteligencia de Negocios
URI permanente para esta colecciónhttps://hdl.handle.net/20.500.14625/23
Examinar
Envíos recientes
Mostrando 1 - 20 de 91
Item type: Ítem , Influencia de los factores sociodemográficos y de la jornada académica asociados a la probabilidad de demora en la firma del contrato de aprendizaje en el programa tecnólogo de Gestión Administrativa del SENA en Bogotá (2022–2024)(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2026-01-29) Pinilla Peña, Natalia; Riaño Guevara, María Ximena; Moreno Ospina, Julián Ricardo; Cardozo Munar, Carlos EduardoEsta investigación se propuso analizar la demora en la firma de contratos de aprendizaje en el programa de Gestión Administrativa del SENA en Bogotá (2022–2024); una realidad que afecta a cerca del 52% de los aprendices y que impacta con especial rigor a la población vulnerable de estratos bajos. Para desentrañar la influencia de los factores sociodemográficos en este fenómeno, se desplegó una estrategia metodológica cuantitativa sobre 3.294 registros que, lejos de limitarse a la estadística descriptiva, integró técnicas avanzadas de analítica: tras aplicar Feature Selection, se entrenaron y compararon modelos de machine learning (como Random Forest, XGBoost), siendo el LightGBM el que demostró un desempeño superior a partir del análisis de la métrica del f1-score propendiendo por el mayor valor posible de accuracy. Este análisis permitió, finalmente, entender el comportamiento de variables determinantes como la edad, el género y la jornada; hallazgos que constituyen evidencia sólida para optimizar la gestión institucional y alinear mejor la oferta educativa con las demandas reales del sector productivo. Asimismo, se evidencia la necesidad de obtener y analizar más variables sociodemográficas, académicas o empresariales para robustecer el análisis.Item type: Ítem , Demanda energética en San Andrés Islas: un análisis univariante de series de tiempo durante el periodo 2018–2022(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2026) Londoño Caro, Sulhey Eliana; Moreno Granados, Juan Pablo; Duarte Sánchez, Julián; Florez Bolaños, JaimeEl objetivo principal de la investigación se enmarca en evaluar el comportamiento de la demanda energética en San Andrés durante el periodo 2018–2022, a partir de un enfoque descriptivo y predictivo, con el fin de comprender la dinámica del consumo energético y aportar insumos para la planeación del recurso energético en contextos insulares. El estudio se desarrolló mediante un enfoque cuantitativo, utilizando información histórica de consumo energético para identificar patrones relevantes en la serie temporal. Los resultados evidenciaron la presencia de tendencias y patrones estacionales asociados al comportamiento del consumo eléctrico, los cueles reflejan la dinámica propia de la actividad económica y poblacional de la isla. A partir de estos hallazgos, se identificó que la incorporación de una variable dicotómica permitió mejorar la estabilidad y el ajuste del modelo predictivo, sin alterar su estructura univariante, logrando explicar aproximadamente el 95% de la variabilidad de la demanda energética en un horizonte de pronóstico de seis meses. La investigación recomienda el uso del modelo SARIMAX para la estimación del comportamiento futuro de la demanda energética en San Andrés Islas. Asimismo, se sugiere que futuras investigaciones amplíen el periodo de análisis e integren variables complementarias que permitan verificar, contrastar y refinar los resultados obtenidos, fortaleciendo el análisis predictivo en contextos insulares.Item type: Ítem , Análisis de las tendencias y patrones de la gestión de inventarios mediante series de tiempo en C.A. Importaciones (2008–2024)(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2026) Sanabria Vargas, Yerly Judhit; Vivas Fuentes, LeandroEl propósito de la presente investigación fue analizar las tendencias y patrones de comportamiento del inventario asociado a una presentación específica de varitas aromatizadas, comercializada por una empresa de importaciones en Colombia durante el periodo comprendido entre 2008 y 2024. El producto fue seleccionado por representar el mayor volumen de rotación histórica dentro de su categoría. Con ello se buscó identificar que método podría aportar una mayor viabilidad al proceso de compras de inventarios mediante el uso de modelos predictivos, que permitieran anticipar la demanda futura y en consecuencia optimizar la gestión de inventarios para reducir riesgos de desabastecimiento o sobre stock. El estudio se desarrolló bajo un enfoque cuantitativo de tipo longitudinal, basado en datos históricos de ventas mensuales, con un total de 204 observaciones, de las cuales 202 registraron ventas efectivas. Se emplearon técnicas de análisis de series de tiempo, aplicando modelos de descomposición como X-11 y el filtro Hodrick–Prescott, así como modelos predictivos ARIMA y su versión transformada mediante logaritmo (log-ARIMA). La evaluación del desempeño incluyó métricas de precisión como MAE RMSE y MAPE complementadas con pruebas de diagnóstico sobre residuos entre ellas Ljung–Box Jarque–Bera y Shapiro–Wilk con el fin de verificar la auto correlación y distribución de los errores. Los hallazgos demuestran que la serie presenta estacionalidad y fluctuaciones cíclicas que pueden ser modeladas con un nivel adecuado de precisión. X-11 obtuvo los mejores valores en MAE y RMSE dentro de los métodos de descomposición mientras que el filtro Hodrick–Prescott mostró resultados levemente menos favorables pero consistentes con la tendencia general del inventario. En cuanto a la predicción el modelo original ARIMA (113) logró un buen desempeño preliminar; aunque, el modelo Log-ARIMA (011) registró una mejora en el error porcentual (MAPE del 18.66%) y mayor estabilidad estadística en los residuos lo que respalda su mayor confiabilidad para las proyecciones.Item type: Ítem , Modelos de machine learning y clusterización, análisis exploratorio para la predicción del riesgo crediticio rural: aplicación a la cartera de Finagro 2023(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2026) Ochoa Becerra, Diana Marcela; Sierra Bonilla, Yenny PaolaEl propósito de esta investigación es aplicar y evaluar modelos analíticos avanzados, basados en machine learning y segmentación por clustering, con el fin de predecir el riesgo de incumplimiento en la cartera de créditos respaldados por FINAGRO. El Objetivo, es fortalecer la toma de decisiones en el otorgamiento, monitoreo y gestión temprana del riesgo crediticio en el contexto agropecuario colombiano, integrando variables del cliente y del contexto agropecuario. Se emplea un enfoque cuantitativo, siguiendo la metodología CRISP-DM, e incorpora modelos supervisados como Regresión Logística, Random Forest y HistGradientBoosting, comparando su desempeño a través de métricas robustas (ROC-AUC, PR-AUC, precisión, recall, exactitud). Adicionalmente, se utilizan técnicas de clusterización (K-Means) para identificar segmentos diferenciados de riesgo en la población crediticia. El análisis se realiza sobre la base de datos reales correspondientes a los cuatro cortes trimestrales de la cartera de FINAGRO durante 2023. El modelo HistGradientBoosting obtuvo los mejores resultados predictivos (ROC-AUC = 0.9584, PR-AUC ≈ 0.7, precisión = 0.66, recall = 0.92 a umbral KS), evidenciando un buen desempeño frente a los demás modelos evaluados. Por su parte, la clusterización identificó cuatro grupos estructuralmente diferenciados, con tasas de mora que oscilan entre 4.8% y 14.3% y perfiles de riesgo útiles para políticas de pricing y segmentación. El estudio confirma la relevancia de métricas como PR-AUC y KS en contextos de desbalanceo de clases, se demuestra la coherencia entre los marcos teóricos y la evidencia empírica, mostrando cómo la analítica avanzada reduce las asimetrías informativas y potencia la inclusión financiera.Item type: Ítem , Evaluación de sentimientos por cambio de sistema ERP de SAP a Odoo: sentimientos de los usuarios finales durante los primeros dos años de estabilización (2023-2024)(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2026) Suárez Jiménez, Sebastián; Tirado Cifuentes, Cristian CamiloEl objetivo de esta investigación fue analizar el comportamiento emocional de los usuarios finales durante los dos primeros años posteriores a la transición del sistema ERP SAP al sistema Odoo, a través de los tickets registrados en la mesa de ayuda en los años 2023 y 2024. El propósito central consistió en caracterizar los sentimientos expresados en dichos reportes, identificar patrones emocionales asociados a tipos de incidencias y evaluar si la transición produjo cambios emocionales significativos durante el periodo de estabilización. La investigación adoptó un enfoque cuantitativo basado en técnicas de análisis de datos y procesamiento de lenguaje natural (PLN). Las descripciones de los tickets fueron procesadas mediante Python empleado dos modelos de análisis de sentimientos: VADER y un modelo LLM de Ollama, ambos optimizados para idioma español. Adicionalmente, se aplicaron técnicas de agrupamiento no supervisado, inicialmente K -means y posteriormente clustering jerárquico, dada la naturaleza mixta de las variables analizadas. Los hallazgos muestran que el comportamiento emocional de los usuarios fue predominantemente neutral en ambos modelos de PLN. No obstante, se observo una mayor proporción de sentimientos positivos en VADER (23,99%) frente al LM (10,93%), diferencia atribuible al enfoque semántico de cada modelo y al carácter operativo y descriptivo de los tickets. Los sentimientos negativos se concentraron en periodos específicos particularmente en franjas nocturnas, evidenciando con el clustering jerárquico aplicado, que las variaciones emocionales están más vinculadas a la organización del servicio que al sistema ERP en abstracto. Los resultados sugieren fortalecer la gestión operativa de la organización mediante el incremento de capacidad en horas críticas, establecimiento de límites de trabajo en curso, implementación de checklist obligatorios para evitar tickets incompletos, y definición de ventanas fijas de aprobación para reducir retrasos y emociones negativas asociadas. La investigación también aporta evidencia sobre la relación entre adopción tecnológica, diseño del servicio y afectividad del usuario. Por último, se debe tener en cuenta que, la naturaleza transaccional y descriptiva de los tickets redujo la detección de matices emocionales, favoreciendo clasificaciones neutrales, y la estructura de los datos dificulto el uso de modelos de clustering como K -means, requiriendo métodos alternativos. Estas limitaciones abren líneas futuras como el uso de modelos contextualizados (v.gr.Bert), y la aplicación del horizonte temporal para observar la maduración emocional más allá del periodo de estabilización.Item type: Ítem , Patrones de admisión en pregrado en la ETITC: segmentación de audiencias con k-means y efectividad del marketing orgánico en Facebook (2024-2, 2025-1)(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2026) Chaparro Parra, Cristian David; Tirado Cifuentes, Cristian CamiloEl presente estudio analiza la relación entre las publicaciones realizadas en la página oficial de Facebook de la Escuela Tecnológica Instituto Técnico Central (ETITC) y la captación de estudiantes en los procesos de admisión a programas de pregrado durante los periodos 2024-2 y 2025-1. El objetivo fue identificar los factores asociados a la efectividad del marketing digital orgánico en un contexto de política de gratuidad y restricciones presupuestales en la educación superior pública. La investigación se desarrolló bajo un enfoque cuantitativo, sustentado en una postura epistemológica empirista-positivista y un diseño descriptivo-correlacional. Se analizaron datos provenientes de Facebook Insights, Google Analytics del sitio de inscripciones y registros institucionales de inscritos, admitidos y matriculados. Para el análisis se emplearon técnicas estadísticas de correlación y minería de datos, incluyendo el algoritmo de clustering K-means, con el fin de identificar patrones de comportamiento en el proceso de captación. Los resultados evidencian una relación positiva significativa entre las métricas de interacción en Facebook, el tráfico al sitio de inscripciones y los indicadores de captación estudiantil. Las visitas al sitio web y los clics en publicaciones institucionales se identificaron como los factores con mayor asociación al número de inscritos diarios, mientras que el volumen de publicaciones mostró una menor incidencia. El análisis de clústeres permitió distinguir perfiles diferenciados de comportamiento digital asociados a distintos niveles de captación. En conclusión, la efectividad del marketing digital orgánico en la ETITC se explica principalmente por la calidad de la interacción digital y su capacidad para generar tráfico hacia los canales institucionales de inscripción, confirmando su relevancia como herramienta estratégica en los procesos de admisión universitaria.Item type: Ítem , Factores determinantes de la colocación laboral de personas con discapacidad física a través del servicio público de empleo en Bogotá 2022–2024, mediante modelos de aprendizaje automático(2025) Trujillo Marroquín, Jorge Noe; Valbuena Bernal, María Fernanda; Serrano León, Yeimmy KatherineEsta investigación se orienta a analizar los determinantes que influyen en la colocación laboral de personas con discapacidad física (PcD física) inscritas en el Servicio Público de Empleo (SPE) de Bogotá entre 2022 y 2024, mediante modelos predictivos que fortalezcan la toma de decisiones en procesos de intermediación laboral, convirtiéndose en un insumo para la generación de políticas públicas inclusivas. El estudio empleó un enfoque cuantitativo explicativo, utilizando la metodología CRISP-DM. Su valor distintivo radica en la aplicación conjunta de técnicas de aprendizaje automático sobre un conjunto de datos altamente desbalanceado, característico de contextos sociales complejos. De modo que se analizaron microdatos anonimizados del SPE, considerando variables sociodemográficas, laborales y del proceso de intermediación. Se aplicaron cuatro modelos de clasificación supervisada: regresión logística, Random Forest, XGBoost y redes neuronales artificiales. Para corregir el fuerte desbalance de clases que se segmentaban en 93% no colocados vs. 7 % colocados, se utilizó la técnica de sobremuestreo SMOTE y métricas específicas como F1-score, recall, precisión y AUC. El modelo XGBoost obtuvo el mejor desempeño global, con una precisión del 94.9 %, las variables más relevantes para predecir la colocación fueron el nivel educativo, la edad, la experiencia laboral previa, el tipo de intermediación y el tipo de discapacidad. Se identificaron diferencias importantes por sexo y edad, así como disparidades en la formación laboral y experiencia previa, lo cual refuerza la necesidad de intervenciones diferenciadas. Los hallazgos de este estudio pueden tener aplicaciones directas en el funcionamiento del SPE, al permitir una mejor orientación en la asignación de servicios y contribuir al diseño más efectivo de políticas públicas. Teóricamente, la investigación aporta evidencia sobre el valor de la analítica predictiva en contextos sociales desbalanceados, mientras que, desde el punto de vista metodológico, refuerza la necesidad de aplicar modelos robustos con enfoque de equidad algorítmica. Una de las principales limitaciones del estudio es la falta de variables vinculadas con la calidad del empleo y las características de las posiciones vacantes, lo que restringió el análisis a la colocación efectiva sin evaluar su sostenibilidad. Además, el desbalance de clases implicó retos técnicos relevantes que requirieron ajustes durante el entrenamiento y validación de los modelos.Item type: Ítem , Predicción de casos de VIH a partir de variables de incidencia en localidades de Bogotá del 2015 al 2028(2025) Urrego Navarrete, Yhoan Sebastian; Espitia Cardozo, Jose Luis; Flórez Bolaños, JaimeEl objetivo de esta investigación fue estimar el desempeño de distintos modelos en la predicción de variables y comportamientos de estas mismas con el VIH. Esto con un enfoque cuantitativo utilizando datos del observatorio de Bogotá. En este se compararon tres modelos de clasificación como la Regresión Logística Multinomial, la Maquina de Soporte Vectorial y Random Forest. Estos fueron entrenados y testeados por medio del método Hold Out separando así los datos en una parte mayor para entrenamiento y un porcentaje menor para el testeo de manera que se ajustara en los diferentes modelos para evitar sobreajuste. Para evaluar su desempeño utilizando métricas como lo son: accuracy, precisión, recall y f1-score, a su vez realizando una validación cruzada en el Random Forest ya que este generaba sobreajuste. Resultados: los modelos Regresión Logística Multinomial y Random Forest obtuvieron el mejor desempeño en la predicción de los casos, ya que obtuvieron un f1-score de RL 0.927 y RF 0.926. Mientras que la Maquina de Soporte Vectorial se destacó en clasificar los casos positivos ya que este obtuvo una precisión del 0.918, pero con un menor desempeño en general. Se evidencio que las variables más representativas fueron: Edad, Régimen de Seguridad Social y Mecanismo de Transmisión. Recomendaciones/implicaciones: se recomienda con base a los resultados apoyar a las entidades de vigilancia de alto costo para obtener más variables psicosociales y de comportamientos para fortalecer los modelos de predicción. Adicional, implementar estos modelos para la detección temprana y planificar mejor la asignación de recursos. Limitaciones: las principales limitaciones se evidencio la calidad de los datos y el acceso a la información. Por la complejidad para encontrar la información consolidada y completa. También la falta de variables psicosociales y de comportamientos para mejorar la capacidad predictiva.Item type: Ítem , Análisis del impacto económico en la implementación del sistema de pagos electrónicos sobre la demanda de dinero en Colombia, periodo 2001-2022(2025) Monroy Moreno, Diego Sebastián; Quintero Castillo, Yakeline; Flórez Bolaños, JaimeLos servicios que presta el Banco de la República contribuyen al funcionamiento seguro y eficiente de los sistemas de pago mediante la prestación de diversos servicios a las entidades financieras que resultan fundamentales para la actividad económica del país y para el bienestar de la ciudadanía. Estos comprenden el depósito y liquidación de valores, la apertura y manejo de cuentas de depósito, la transferencia electrónica de fondos y la compensación interbancaria. Con base en lo anterior, esta investigación busca analizar el impacto de los sistemas de pago de alto y bajo valor sobre la demanda de dinero en Colombia, periodo 2001-2022. Para ello se parte del uso de técnicas cuantitativas para realizar la descripción de la evolución y funcionamiento de los sistemas de pago y su importancia económica en Colombia, se describe el comportamiento y la tendencia de las principales operaciones que conforman los sistemas de pagos de alto valor y sistemas de pago de bajo valor de la economía colombiana; se usa la técnica de diagramas de dispersión para analizar el nivel de aceptación del sistema de pagos y como afectan en la demanda de dinero; por último se estableció una metodología econométrica, donde se aplican las metodologías de cointegración, modelo VAR y de corrección de error, modelo VEC para determinar la existencia de una relación de equilibrio entre los sistemas de pago y la demanda de dinero.Item type: Ítem , Análisis de variables determinantes en el incumplimiento de pagos de créditos mediante modelos de clasificación: caso Rena Ware de Colombia (2022-2025)(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Chia Niño, Geralding; Chia Niño, Aura Fabiola; Serrano León, Yeimmy KatherineLa investigación realizada tuvo como finalidad presentar un análisis acerca de las variables que afectan en el incumplimiento de pagos de los créditos que otorga la compañía Rena Ware de Colombia S.A.S. usando modelos de clasificación para predecir la probabilidad de riesgo crediticio de los clientes en el periodo 2022 a junio 2025. Dentro del análisis realizado, se buscó determinar los factores más relevantes en el comportamiento de pago (demográficos y financieros) con el fin de que la empresa pueda fortalecer su gestión de cartera y mejorar los procesos de evaluación de créditos. El enfoque sobre el cual se desarrolló esta investigación fue un enfoque cuantitativo, con alcance explicativo y predictivo. La base de datos sobre la cual se realizó el estudio corresponde a un dataset suministrado por Rena Ware de 11.860 créditos otorgados durante los años 2022 a junio 2025, tomando cada crédito como una unidad individual de estudio. Dicha base fue constituida una vez realizado un proceso de depuración y normalización de la base de datos con el fin de dejar únicamente las variables más relevantes para el estudio e información completa y consistente. Posteriormente, se aplicaron los modelos de Regresión Logística y Random Forest sin balanceo y con diferentes técnicas de balanceo: Class weight (ponderación de clases), RUS (Random Undersampling), ROS (Random Oversampling) y Smote (Synthetic Minority Oversampling Technique) y se evaluó su desempeño mediante métricas como AUC, F1-score, precisión y sensibilidad. Los resultados evidenciaron que ambos modelos con diferentes técnicas de balanceo lograron un desempeño aceptable con valores AUC entre 0.76 y 0.84. Sin embargo, el modelo Random Forest con técnicas de balanceo ROS, RUS y Smote obtuvo el mejor desempeño por su equilibrio entre precisión y sensibilidad (AUC promedio de 0.835, Recall de 0.628, Accurancy de 0.777 y F-1 score promedio de 0.632). Aunque finalmente, para el contexto de Rena Ware, el modelo que mejor se adapta es el Random Forest con balanceo Smote cuyo AUC fue 0.829 por su capacidad de detección de morosos sin ser radical y adverso al riesgo. De igual forma, se implementó el método de la rejilla en busca de optimización de los modelos, no obstante, los resultados obtenidos no fueron significativamente mejores en comparación a los modelos iniciales sin optimización. Así mismo, el modelado permitió identificar las variables con mayor incidencia en el incumplimiento encontrando que, el puntaje crediticio, la cuota inicial, la tasa efectiva anual, el saldo a financiar, los ingresos y la edad son las variables con mayor peso (0.78 en conjunto) y las más determinantes a la hora de evaluar el incumplimiento. En caso de que la empresa Rena Ware desee implementar dentro de sus procesos de evaluación crediticio algún modelo de clasificación, se recomienda el uso del Random Forest ya que, le permitirá clasificar y priorizar los casos de mayor riesgo. Finalmente, es importante mencionar que existen limitaciones con el estudio realizado relacionados con la disponibilidad y alcance de los datos ya que, la información utilizada proviene exclusivamente de los registros internos de la empresa en el momento de la aprobación de los créditos y no incorporan variables macroeconómicas o externas que pudiesen robustecer los modelos. Futuras investigaciones podrían ampliar la base de datos e integrar esta información para obtener un modelo más preciso y mejorar así los resultados.Item type: Ítem , Uso del procesamiento de lenguaje natural para la identificación de las habilidades requeridas en el mercado laboral en cargos de manejo de data(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Delgado Cortés, Karen Eliana; Tirado Cifuentes, Cristian CamiloEste estudio desarrolla un modelo basado en técnicas de procesamiento de lenguaje natural (PLN) para identificar las habilidades más demandadas en perfiles asociados al manejo de datos en Colombia, partiendo de la brecha existente entre la alta oferta de vacantes en el sector de información y comunicaciones y la baja ocupación efectiva de estos cargos, brecha atribuida a la posible desalineación entre los perfiles solicitados y las competencias de los candidatos en sus perfiles laborales. Para abordar este problema, se analizaron 1700 vacantes publicadas en la plataforma El Empleo Colombia, en un periodo comprendido entre junio y noviembre de 2024, mediante una metodología mixta que integró minería de datos y PLN. El proceso incluyó la extracción automatizada de información, el preprocesamiento y normalización de textos, la construcción de un diccionario de habilidades técnicas y blandas, y la aplicación de técnicas como TF‑IDF, Latent Semantic Analysis (LSA) y análisis de n‑gramas. Los resultados evidencian que las habilidades técnicas más solicitadas corresponden al análisis de datos, manejo de bases de datos, machine learning, big data, desarrollo web, business intelligence y SQL. En cuanto a competencias profesionales, destacan el dominio del inglés, el trabajo en equipo y la toma de decisiones. Asimismo, se identificaron perfiles recurrentes como analista de datos e ingeniero de datos. El modelo propuesto permite caracterizar de manera sistemática las competencias requeridas por el mercado laboral, aportando insumos valiosos para candidatos e instituciones educativas interesadas en ajustar sus perfiles y programas a las necesidades reales del sector.Item type: Ítem , Créditos de libre inversión de las cajas de compensación familiar en Colombia: hechos estilizados y modelación utilizando series de tiempo(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Hernández Ramírez, Claudia Liliana; Díaz Hernández, Yully Negibia; Amaya Gómez, FelipeLas cajas de compensación familiar en Colombia desempeñan un rol clave en la inclusión financiera de trabajadores de ingresos bajos y medios, mediante la oferta de créditos sociales con tasas preferenciales. El estudio adopta un enfoque cuantitativo, de tipo no experimental y alcance descriptivo–analítico, basado en la modelación de series de tiempo. Los datos fueron obtenidos mediante APIs públicas del portal de Datos Abiertos del Gobierno de Colombia y corresponden al periodo comprendido entre enero de 2023 y mayo de 2025. A partir de estos registros se construyó una serie temporal semanal de la tasa efectiva promedio ponderado, calculada con base en los montos desembolsados y el número de créditos otorgados. El proceso incluyó etapas de extracción, limpieza, validación estructural y análisis exploratorio, garantizando la trazabilidad y reproducibilidad de los resultados. Los hallazgos confirman la pertinencia del uso de modelos de series de tiempo para apoyar la toma de decisiones en el crédito social, al permitir estimaciones más precisas y oportunas de la tasa de colocación.Item type: Ítem , Impacto del desempeño en las Pruebas Saber Pro en las desigualdades salariales de género de los egresados profesionales en economía, administración, contaduría y afines en Colombia en 2022: un análisis bajo mínimos cuadrados ordinarios(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Soto Pinto, Lina Marcela; Aguilera Prado, Marco AntonioEl presente estudio se propuso evaluar la existencia y magnitud de la relación entre el desempeño en las competencias genéricas, medidas por las Pruebas Saber Pro 2021, y la brecha salarial de género de los egresados profesionales en Economía, Administración, Contaduría y afines en Colombia en 2022. El análisis busca identificar los factores de capital humano y los elementos de estructura educativa que contribuyen a la disparidad salarial en las etapas iniciales de la carrera profesional. Bajo un enfoque cuantitativo de corte positivista, empleando un diseño no experimental, correlacional y explicativo, la investigación integró dos bases de datos secundarias: los resultados de competencias genéricas de 72,246 estudiantes (Saber Pro 2021) y los registros agregados de Ingreso Base de Cotización (IBC 2022) de 53,538 egresados del Observatorio Laboral para la Educación (OLE). Descriptivamente, el estudio documentó una brecha salarial de género promedio del 4.9% en la media de ingresos, con hombres percibiendo 2.285 SMMLV y mujeres 2.069 SMMLV. El análisis reveló una diferencia en competencias: las mujeres superan en Lectura Crítica y Comunicación Escrita, mientras que los hombres obtienen mayores puntajes y más dispersos en Razonamiento Cuantitativo e Inglés. La fase de análisis estadístico incluyó un Análisis de Componentes Principales (ACP) y un Análisis Factorial (AF) que se aplicaron para reducir la dimensionalidad y mitigar la alta multicolinealidad observada entre los puntajes de las competencias ( > 0.8), garantizando la solidez de los estimadores. El componente explicativo se ejecutó mediante la Regresión de Mínimos Cuadrados Ordinarios (MCO) a través de una Ecuación de Mincer expandida; centrando el análisis en los efectos promedio, sin explorar heterogeneidades o disparidades en los extremos de la distribución salarial. El modelo de regresión, que explicó el 33.7% de la varianza salarial, confirmó que las competencias de Razonamiento Cuantitativo (0.0085) e Inglés (0.0069) son predictores positivos y significativos del ingreso. El hallazgo más crítico es la persistencia y la magnitud del coeficiente de la variable de género, cuyo coeficiente (0.1416), evidencia una brecha salarial de género residual del 14,2% a favor de los hombres. Esta disparidad que persiste tras controlar el capital humano observable (incluyendo las competencias Saber Pro, sector de la institución educativa, o modalidad de estudio), denota una penalización salarial por género que no responde a la productividad observable. Para el mercado laboral sugiere la presencia de barreras estructurales o sesgos de valoración que las competencias por si solas, no logran mitigar. Se recomienda que las políticas públicas y empresariales se centren en contrarrestar el sesgo de género inherente en la valoración del capital humano. Adicionalmente, el mercado claramente recompensa las habilidades en Razonamiento Cuantitativo e Inglés; por lo tanto, es necesario reforzar activamente la formación de las egresadas en estas áreas. Las conclusiones se restringen por: el uso de datos agregados (no individuales); la operacionalización del IBC mediante rangos; la violación de la Normalidad de Residuales del MCO; y la omisión de la experiencia real y el impacto de las responsabilidades domésticas, al asumirse la experiencia potencial como cero.Item type: Ítem , Implementación de un modelo de clustering aplicado al sector de resellers tecnológicos en América Latina para la identificación de patrones de compra – año 2024(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Calderón Castañeda, Cristian Camilo; Tirado Cifuentes, Cristian CamiloEste proyecto se centra en el estudio e implementación de algoritmos de clustering aplicados al sector tecnológico en América Latina. El objetivo central del estudio es examinar los patrones de compra mediante técnicas de aprendizaje supervisado y no supervisado, apoyadas por herramientas de análisis multivariado, con el fin de comprender el comportamiento del consumidor y fortalecer la segmentación de mercados. La unidad de análisis corresponde a empresas resellers del sector tecnológico latinoamericano, considerando variables financieras y comerciales relacionadas con ingresos, rentabilidad y localización geográfica. Mediante la aplicación de diferentes técnicas de agrupamiento como K-means, DBSCAN y el clúster jerárquico de Ward, fue posible identificar estructuras y patrones consistentes de compra que revelan fortalezas en la región latinoamericana y apoyan el camino hacia la toma de decisiones estratégicas dentro de los resellers tecnológicos. Por medio de este estudio fue posible encontrar varios hallazgos importantes que son necesarios mencionar. El principal hallazgo afirma que, tras su evaluación, estas técnicas de agrupamiento brindan segmentos diferentes, pero con total validez según el enfoque investigativo, el proceso debe estar regido por métricas de evaluación orientadas a garantizar la mayor cohesión y separación entre los grupos. En línea con la posición teórica Xu & Wunsch (2005) sostienen que la evaluación comparativa entre métodos es indispensable para evitar decisiones no eficientes sobre el número de los grupos, soporte conceptual que se verá desarrollado de forma gradual a lo largo del proceso investigativo. Finalmente, a través de la evaluación de índices de validación, como Silhouette, Davies-Bouldin y Calinski-Harabasz, se pretende identificar con precisión el modelo más idóneo y consistente para esta investigación, garantizando resultados confiables y una representación clara del panorama empresarial en el sector tecnológico latinoamericano.Item type: Ítem , Relación entre la reputación universitaria y la empleabilidad de sus graduados, medida a través de la tasa de cotización: un análisis cuantitativo para el caso colombiano(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Bernal Suárez, Angye LorenaLa presente investigación estudia la relación entre la reputación universitaria y la empleabilidad de los graduados, dentro de un contexto marcado por crecientes exigencias diferenciales entre universidades y pertinencia en relación con el mercado laboral. El objetivo de la investigación es evaluar la existe y la magnitud de la asociación estadística entre la reputación institucional, construida a través de un conjunto de variables institucionales objetivas. La empleabilidad de los graduados se articula por medio del proxy tasa de cotización por universidad que se encuentra en la base de datos del OLE para los años 2022 y 2023. El proyecto se desarrolla desde un enfoque cuantitativo y un diseño de corte transversal, se realizó la construcción de un Indicador de Reputación Universitaria (IRU) a través de un Análisis de Componentes Principales (PCA), a partir de información del SNIES y data abierta de Minciencias. Para la realización de este se llevó a cabo un análisis sobre 128 observaciones institucionales que fueron correspondientes a 87 universidades de Colombia con múltiples sedes y solo las que presentaban información completa y consistente respecto a las variables analizadas. Posterior, se estimó la relación entre el IRU y la empleabilidad mediante una correlación de Pearson, donde posteriormente género como resultado que existe una relación positiva, aunque débil entre la reputación universitaria e inserción laboral (r = 0,1608; p = 0,0697), dicho resultado permitió comprender que la reputación universitaria es un elemento complementario, pero no determinante en la inserción laboral de los graduados en Colombia. El estudio supone una contribución tanto metodológica como contextual al proponer un indicador de reputación universitaria alternativo y basado en variables objetivas, coherentes con la estructura del sistema de educación superior colombiano, dejando de lado inferencias causales, y ofreciendo una lectura crítica frente a la adopción única de rankings internacionales.Item type: Ítem , Modelo de clasificación para determinar la probabilidad de las pérdidas de garantías del Fondo Nacional del Ahorro S.A.(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Lara Porras, Angela María; Serrano León, KatherineEstá investigación tiene como propósito el desarrollo y la evaluación del modelo de clasificación predictiva, permitiendo anticipar la probabilidad de perdida de garantías asociadas a los créditos hipotecarios otorgados por el Fondo Nacional del Ahorro SA. (FNA), dando respuesta a la necesidad como institución de fortalecer la gestión del riesgo, derivada de los hallazgos realizados por los órganos de control relacionados con inconsistencias que se presentan en la custodia y recuperación de garantías, esto incluye tanto los títulos valores como las escrituras públicas, las cuales generan impactos financieros importantes para la entidad. Para desarrollar esté estudio se utilizó la información histórica del Fondo Nacional del Ahorro SA. (FNA) correspondiente dentro del periodo del año 2019 al año 2024, la cual fue utilizada en un proceso de preparación de datos bajo un enfoque ETL (Extract, Transform, Load), donde se incluye la depuración de registros, tratamientos de valores atípicos y fecha de desembolso. De acuerdo con el desbalance natural de la variable objetivo, se aplicaron técnicas de balanceo SMOTE, Random Under Sampling (RUS) y Class Weight. Posteriormente, se entrenaron y compararon tres modelos de clasificación: Regresión Logística, Árboles de Decisión y Random Forest. Los modelos presentaron un desempeño basado mediante métricas de precisión, recall, F1 – score y el área bajo la curva ROC (AUC-ROC). Se evidencia en los resultados que la Regresión Logística presentó el mejor equilibrio y desempeño entre la interpretabilidad y capacidad predictiva, con un alcance AUC-ROC de 0,926 y una precisión del 92,2%. Dentro de los principales hallazgos se identifica que los días de mora constituyen la variable con mayor poder predictivo sobre la pérdida de garantías, seguida por el tipo de crédito, el rango salarial y la fecha de desembolso. En conclusión, el modelo propuesto demuestra la utilidad de la analítica predictiva como una herramienta efectiva para anticipar el riesgo de pérdida de garantías y apoyar la toma de decisiones, contribuyendo al fortalecimiento de los procesos de control y a la estabilidad financiera del Fondo Nacional del Ahorro SA. (FNA). La clasificación obtenida permite orientar la toma de decisiones operativas y estrategias del Fondo Nacional del Ahorro SA. Contribuyendo a la reducción de costos, la optimización de recursos y mitigación del riesgo a la perdida de garantías.Item type: Ítem , Análisis semántico de comentarios en Facebook e identificación de clústeres electorales mediante machine learning: elecciones a la Cámara de Representantes 2022 en Nariño(Universidad de La Salle. Escuela de Negocios. Maestría en Analítica e Inteligencia de Negocios, 2025) Solarte Guerrero, Luis Eduardo; Vivas Fuentes, LeandroEn la presente investigación se analizó la incidencia de Facebook en la actualidad política del departamento de Nariño, tomando como caso de estudio las elecciones a la Cámara de Representantes de 2022, donde el objetivo central fue determinar la correlación entre las emociones y narrativas políticas expresadas en entornos digitales y los patrones de segmentación electoral territorial, Para ello, se diseñó una metodología mixta que procesó un corpus compuesto por 4.824 de comentarios publicados entre el 1 de enero y el 13 de marzo de 2022, tomando como muestra las páginas oficiales de los cinco representantes electos. El procesamiento técnico se realizó utilizando las librerías Scikit-learn y NLTK, aplicando técnicas de Machine Learning específicamente Análisis de Sentimientos (con el modelo VADER adaptado al léxico regional) y Modelado de Tópicos (LDA) en triangulación con un análisis de clústeres geográficos (mapas de calor) de los resultados oficiales de la Registraduría. Los hallazgos revelaron la existencia de cinco modelos electorales diferenciados que operan simultáneamente en la región, desafiando la homogeneidad del comportamiento político, se identificaron desde estrategias de "enclave urbano" altamente polarizadas, hasta modelos de "capilaridad rural" caracterizados por una alta neutralidad digital, así como liderazgos de "doble clúster" que articulan zonas costeras y andinas. El estudio demuestra que, si bien Facebook no funciona como un predictor lineal del voto total debido a la brecha digital estructural del departamento, sí actúa como un termómetro eficaz de los "ecosistemas emocionales", donde se puede concluir que la política en Nariño no se ha digitalizado por completo, sino que atraviesa una hibridación donde las narrativas virtuales amplifican sentimientos de nicho, mientras que la maquinaria territorial sigue determinando la extensión del voto físico.Item type: Ítem , Evaluación de la capacidad predictiva de arima/sarima y LSTM para pronosticar la demanda de los meses de septiembre, octubre y noviembre de 2024 de pólizas de automóviles en 12 departamentos de Colombia(2025) Cubillos Gil, Cristian Leandro; Gómez Escobar, Christian Camilo; Hidalgo Sanabria, Daniel Leonardo; Flores Bolaños, JaimeLa investigación tiene como objetivo general evaluar la capacidad predictiva de los modelos ARIMA/SARIMA y de las redes neuronales LSTM para pronosticar la demanda de los meses de septiembre, octubre y noviembre de 2024 de pólizas de automóviles en 12 departamentos de Colombia, utilizando registros históricos semanales de ventas de 2022-2024. Para esto se utilizó un enfoque cuantitativo como insumo para la toma de decisiones en el sector asegurador a nivel país, en donde se aplicarán técnicas estadísticas y modelos predictivos, con énfasis en regresión lineal con los modelos SARIMA – ARIMA y redes neuronales con LSTM para realizar la predicción a partir de una base de datos que contiene información detallada de más de 40.000 registros relacionados con las ventas realizadas en cada uno de los años analizados. Los resultados se estructuran en tres bloques, el primero enfocado en la caracterización de la estacionalidad y la tendencia de las ventas semanales de pólizas (2022-2024) por cada Departamento. El segundo, enfocado en la proyección de demanda semanal de los meses de septiembre, octubre y noviembre de 2024 mediante modelos ARIMA/SARIMA y LSTM ajustados con la serie histórica 2022-2024. El tercero y último, hace énfasis en el desempeño de los modelos mediante MAE, RMSE y MAPE, identificando la técnica con menor error y justificando su precisión relativa. Tras este recorrido se puede concluir que el contraste entre ARIMA, SARIMA y LSTM evidencia que los dos primeros modelos pierden capacidad 7 explicativa ante series con alta volatilidad y presencia de ceros. El proceso de selección automática de parámetros para SARIMA, a pesar de que asignó estructura individual para cada departamento, no generó predicciones confiables en 9 de estos, debido a un sobreajuste de los datos; ello derivó en errores desmesurados (MAPE > 100 %) y reveló que la supuesta periodicidad anual no se sostiene empíricamente. Aunque ARIMA redujo esas brechas— alcanzando MAPE aceptables (≈ 26-30 %) en Cundinamarca y Valle—siguió registrando desempeños pobres (MAPE > 70 %) en casi la mitad de los departamentos, confirmando que los choques no lineales y los cambios de régimen diluyen su ventaja. Las redes LSTM, en cambio, aprovecharon su arquitectura de memoria para capturar dependencias de largo plazo y relaciones no lineales. Obtuvieron los mayores coeficientes de determinación en Atlántico (R² ≈ 50,6 %), Valle y Cundinamarca, y mantuvieron errores absolutos bajos en esas jurisdicciones. Sin embargo, su rendimiento decayó en series extremadamente erráticas (Caldas, Cauca, Risaralda), lo que sugiere que la calidad de los datos y la inclusión de variables exógenas—por ejemplo, indicadores macroeconómicos o campañas comerciales—siguen siendo críticas para optimizar el aprendizaje. En síntesis, la capacidad predictiva está condicionada tanto por la técnica como por la riqueza informativa de la serie. Por tanto, se recomienda que el sector estudiado utilice las redes neuronales para realizar las predicciones y generar las estrategias a las que haya lugar para incentivar la compra del producto. La principal limitación de esta investigación es que no se tuvieron en cuenta factores externos que pueden incidir en el comportamiento de la población.Item type: Ítem , Modelo de predicción de ventas del (2022-2023) para la empresa metal acero El Trébol(2025) Hernández Guacaneme, Angie Karina; Tocanchon Maldonado, Angie Tatiana; García Rodríguez, Harold Andrés; Tirado Cifuentes, Cristian CamiloPor lo tanto, el propósito principal de la implementación de este estudio de investigación es el desarrollo de un modelo analítico de técnicas de machine learning y pronóstico de ventas con el fin de mejorar el proceso de toma de decisiones de Metal Acero El Trébol. Cabe mencionar que el presente estudio emplea sofisticadas herramientas de inteligencia empresarial que incluyen la recopilación e integración de datos históricos y su análisis para identificar patrones, tendencias y determinantes contextuales de la variable de destino, las ventas. Por lo tanto, la metodología incluye la recopilación y transformación de datos de Sales and Demand de la misma organización, seguida de la implementación de modelos de regresión lineal, ARIMA, random forest y redes neuronales. Luego, se evalúa cada modelo con respecto a la capacidad predictiva o prescriptiva y la precisión al calcular las métricas mencionadas anteriormente, como MAE, MSE, RMSE y MAPE. LSTM se identificó como el modelo más preciso debido al MAPE más bajo de aproximadamente 8.43%, lo que implica la mayor precisión del modelo en términos de predicción de la demanda. Por lo tanto, estos hallazgos demuestran que el modelo facilita la toma de decisiones ya que la organización puede reducir los costos y maximizar la eficiencia. Además, Metal Acero El Trébol también se beneficia ya que puede recibir recomendaciones estratégicas para aumentar la eficiencia. En general, este estudio ilustra que la inteligencia empresarial y el aprendizaje automático han sido factores críticos para la transformación digital y la competitividad en la fabricación.Item type: Ítem , Formulación de una estrategia de segmentación del portafolio de productos de exportación para una empresa productora de flores mediante análisis descriptivo y técnicas de clusterización durante el año 2023(2025) Medellin Cuellar, Juan Camilo; Quintero González, Luis Fernando; Vivas Fuentes, LeandroLa industria floricultora colombiana ha consolidado su posición como uno de los sectores agroexportadores más dinámicos del país, representando una fuente clave de divisas, empleo rural y posicionamiento internacional. No obstante, a pesar de su crecimiento sostenido, persisten desigualdades en el rendimiento económico entre los diferentes productos exportados (Rosas, Gerberas entre otros), lo que evidencia la necesidad de comprender con mayor profundidad los factores que determinan la rentabilidad en este sector. Esta investigación tiene como objetivo identificar las características latentes del portafolio de productos de exportación de una empresa floricultora colombiana durante el año 2023, a partir del análisis de datos económicos y logísticos asociados al beneficio económico por producto. La base de datos analizada contiene 85.270 registros y 27 variables, recopilados a partir de registros operativos internos, plataformas comerciales, bases aduaneras y sistemas logísticos, lo que permitió una visión integral del comportamiento exportador hacia supermercados en Estados Unidos. Para el análisis se emplearon herramientas de analítica como el Análisis de Componentes Principales (PCA) y técnicas de clusterización no supervisada (K-Means), lo que permitió segmentar el portafolio exportador en grupos homogéneos y estratégicamente diferenciados. Se realizó un proceso de validación mediante el criterio del codo (elbow method), determinando que catorce clústeres representaban una solución coherente y útil para la interpretación estratégica de los datos. Los resultados evidencian patrones subyacentes de rentabilidad que no son visibles a través de análisis convencionales, y proporcionan insumos clave para la optimización de procesos productivos, decisiones comerciales y estrategias de mercado. En el PCA se identificaron dimensiones relevantes: el componente principal 10 agrupa variables relacionadas con costos operativos como Cost Quote, Handling y % Price vs Cost, mientras que los componentes PC11 y PC18 reflejan aspectos asociados al manejo físico de materiales, como W Packaging, Hard Good y Transfer. El uso combinado de técnicas de reducción de dimensionalidad y segmentación permite identificar patrones relevantes dentro de grandes volúmenes de datos operativos. La aplicación de K-Means sobre los componentes seleccionados revelan comportamientos diferenciados entre los clústeres, los cuales pueden ser aprovechados para orientar decisiones operativas y comerciales con un enfoque más preciso y rentable.
