Files

Download

Download Full Text (6.8 MB)

Tutor 1

Yamile Adriana Jaime Arias

Resumen

Este documento presenta una solución a un caso teórico-práctico en la red social Twitter empleando técnicas de minería de texto y analítica de negocios en el software gratuito y de código abierto para ciencia de datos, investigación científica y comunicación técnica R. Para esto, se desarrolló un ejercicio aplicado a las empresas de Telecomunicaciones Claro, Movistar y Tigo, debido a la cantidad de datos y al dinamismo económico que estas compañías presentan actualmente en Colombia. Para llevar a cabo esta investigación se requirió realizar una revisión exhaustiva de diversas temáticas como minería de texto, análisis de sentimientos, vigilancia empresarial, analítica de negocios, visualización de datos, entre otros. Estas temáticas se desarrollaron en este caso empleando una combinación de las metodologías de análisis de datos CRISP-DM e IBM. En este proyecto se utilizaron siete fases: (1) comprensión del negocio, (2) acercamiento al proyecto de analítica, (3) análisis de requerimientos y recolección de datos (4) Comprensión de los datos, (5) Preparación de los datos, (6) Modelado y (7) Visualización. Posterior a la construcción de las bases de datos de cada una de las empresas y sus respectivos clientes, el resultado del análisis de texto aplicado a las empresas de Telecomunicaciones presentó una consistencia con su modelo de negocio, siendo palabras como ‘Caso’, ‘Saludarte’, ‘Información’, ‘DM’ con mayor recurrencia en los tweets que emiten estas compañias. Siendo Movistar y Tigo, las empresas que presentan mayor correlación en la manera que manejan su discurso en la red social Twitter. En el caso de las bases de datos de los clientes se evidencia el uso de palabras como ‘Servicio’, ‘Internet’, ‘SICsuper’, entre otras como las más frecuentes. Además, se evaluaron los indicadores de desempeño obtenidos por el algoritmo de clasificación NaÏve Bayes sobre la variable ScreenName, obteniendo una precisión del modelo de 0.877, 0.691 y 0.660 para Claro, Movistar y Tigo respectivamente. Adicionalmente, en la fase de análisis se construyeron gráficas analíticas que complementaron los resultados obtenidos. Finalmente, se plantea una etapa adicional denominada maduración con el fin de refinar los resultados obtenidos en la presente investigación; además de algunos retos, como trabajo futuro, los cuales, vale la pena profundizar, pero que están fuera del alcance de esta investigación

Programa académico

Ingeniería Industrial

Tipo de documento

Trabajo de grado - Pregrado

Licencia Creative Commons

Creative Commons Attribution-Noncommercial-No Derivative Works 4.0 License
This work is licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 4.0 License.

Fecha de elaboración

2020

Programa académico

Ingeniería Industrial

Facultad

Facultad de Ingeniería

Publisher

Universidad de La Salle. Facultad de Ingeniería. Ingeniería Industrial

Compartir

COinS