Title
Assessment of Conventional and Machine Learning Methods for Completing Precipitation Series
Titulo
Avaliação de métodos convencionais e de aprendizagem de máquina para completar séries de precipitação
Resumen
En este trabajo se discuten los resultados obtenidos tras evaluar ocho métodos basados en el aprendizaje de máquina, y tres métodos correspondientes a los que históricamente se han empleado para completar datos faltantes en series de tiempo. Los datos utilizados para los análisis corresponden a totales mensuales de precipitación, recolectados por el Instituto de Hidrología, Meteorología y Estudios Ambientales de Colombia (Ideam) en cuatro estaciones meteorológicas localizadas en la cuenca del río Baché, en el municipio de Palermo (Huila, Colombia). Para llevar a cabo la evaluación de los métodos, se reprodujeron los datos existentes, a manera de faltantes, y sobre la diferencia de estos se calcularon tres métricas distintas de error: raíz de error medio cuadrático (REMC), eficiencia de Nash-Sutcliffe (NSE) y sesgo. Los resultados muestran que los métodos de aprendizaje de máquina para completar series de tiempo son fiables, ya que resultados similares, y en algunos casos mejores, pueden ser alcanzados sin una precisa implementación, y, consecuentemente, una mayor atención a estos puede llevar a resultados menos inciertos
Palabras clave
aprendizaje de máquina, datos faltantes, interpolación, precipitación mensual, regresión
Abstract
This paper discusses the results of an assessment of eight machine learning-based methods and three methods that have historically been used to complete missing data in time series. Data used for the analysis correspond to monthly precipitation totals collected by the Colombian Institute of Hydrology, Meteorology and Environmental Studies (Ideam) at four weather stations in the Baché river basin (Palermo municipality, Huila, Colombia). In order to evaluate the methods, the existing data was reproduced as missing data, and three different error metrics were calculated based on the difference between them: Root Mean Square Error (RMSE), Nash-Sutcliffe Efficiency (NSE) and bias. Results show that machine learning methods for completing time series are reliable, seeing as similar (and in some cases, better) results can be achieved without an accurate implementation and, consequently, a greater attention to them can lead to less uncertain results
Keywords
machine learning, missing data, interpolation, monthly precipitation, regression
Resumo
Neste trabalho se discutem os resultados obtidos após a avaliação de oito métodos baseados na aprendizagem de máquina, e três métodos correspondentes aos que historicamente têm sido empregados para completar dados faltantes em séries de tempo. Os dados utilizados para as análises correspondem a totais mensais de precipitação, coletados pelo Instituto de Hidrologia, Meteorologia e Estudos Ambientais da Colômbia (Ideam) em quatro estações meteorológicas localizadas na bacia do rio Baché, no município de Palermo, Huila, Colômbia. Para levar a cabo a avaliação dos métodos, se reproduziram os dados existentes, a maneira de faltantes, e em base a diferença destes se calcularam três métricas diferentes de erro: raiz de erro médio quadrático (REMC), eficiência de Nash-Sutcliffe (NSE) e sesgo. Os resultados mostram que os métodos de aprendizagem de máquina para completar séries de tempo são confiáveis, já que resultados similares, e em alguns casos melhores, podem ser alcançados sem uma precisa implementação, e, consequentemente, uma maior atenção a estes pode levar a resultados menos incertos
Palavras clave
aprendizagem de máquina, dados faltantes, interpolação, precipitação mensal, regressão
Fecha de recepción
8 de noviembre de 2014
Fecha de aceptación
14 de marzo de 2015
Fecha de publicación
2015-12-01
Licencia Creative Commons
This work is licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 4.0 License.
Tipo de documento
Artículos de investigación
Editorial
Universidad de La Salle. Ediciones Unisalle
Citación recomendada
Caicedo Londoño, María Alejandra and Chacón Hurtado, Juan Carlos
(2015)
"Evaluación de métodos convencionales y de aprendizaje de máquina para completar series de precipitación,"
Épsilon:
No.
25
, Article 2.
Disponible en: