Las series temporales y forecasting son dos herramientas fundamentales en el análisis de datos para identificar patrones y predecir valores futuros.
Para trabajar con series temporales vamos a necesitar los paquetes de paquetes forecast, y tseries.
library(tseries)
Warning: package 'tseries' was built under R version 4.3.3
Registered S3 method overwritten by 'quantmod':
method from
as.zoo.data.frame zoo
library(forecast)
Warning: package 'forecast' was built under R version 4.3.3
Vamos a cargar datos
library(readr) datos <-read_csv("Data/train.csv")
Rows: 576 Columns: 12
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
dbl (12): profile pic, nums/length username, fullname words, nums/length ful...
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Sin embargo, como su nombre indica, las series temporales necesitan un atributo que sea el tiempo, para poder ver la evolución de la variable y así analizar posibles patrones. El problema es que nuestro dataset no tiene esos tipos de datos, por lo que puede ser difícil aplicar series temporales.
Vamos a intentar convertir alguna variable en un sustituto del tiempo para ver si podemos aplicar los conocimientos de series temporales.