試行錯誤

仕事や趣味(スマブラ)など

時系列データの予測について

最近になって久しぶりにKaggleのコンペをやっています

現在M5 Forecasting - Accuracy に挑戦中なのですが、時系列分析の機械学習的なアプローチについて調べてみると面白い話題がありました

 

www.kaggle.com

 

データサイエンス学習者御用達のTJOさんのブログです

tjo.hatenablog.com

 

様々なパターンの識別や回帰による数値予測など目的を広く持っても、機械学習系が注目される中、強い自己相関があるような「一般的な」時系列データの分析においては、機械学習はそこまで良いパフォーマンスを上げられないというもの

 

TJOさんも言及はしていますが、自然言語処理等で良く使われるRNNの可能性については気になるところですが、なるほど脳死で「XGBoost回したろ」は良くなくて、やはりデータの性質を見て適切にモデルを選ぶ必要がありそうです

同じ期間内での予測等になればXGBoostなど、トレンドを加味して今後の予測をしたい場合は計量時系列分析などなど

 

ちなみにKaggleのNotebooksで一番のVoteを取っている人のアプローチは、LightGBM...

がっつり決定木系やないかい!

www.kaggle.com

とはいっても、LightGBMをマスターしてもいませんし、この人の取った方法をしっかり理解していこうと思います

特に気になるのは予測のアプローチについて...

 

日々、試行錯誤です