最近になって久しぶりにKaggleのコンペをやっています
現在M5 Forecasting - Accuracy に挑戦中なのですが、時系列分析の機械学習的なアプローチについて調べてみると面白い話題がありました
データサイエンス学習者御用達のTJOさんのブログです
様々なパターンの識別や回帰による数値予測など目的を広く持っても、機械学習系が注目される中、強い自己相関があるような「一般的な」時系列データの分析においては、機械学習はそこまで良いパフォーマンスを上げられないというもの
TJOさんも言及はしていますが、自然言語処理等で良く使われるRNNの可能性については気になるところですが、なるほど脳死で「XGBoost回したろ」は良くなくて、やはりデータの性質を見て適切にモデルを選ぶ必要がありそうです
同じ期間内での予測等になればXGBoostなど、トレンドを加味して今後の予測をしたい場合は計量時系列分析などなど
ちなみにKaggleのNotebooksで一番のVoteを取っている人のアプローチは、LightGBM...
がっつり決定木系やないかい!
とはいっても、LightGBMをマスターしてもいませんし、この人の取った方法をしっかり理解していこうと思います
特に気になるのは予測のアプローチについて...
日々、試行錯誤です