【pandas】日時の間隔が空いているデータを埋める

プログラミング

This article is available in: English

 この記事は日付、時間の間隔が空いているデータに対して、データの間隔を埋める方法の備忘録です。

日時の間隔を埋めるには、pandasのasfreq関数を使います。

この記事のコードは以下のgoogle colabで試すことができます。

Google Colab

pythonコード

例として次のようなデータを扱います(以下、dfという変数にデータが格納されているとします)。

10分単位のデータですが、ところどころにデータが存在しない、時間の間隔が空いているデータとなっています。


データを埋める方針としては、

  1. 時刻のカラム(datetime)をindexに指定
  2. pandasのasfreq関数を使用
  3. indexを元に戻す

の手順を踏みます。

import pandas as pd

df_ = df.set_index('datetime')  # datetimeをindexに指定
df_ = df_.asfreq(freq='10min')
df_fill = df_.reset_index()  # indexを元に戻す
print(df_fill)

以上のように間が空いてしまった日時データを埋めることができます。

なお、asfreq関数のfreqに指定できる引数は下記の公式リファレンスに詳しく載っています。

Time series / date functionality — pandas 2.2.3 documentation
タイトルとURLをコピーしました