Categories
機械学習

データの要約を見る

使用データの要約を行いたい時には、pandasのinfo()メソッドを使う。

import pandas as pd

dirPos = r"D:/kaggle_dataset_small/"
train = pd.read_csv(dirPos + 'rsna-breast-cancer-detection/train.csv')
train.info()

Dataframe内の各項目に対するデータ数、データ型が表示される。
これを見れば、データが入っていない項目を一目で確認できる。
この例だと、age、BIRADS、densityに抜けがあることがわかる。