pandasのDataframeのデータから、ユニークなデータが何個あるか数えたい。
以下の例だと、一人の患者に関して複数の画像の訓練データがあり、全体のデータ列数で、画像の数をカウントできるが、何人の患者のデータなのか、直接は確認できない。

この例だと、patient_idが10006が4つの画像を持っていることがわかる。それでは、何個のpatient_idがDataframeに存在しているか、調べるためには、以下のようにする。
import pandas as pd
dirPos = r"D:/kaggle_dataset_small/"
train = pd.read_csv(dirPos + 'rsna-breast-cancer-detection/train.csv')
train.patient_id.nunique()