Python: Pandas のデータフレームから特定の行・列を抽出する
UB3/informatics/python/pd_df_extract
このページの最終更新日: 2024/09/30広告
行列の番号、名前で抽出する
sklearn の Breast Cancer データセットを使用。
bc は Bunch object of sklearn.utils module というデータになり、pd.DataFrame を使わないと DataFrame にならない。
df はこのようなデータフレームになる。通し番号の Index と、mean radius, mean texture... などのデータが含まれている。
列名での抽出は、[ ] と ' ' を 使用。. でも大丈夫だが、列名にスペースがあるときにどうすればいいかわからない。
転んで数字を繋げると、行での抽出になる。最初の行は 1 ではなく 0 なので注意。たとえば 5 行目のみを取り出したい場合は、df[5] も df[5:5] もダメ。iloc を使わなければいけないのか?
loc アトリビュートで抽出する
loc アトリビュートでは、ラベルに基づいた抽出ができる。更新予定。
iloc アトリビュートで抽出する
iloc アトリビュートでは、行番号および列番号に基づいた抽出ができる。基本は「行 + カンマ + 列」であり、: で全ての行および全ての列が指定できる。
広告
References
- Pandas でデータフレームから特定の行・列を取得する. Link: Last access 2022/12/06.
コメント欄
サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。