Python: Pandas のデータフレームから特定の行・列を抽出する

UB3/informatics/python/pd_df_extract

このページの最終更新日: 2023/10/01

  1. 行列の番号、名前で抽出する
  2. loc アトリビュートで抽出する
  3. iloc アトリビュートで抽出する

広告

行列の番号、名前で抽出する

sklearn の Breast Cancer データセットを使用。

bc は Bunch object of sklearn.utils module というデータになり、pd.DataFrame を使わないと DataFrame にならない。

df はこのようなデータフレームになる。通し番号の Index と、mean radius, mean texture... などのデータが含まれている。

Sklearn breast cancer

列名での抽出は、[ ] と ' ' を 使用。. でも大丈夫だが、列名にスペースがあるときにどうすればいいかわからない。

転んで数字を繋げると、行での抽出になる。最初の行は 1 ではなく 0 なので注意。たとえば 5 行目のみを取り出したい場合は、df[5] も df[5:5] もダメ。iloc を使わなければいけないのか?

loc アトリビュートで抽出する

loc アトリビュートでは、ラベルに基づいた抽出ができる。更新予定。

iloc アトリビュートで抽出する

iloc アトリビュートでは、行番号および列番号に基づいた抽出ができる。基本は「行 + カンマ + 列」であり、: で全ての行および全ての列が指定できる。


広告

References

  1. Pandas でデータフレームから特定の行・列を取得する. Link: Last access 2022/12/06.

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。