明日から始める機械学習・データ分析シリーズ
- 【人工知能】明日から始める機械学習〜まとめ〜【Python】
- 〜座学編〜
- 【機械学習】明日から始めるデータ分析と機械学習〜座学編 Step1〜機械学習とは?【データ分析】
- 【機械学習】明日から始めるデータ分析と機械学習〜座学編 Step2〜必要なスキルと利用までの流れ【データ分析】
- Coming soon 次は機械学習の種類についてを予定
- 〜準備編〜
- 【pandas】明日から始めるデータ分析と機械学習〜準備編 Step1〜データの情報を取得する【Python】
- Coming soon 次もpandas。データの視覚化などについてを予定
- 〜実践編〜
- Coming soon
- 〜座学編〜
機械学習を勉強する為、講座を受講することにしました。
SOLEIL DATA DOJO さんの「データ分析教育講座 白・茶・黒帯編」です。
同講座は経済産業省の「第四次産業革命スキル習得講座」の認定講座に該当します。
ここでは機械学習に必要なデータ分析の前処理で使用されるPythonのライブラリ「pandas」について勉強したのでその軌跡
目次
pandasって?
Pythonでデータ解析を支援するライブラリです。様々なデータフォーマットに対応し、表示・操作を行うことができます。
Jupyter Notebookで使ってみた
Jupyter Notebookでの実行結果はこちら
pandas 関数(めっちゃ初歩)
実際に使ってみた関数の一覧です。
実行結果がどうなるかは上で記載しているJupyterNotebookの実行結果をご覧ください。
pandasのimport
import pandas as pd
CSV読み込み〜表示
df = pd.read_csv('titanic.csv', sep='\t')
#上から5行表示
df.head()
#全件表示
#df
列毎の件数、情報表示
#Cloumns毎のデータ件数
df.count()
#Cloumns毎のデータ情報(データ件数(≠空白)、NULL件数、DataType)
df.info()
ユニーク値の情報を取得
# ユニークな値の確認(Embarked→乗船地のイニシャル)
df["Embarked"].unique()
# 全列のユニークな値の数を確認
df.apply(lambda x: x.nunique())
NULL値の情報を取得
#NULLデータ確認
df.isnull().head()
#NULLデータ件数確認
df.isnull().sum()
明日から始める機械学習・データ分析シリーズ
- 【人工知能】明日から始める機械学習〜まとめ〜【Python】
- 〜座学編〜
- 【機械学習】明日から始めるデータ分析と機械学習〜座学編 Step1〜機械学習とは?【データ分析】
- 【機械学習】明日から始めるデータ分析と機械学習〜座学編 Step2〜必要なスキルと利用までの流れ【データ分析】
- Coming soon 次は機械学習の種類についてを予定
- 〜準備編〜
- 【pandas】明日から始めるデータ分析と機械学習〜準備編 Step1〜データの情報を取得する【Python】
- Coming soon 次もpandas。データの視覚化などについてを予定
- 〜実践編〜
- Coming soon
- 〜座学編〜