機械学習実践

1.データの前処理

 順次処理する。
  ・説明変数の作成や削除
  ・データの正規化

ここから先、GoogleColabによるサンプル記述になります
  ログイン用のIDとPWを入手し、各ノートブックを参照

  (1)データの読み込み 前処理(1).ipynbを参照

   ライブラリーを読み込む
     pandas・・・データ解析用
     numpy・・・数値計算用
     matplotlib.pyplot・・・グラフ描画用
     seaborn・・・データ可視化用
   グラフ表示を準備する
   「Scikit-learn」より「irisデータ」を読み込む
     irisデータとは多数のアヤメ(菖蒲)画像です
   変数名を確認する
     irisデータの詳細をDESCRで確認する
     DESCRとはデータセットの説明(description)
     print文でDESCRの内容を出力する

  (2)データの確認 前処理(1).ipynbを参照

   PandasのDataFrameを利用してデータセットを作る
     リストの1個目はirisのdata
     リストの2個目はirisのfeature_names
   関数で内容を確認する
     head関数・・・先頭5行
     info関数・・・概要
     describe関数・・・要約統計量
     shape関数・・・データの形状(大きさ)
     iloc関数・・・データのスライス
     query関数・・・条件に合う行

  (3)欠損値の確認 前処理(2).ipynbを参照

   欠損値のあるデータを用意し、関数で内容を確認する
     isnull関数・・・欠損値の有無
     fillna関数・・・欠損値の補完
     dropna関数・・・欠損値のある行を削除

  (4)データ型の変換


       
       


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です