1.データの前処理
順次処理する。
・説明変数の作成や削除
・データの正規化
ここから先、GoogleColabによるサンプル記述になります
ログイン用のIDとPWを入手し、各ノートブックを参照
(1)データの読み込み 前処理(1).ipynbを参照
ライブラリーを読み込む
pandas・・・データ解析用
numpy・・・数値計算用
matplotlib.pyplot・・・グラフ描画用
seaborn・・・データ可視化用
グラフ表示を準備する
「Scikit-learn」より「irisデータ」を読み込む
irisデータとは多数のアヤメ(菖蒲)画像です
変数名を確認する
irisデータの詳細をDESCRで確認する
DESCRとはデータセットの説明(description)
print文でDESCRの内容を出力する
(2)データの確認 前処理(1).ipynbを参照
PandasのDataFrameを利用してデータセットを作る
リストの1個目はirisのdata
リストの2個目はirisのfeature_names
関数で内容を確認する
head関数・・・先頭5行
info関数・・・概要
describe関数・・・要約統計量
shape関数・・・データの形状(大きさ)
iloc関数・・・データのスライス
query関数・・・条件に合う行
(3)欠損値の確認 前処理(2).ipynbを参照
欠損値のあるデータを用意し、関数で内容を確認する
isnull関数・・・欠損値の有無
fillna関数・・・欠損値の補完
dropna関数・・・欠損値のある行を削除
(4)データ型の変換
コメントを残す