読書メモ ・「データマイニング事例集」 ・出荷検査以降の単位規模当たりのバグ数の予測。回帰分析 ・売上予測、価格予測 ・統計手法で分析。統計解析 ・相関:線形な関係度(関連度)を表す。相関係数が±1に近いとき強い相関がある。0に近いとき相関がない。 (⇒乱数関数出力の乱雑度判定に使える★。横軸・試行回数(時間)、縦軸・乱数出力。または、散布図なら横軸・一つ前の値、縦軸・今の値)) ・Excelを用いれば、簡単に相関係数を求められる。相関係数だけから安易に相関の有無を判定すると判断を誤ることがある ・外れ値:測定ミスや入力ミスで生じる ・単回帰式:変数xが1個のみ。回帰直線。 ・回帰分析は有用かつ重要な手法。最適なモデル式(回帰式)を求めることが重要。Excelにはモデル式を自動的に求める機能がない ・重回帰分析:変数が複数ある回帰式 ・S-PLUS:探索的データ解析ソフト。S言語 ・最小自乗法:誤差の自乗和を最小にするように、未知係数を求める。y=a+bx+誤差 -目次- 基礎編(基本統計 相関と回帰 重回帰分析 数量化理論1類 判別分析と数量化理論2類 ほか) 事例編(消費者が買ってもよいと思う値段はどのようにして決まるか 缶コーヒーの人気評価データをマイニングする 予測にチャレンジする パチンコ店数は増加傾向にあるか スーパーと小売店で価格の違いがあるか ほか) |