#author("2018-05-31T17:41:47+09:00","default:takataka","takataka")

*基礎セミナー 2018年度 ex08 [#e237d833]

#contents




**回帰分析の初歩 [#r9fabbda]

気温 &mathjax{x}; [度] とアイスの売れた数 &mathjax{y}; [個] のような2つの量の間の関係を表す式を求めて分析する,&color(blue){''回帰分析''}; と呼ばれる手法の初歩を体験してみよう.

***データの入手,散布図の描画,並べ替え [#b9fc89ac]

+ 成績データの分析をしたスプレッドシート「ex07-T180XYZほげほげお」に新しいデータをインポートしよう.このスプレッドシートを開いた状態で,「ファイル」 > 「インポート」する.成績データと同じ場所にある
 line-mac.csv および line-win.csv
のいずれかをインポートしよう.その際,「新しいシートを挿入する」にして,開いているスプレッドシートに追加すること.ウィンドウ下部を見れば2つのタブがあり,それらをクリックすることで成績データのシートと今追加したばかりのデータのシートを切り替えることができる.
+ x と y の値の散布図を描こう
+ 値の変化をわかりやすくするため,x の列を基準にしてデータを並べ替えてみよう.
++ 列Aをクリック → 列BをShift押しながらクリックして範囲指定
++ メニューの「データ」を選ぶと,
 列Aを基準に...
といった選択肢が表示されるので,x の値に小さいものが上にくるようになるものを選んでみよう.
+ このデータも先の成績データも,(x, y) や (数学, 物理, 情報) のように数値が組になっており,1行がひとかたまりの値を表すので,どれか1列だけ並べ替えたりするとデータが壊れてしまいますね.

***適当に直線をあてはめてみる [#i08193d7]

散布図と並べ替えたデータを眺めると,このデータには,x が大きくなると y が小さくなる関係があり,ばらつきはあるものの,x と y の関係を直線の式(&mathjax{y = ax + b}; という形)で表せそうである.というわけで,次のことをやってみよう.

+ セル E1, F1 に a, b と書き,それぞれの下のセル E2,F2 に適当な実数値を入れる
+ セル C1 に a*x+b と書き,C2以下のセルが「そのセルと同じ行の x の列の値にE2の値を掛けて F2 の値を足したもの」になるように式を書く.
-- C2 に式を書いたあと,その下のセルに同じ式を書くのをサボろうとドラッグすると,うまくいかないことがわかるだろう.その原因は,C2 に書いた式をドラッグして C3 にコピーすると,ソフトが気をきかせて式中の E2, F2 を勝手に E3, F3 にしてくれちゃうせいである.
-- そのような動作をさせないためには,C2 の式の中の E2 の箇所を「E$2」と,2の前に「$」をつけた形にしておいてやればよい(Fの方も一緒).
-- 上記の $ 記号の意味については,「絶対参照」と「相対参照」をキーワードに調べてみたらよい.この例では,Eの方にも $ をつけて「$E$2」としてもよい.
+ 散布図の設定を変更して,A列の値に対するC列の値も表示させよう.
+ a, b の値を変えると,C列の値は自動的に計算し直される.いろいろ変えて,y 列の値になるべく近い値が作れるようにしよう.
+ &color(white,blue){check}; ''Step6'' ここまでできたら takataka に知らせてください.

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS