#author("2023-11-27T15:39:30+09:00","default:takataka","takataka")
#author("2023-12-15T16:12:28+09:00","default:takataka","takataka")
* データ分析 2023年度 ex12 [#xa9b83a6]

&color(red){''工事中''};
//&color(red){''工事中''};

#contentsx



////////////////////////////////////////
** 練習X1 [#X1]

''誤差と有効数字についての演習+α''
''レポート作成に向けた準備 その1'' スプレッドシートで作ったグラフをドキュメントに挿入してみよう

+ [[演習問題+α>https://github.com/takatakamanbou/Data/blob/2023/ex11notebookB.md]] に書かれた問題をやりなさい
+ そこに書かれた「計算誤差の話の補足」を読んで理解しなさい
これは練習問題であり点数は付きませんが,レポート課題のための重要な準備です.必ず取り組んでください.
[[ex09練習X1>../ex09#X1]] の成果物を使います.そちらをちゃんとやってないとはこの課題はできません.また,そちらのスプレッドシートが Classroom で提出された状態だと以下のグラフの挿入がうまくいかないかもしれません.いったん提出を取り下げてから試してください.


[[こちら>https://github.com/takatakamanbou/Data/tree/2023]] からたどれる ex11notebookBanswer.md というファイルに問題の略解が書いてあります.
+ Google Classroom 上のこの課題に添付されている「ドキュメント」を開く.いつもは「スプレッドシート」ですが,今回は「ドキュメント」です.「Google スプレッドシート」は Excel などと同じ表計算ソフト,「Google ドキュメント」は Word などと同じワードプロセッサソフトです.
+ メニューの「挿入」 > 「グラフ」で「スプレッドシートから」を選択
+ [[ex09練習X1>../ex09#X1]] で作ったスプレッドシート「ex09練習X1X2」を選択.
>
&ref(https://www-tlab.math.ryukoku.ac.jp/~takataka/course/Data/ssInsertGraph01.png, nolink);
<
+ その中からドキュメントに挿入するグラフ(X1の方)を選択してインポート.↓にあるように「スプレッドシートにリンク」にチェックがついた状態にすること.
>
&ref(https://www-tlab.math.ryukoku.ac.jp/~takataka/course/Data/ssInsertGraph02.png, nolink);
<
+ 「スプレッドシートにリンク」にチェックがついた状態でグラフを挿入すると,スプレッドシートの方でグラフをいじったときに,ドキュメントの方のグラフも連動して変化します(グラフを選択して「更新する」というボタンを押す必要あり).ex09練習X1X2の方でグラフが変化するような修正を行って,ドキュメントの方のグラフも変化することを確認しましょう.
+ X2の方のグラフもインポートして,ドキュメント上で適当に並べてみましょう.グラフの大きさを変えたりもできます.
+ グラフの横軸縦軸のタイトルなどをちゃんと付けていなかった場合は付けておきましょう.


////////////////////////////////////////
** 練習X2 [#X2]

''Data2022 の成績データを回帰分析しよう''
''レポート作成に向けた準備 その2''  レポートに書くべき情報を認識しよう

これは練習問題であり点数は付きませんが,レポート課題のための重要な準備です.必ず取り組んでください.

*** Step1 散布図を描く [#xbad41b0]
レポート作成に向けた練習として,どのような事項を書くべきか認識するために,[[第9回練習X1>../ex09#X1]] で得た情報から次のようなものをメモしておこう.
次回に関連の Quiz を出題します.

+ [[Data2022-QEvsFinal.csv>Data:Data2022-QEvsFinal.csv]] をダウンロードして,Google Classroom 上のこの問題のスプレッドシートにこの授業で説明した手順でインポートしましょう
+ インポートしたデータのシートには次の列があります:
--「Quiz得点率」: Data2022 受講者の Quiz の得点率(百分率).おまけ要素があるので 100% を超えているものもある.
--「Exer得点率」: Data2022 受講者の Exer(実習課題)の得点率(同).
--「最終成績」: Data2022 受講者の最終成績.おまけ要素のために 100点を超えているものもある.
+ Data2022 では,「Quiz得点率」と「Exer得点率」は,&mathjax{155:65 = \frac{31}{44}:\frac{13}{44}}; で重みづけられていました(参考: [[Data/result/2022]]).このシートの適当な場所に「Q+E」という列をつくり,
「Quiz得点率」を &mathjax{x};,「Exer得点率」を &mathjax{y}; としたときに,「Q+E」列に &mathjax{\frac{31x+13y}{44}}; の値が入るように式を書きましょう.
+ 「Q+E」の値を横軸,「最終成績」の値を縦軸として散布図を描きましょう.
-- 横軸縦軸の範囲は [-10, 110] としましょう.
-- 軸のタイトルや図の縦横比率などを適切に設定しましょう.
:どんなデータ?| 例: 駅からの所要時間と家賃額との関係を表すデータ
:データの入手先は?| 例: 〇〇が提供している「XXの測定結果」のページ(URL)からリンクされている「ほげ(ファイル名)」というファイル
:分析の目的は?|例: 駅からの所要時間が変化すると家賃額がどのように変化するのか調べる
:どのように分析した?|例: 駅からの所要時間(単位は分)を説明変数,家賃額(単位は千円)を被説明変数として直線を当てはめる回帰分析
:結果は?|回帰直線の傾き,切片,決定係数
:結果に対する考察は?|
>
- 散布図から読み取れること
- 決定係数の値から妥当な分析と言えそうかどうか
- 回帰直線の傾き・切片の値から言えること
-- 説明変数と被説明変数との間の関係を説明する,適当な説明変数の値に対する被説明変数の予測値を算出する,etc. 例: 「駅からの所要時間が10分長くなると家賃はX円上昇する」
<

*** Step2 回帰分析する [#sb335025]

+ 「main」シートの適当な場所に,「Q+E」を説明変数,「最終成績」を被説明変数として回帰分析を行って得られる回帰係数(傾きと切片)の値を求める式を書きましょう(LINEST関数を使うこと).
+ 「main」シートの適当な場所に,これら2つの変数の間の相関係数を求める式を書きましょう.
+ 上記 1, 2 で得られた値が有効数字4桁で表示されるように設定し,それらの値をメモしておきましょう.
+ 散布図にトレンドラインとその式,決定係数の値が表示されるようにしましょう.
+ 得られた結果を考察しましょう.

*** Step3 自分の点数を使って最終成績の予測値を出してみる [#t757b7ee]

+ この授業の moodle で「評定」へアクセスすると,現時点での自分の「Quiz得点率」と「Exer得点率」を確認できます.
「main」シートの適当な場所にそれらの値を入力し,「Q+E」相当の値を計算させましょう.
+ 得られた「Q+E」と回帰係数の値を使って,自分の「最終成績」の予測値を算出しましょう.
+ 以下の注意をよく読みましょう.

*** 注意 [#d9ced240]

- moodle上で確認できる「Quiz得点率」や「Exer得点率」は,あくまで現時点での値です.Quiz も Exer も今後も出題されますので,当然変動します.また,欠席届の処理が済んでいない場合があります.疑問な点があれば takataka にお尋ねください.
- 上記で使った Q と E の比率は,Data2022 の成績評価で使用したものです.今年度は変わる可能性が高いです.
- Data2022 では,Q+E の値は,最終成績の 5 割を占めていました.残りはレポートと試験(小テスト含む)の点数から算出されました.
ちなみに,Data2022 のレポート提出者は 108 名でしたが,30名近くが0点でした(分析が間違っている,まともな文章が書かれていない,文章に剽窃があると認められた,etc.)
- 散布図を見ると低い点数の点があまりありませんが,これは,出席回数が規定に満たなかったひとを除いてあるからです.Data2022 の受講登録者は 125 名でしたが,CSV ファイルには出席回数が2/3以上あった 109 名分のみの分があります.
- 「最終成績」の半分は「Q+E」の値で決まっていますので,両者が高い相関を持つのは当然です.
- 確認用: 「Quiz得点率」50%,「Exer得点率」60%のときの最終成績予測値は &color(white){54.43}; となるでしょう(白字で書いてあるので,空白の範囲をマウスで選択すると数字が見えます).

** 宿題 [#homework]

//&color(red){''工事中''};

&color(red){''次のことを次回の授業までに必ずやっておいてください.''};

+ [[e12練習X1>#X1]]
+ [[e12練習X2>#X2]]

//&color(red){''次のことを次回の授業までに必ずやっておいてください.''};

&color(red){''次回は小テストです''};


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS