データ分析 2020年度 ex11†
ex11A†
復習 - データの代表値,ヒストグラム,散布図と相関
(1) 準備
Google Classroom 上のこの課題のスプレッドシートへ,以下の CSV ファイルをインポートしましょう
注意: 依然として,CSVファイルのインポートを正しくできていないひとがいます.この課題では,正しい方法でスプレッドシートにCSVファイルを取り込んでいない場合,点数が付きません.過去の課題のフィードバックコメントでもそのことを指摘しています.
- インポートの仕方がわからないひとは,第2回 「その2: CSV の話」の動画を視聴してください.
- 正しくインポートすれば,「ex11score」という名前のシートができるはずです.このシートの名前は変えてはいけません.
- シートの名前が「ex11score (1)」みたいになるひとは,ex10課題A の注意参照
ex11score.csv
(2) 自分の評点を確認しよう
注意: 自分の評点を正しく認識できていない(正しい値をシートに記入していない)場合,この課題の点数は付きません.
- この授業の moodle コースへ行き,メニューから「評定」を選択すると,「ユーザレポート」というものが表示される
- 「Quiz 合計」および「Exer 合計」の「評定」と「パーセンテージ」の値を確認.
「評定」は単純に各回の点数を合計した値,「パーセンテージ」はそれらの満点に対する割合を百分率(パーセント)で表した値
- パーセンテージの方の値を,スプレッドシートの「自分の値」のところに書き込む
(3) 平均,標準偏差,中央値,相関係数
- シート「ex11score」の 「Exer 合計」列に右隣に1列を挿入し,1行目に「Exer 得点率 [%]」と書きましょう.
- 「Exer 合計」の現時点での満点は 85 です.その得点率を百分率(パーセント)で表した値が「Exer 得点率 [%]」の列の値となるように,適切な数式を書いてください.
- 「Quiz 得点率 [%]」についても同様にしましょう.ただし,実はたまたま「Quiz 合計」の現時点の満点が 100 なので,こちらは列を作るのをさぼっても構いません(そのときは,以下の説明の列の名前を読み替えて考えてください).
- セルD8からF9に,それぞれの値を計算する数式を書きましょう
- 標準偏差を求める関数は STDEV ではなく STDEVP であることに注意
- セルC11に「Quiz 得点率 [%]」と「Exer 得点率 [%]」の相関係数を求める数式を書きましょう
- 数式を入れたセルの数値が,有効数字3桁で表示されるようにしてください
(4) ヒストグラムと散布図
- 「シート1」に,「Quiz 得点率 [%]」と「Exer 得点率 [%]」のそれぞれのヒストグラムを描きましょう.ただし,次のようにしてください:
- 横軸の範囲は [0, 100]
- 「グラフのタイトル」をつける
- ヒストグラムは10点刻みで描く(階級の幅が10点になるようにする)
- 「シート1」に,「Quiz 得点率 [%]」と「Exer 得点率 [%]」の散布図を描きましょう.ただし,次のようにしてください.
- 「Quiz 得点率 [%]」が横軸,「Exer 得点率 [%]」が縦軸になるように
- 両軸の範囲を [0, 100] に
- 縦横の目盛りの大きさが等しくなるようにグラフの縦横比を手動で調整
(5) 提出
完成したら,提出しましょう
(6) 観察
- 求めた数値をメモしておこう.
- グラフを観察してこのデータの性質を考えよう.度数が最も大きいのはどんなところだろう? 2つの得点率の一方が50%以上でもう一方が50%未満というひとはいるだろうか?
ex11B†
レポート作成の練習 - ex11Aの結果をレポートにまとめる練習
- この課題は,ex11Aを仕上げてないとできません.未完成のひとは,まずはそちらを最後までやりましょう
- ここで扱う「Google ドキュメント」は,Microsoft Word と類似の文書作成ソフトウェアです.クラウド上で文書を作成できます.
- Google Classroom 上のこの課題のドキュメントを開きましょう.
- ドキュメント中の ★(?)★ の箇所を適切な文字,数値,グラフ等に置き換えましょう.
- 「★(?)★」は削除して構いません.置き換えた文字や数値は 赤字 にしといてくれると,チェックするひとがとっても助かります.
- グラフの挿入の仕方については,こちらの動画を参考にしてください: Data2020-11-movie2 (7m)