データ分析 2021年度 ex10†
工事中
課題A†
復習 - データの代表値,ヒストグラム,散布図と相関
Step1 データの準備†
- Google Classroom 上のこの課題のスプレッドシートに以下の CSV ファイルをインポートしましょう: ex10score.csv
- この授業の moodle コースへ行き,次のようにして,Quiz(Moodleで実施している小テスト)と Exer(実習課題)の自分の得点率を確認しましょう:
- メニューから「評定」を選択すると,「ユーザレポート」というものが表示されるはず
- 「Quiz(ex08まで)合計」および「Exer(ex08まで) 合計」の「パーセンテージ」の値を確認
- 上記で得た値をスプレッドシートの「自分の値」のところに書き込む. 59.63% なら 59.63 と.
なお,この課題をやっている時点で moodle で確認できる値は,公欠その他もろもろの処理がまだの暫定値です.
Step2 平均,標準偏差,中央値,相関係数†
- 「Sheet1」 の表の中に,それぞれの値を計算する数式を書きましょう
- 標準偏差を求める関数は STDEV ではなく STDEVP であることに注意
- 数式を入れたセルの数値は,有効数字3桁で表示されるようにしましょう
Step3 ヒストグラムと散布図†
- 「Sheet1」に,「Quiz 得点率 [%]」と「Exer 得点率 [%]」のそれぞれのヒストグラムを描きましょう.ただし,次のようにしてください:
- 横軸の範囲は [0, 100]
- 「グラフのタイトル」をつける
- ヒストグラムは階級の幅が10ポイント(10%ぶん)となるようにする
- 「Sheet1」に,「Quiz 得点率 [%]」と「Exer 得点率 [%]」の散布図を描きましょう.ただし,次のようにしてください.
- 「Quiz 得点率 [%]」が横軸,「Exer 得点率 [%]」が縦軸になるように
- 両軸の範囲を [0, 100] に
- グラフの縦横比を適切に調節
Step4 観察†
自分の値と代表値を比較したり,グラフを観察したりして,データ全体の傾向と自分の位置を考察しましょう.
- 自分の得点率は,受講者の半数より上?下?
- (ここは課題ではありません)より詳しく見たければ,正規化した値や偏差値を求めたり,累積度数分布表を作ったりしてみるとよいでしょう
- Quiz 得点率が高いひとの Exer 得点率は高い?低い?
課題B†
復習 - 回帰分析
気象庁のサイト https://www.jma.go.jp/jma/index.html から二酸化炭素濃度の年平均値のデータを入手して回帰分析しよう
この課題そのものには点数は付きませんが,あとでこの内容に関する小テストを行います.そのできや点数には影響しますので,必ず取り組んでください.質問は Teams 上でどうぞ.
Step1 データの準備†
- 以下の入手先から CSV ファイルをダウンロードしましょう
入手先: https://ds.data.jma.go.jp/ghg/kanshi/obs/co2_yearave.html の「数値データ」のところ
- Google Classroom 上のこの課題のスプレッドシートに上記の CSV ファイルをインポートしましょう
注意:
- 注釈に記されているように,2011年の値は本当は特別扱いが必要かもしれませんが,この課題では気にせずそのまま扱って構いません
- 注釈に記されているように,2020年の値は速報値なので他と同じように扱うべきではないかもしれませんが,この課題では気にせずそのまま扱って構いません
- ppm という単位の意味はこちらをどうぞ: Wikipedia https://ja.wikipedia.org/wiki/Ppm
Step2 回帰分析†
「年」を説明変数,「二酸化炭素濃度の年平均値(綾里)[ppm]」を被説明変数として回帰分析しよう
- 「Sheet1」の適当な場所に,次のものを求める数式を書こう.数式だけではどれが何の数値かわからないので,表の形にして適当な項目名を入れよう
- LINEST関数で求めた回帰直線の傾きと切片
- 相関係数とその2乗の値
- 求めた値を使って,「説明変数の値」に対する被説明変数の「予測値」を求める数式を書こう
- 「Sheet1」に散布図とトレンドラインを描きましょう.横軸の範囲は「年」の範囲に合わせ,縦軸の範囲は [0, 500] としましょう.
グラフの他の設定は自分で決めてください.
注意: この課題では,表示される値の有効数字は気にしなくても構いませんが,ちゃんと考えて表示桁数を調節したいひとは,次のようにするとよいでしょう
- Google Sheets 上部の「.0」とか「.00」のボタンを押して,桁数を調節する
- 「表示形式」 > 「数字」 > 「指数」 とすると指数表記もできます.上記のボタンで桁数も調節可能
Step3 考察†
分析結果から,二酸化炭素濃度がどのような傾向にあるか, etc. を考えよう
Moodle で Quiz を受験†
この科目のMoodleコース へ行って Quiz を受験しましょう.
開始時刻等は授業時間中にお知らせします.
工事中
次のことを次回の授業までに必ずやっておいてください
(1) ex11 の以下の Notebook を閲覧実行し動画を視聴してください
(2) ex11課題A