データ分析 2022年度 ex08†
Quiz†
授業時間中に Moodle 上でQuiz(小テスト)を行う予定です.
正確な開始時刻や実施法は授業時間中にお知らせします.
Moodle へのアクセスの仕方については,第1回のページ へ
課題A†
回帰分析の実習その3 二酸化炭素濃度の変化を調べる
気象庁のサイト https://www.jma.go.jp/jma/index.html から二酸化炭素濃度の年平均値のデータを入手して回帰分析しよう
Step1 データの準備†
- 以下の入手先から CSV ファイルをダウンロードしましょう
入手先: https://ds.data.jma.go.jp/ghg/kanshi/obs/co2_yearave.html の「数値データ」のところ
- Google Classroom 上のこの課題のスプレッドシートに上記の CSV ファイルをインポートしましょう
注意:
- CSVファイル内の注釈に記されているように,2011年の値は本当は特別扱いが必要かもしれませんが,この課題ではそのまま扱って構いません
- 同じく,2020年2021年の値は速報値なので他と同じように扱うべきではないかもしれませんが,この課題では気にせずそのまま扱って構いません
- ppm という単位の意味はこちらをどうぞ: Wikipedia https://ja.wikipedia.org/wiki/Ppm
Step2 回帰分析†
「年」を説明変数,「二酸化炭素濃度の年平均値(綾里)[ppm]」を被説明変数として回帰分析しよう
- 「main」の適当な場所に,次のものを求める数式を書こう.数式だけではどれが何の数値かわからないので,表の形にして適当な項目名を入れよう
- LINEST関数で求めた回帰直線の傾きと切片
- 相関係数とその2乗の値
- 求めた値を使って,「説明変数の値」に対する被説明変数の「予測値」を求める数式を書こう
- 「main」に散布図とトレンドラインを描き,決定係数を表示させましょう
- 横軸の範囲は「年」の範囲に合わせ,縦軸の範囲は [0, 500] としましょう
- 横軸縦軸に適切なタイトルを付けましょう
- トレンドラインや決定係数表示の設定は, 「グラフエディタ」 > 「カスタマイズ」 > 「系列」 から
注意: この課題では,表示される値の有効数字は気にしなくても構いませんが,ちゃんと考えて表示桁数を調節したいひとは,次のようにするとよいでしょう
- Google Sheets 上部の「.0」とか「.00」のボタンを押して,桁数を調節する
- 「表示形式」 > 「数字」 > 「指数」 とすると指数表記もできます.上記のボタンで桁数も調節可能
Step3 考察†
- 分析結果から,二酸化炭素濃度がどのような傾向にあるか, etc. を考えよう
- 求めた数値をメモしておこう
おまけ課題†
次のことを次回の授業までに必ずやっておいてください.
- ex08課題A
- ex09 の ★宿題★