- 追加された行はこの色です。
- 削除された行はこの色です。
#author("2021-12-27T13:42:12+09:00","default:takataka","takataka")
#author("2022-01-06T08:45:05+09:00","default:takataka","takataka")
* データ分析 2021年度 レポート課題 [#n46efc31]
//&color(red){''工事中''};
#contentsx
** 大事な事柄 [#note]
- 課題はAとBの2段階に分かれており,それぞれに提出期限が設定されています
-- 課題Aの期限: 0107金 15:00
-- 課題Bの期限: 0114金 15:00
- ひとによって対象とすべきデータが異なります.以下の「データ」の項の説明を確認してください.
- 課題Aを期限までに提出しなかった場合,課題Bの提出は受け付けません
** データ [#data]
ひとによって対象とすべきデータが異なります.
自分がどのデータを使うべきかは, Classroom の課題Aの「データ割当表」というスプレッドシートで確認できます.
*** データ1 「世界の年平均気温の変化」 [#data1]
気象庁のサイト https://www.jma.go.jp/jma/index.html から1891年から2020年までの世界の年平均気温のデータを入手して回帰分析しよう
- 入手先: https://www.data.jma.go.jp/cpdinfo/temp/list/an_wld.html の「数値ファイル(CSV形式)はこちらから」のところ
- 説明変数: 「年」
- 被説明変数: 「世界全体」.この値は,「基準値」からの偏差であることに注意.「基準値」の定義は上記ページに記されています
- 注意:
-- CSV をインポートした際に,「+0.04」といった値がちゃんと数値とみなされないことがあるかもしれません(数値と解釈されてれば 「+」 ついて見えないはず).そういうときは,範囲を指定して,メニューから「表示形式」 > 「数字」 > 「数値」と選択すれば ok
-- 考察する際には,被説明変数が基準値からの偏差であることに注意しましょう(被説明変数の値が -0.5 というのは,気温 -0.5 度ではない).
-- &new{2021-12-24}; 追記: 最新の平均気温の値のところに 「*」が付いているため,上記の操作をやっても正しく数値になりません.手動で「*」を消せば ok です.この印が付いている理由は,CSVに記されている通りです.厳密な議論をする場合はこの値の扱いをちゃんと考えるべきでしょうが,このレポート課題では気にせずに他の年の値と同様に扱って構いません.
*** データ2 [#data2]
*** データ2 「極域の海氷域面積の変化」 [#data2]
気象庁のサイト https://www.jma.go.jp/jma/index.html から1979年から2020年までの極域の海氷域面積のデータを入手して回帰分析しよう
- 入手先: https://www.data.jma.go.jp/gmd/kaiyou/shindan/a_1/series_global/series_global.html のグラフの下の「グラフのデータ(単位:万平方キロメートル)のところ(これは CSV ファイルではありません,↓の注意参照)
- 説明変数: 「年」
- 被説明変数: 「北極域年平均値」 (単位はデータのリンク先のところに記されています)
- 注意:
-- 入手可能なデータの拡張子が .csv ではなく .txt となっています.ダウンロードする際は,CSV のときと同様に,ブラウザで右クリックして「リンク先を別名で保存」等しましょう
-- 拡張子は .txt ですが,ファイルの中身は CSV の形式で書かれているので, Google スプレッドシートに .csv と同様にインポートできます
*** データ3 [#data3]
*** データ3 「駅からの所要時間 vs 家賃額」[#data3]
「データ分析」のサイト https://www-tlab.math.ryukoku.ac.jp/wiki/?Data/2021 から家賃のデータを入手して回帰分析しよう
- 入手先: http://www-tlab.math.ryukoku.ac.jp/~takataka/course/Data/ex13rent.csv
- 説明変数: 「駅からの所要時間」(単位はCSVファイル中に記されています)
- 被説明変数: 「家賃」(単位はCSVファイル中に記されています)
** 課題A [#kadaiA]
''レポート課題A'' データを入手して回帰分析しよう
- この課題Aで分析した結果をもとに課題Bでレポートを仕上げてもらいます
- [[データ>#data]] の指示にしたがってデータを入手し,[[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のスプレッドシートにインポートしましょう.&color(red){''ひとによって対象とすべきデータが異なります.''};
-- インポートしたシートの名前は変えても構いません.なんのデータかわかるようなものにしましょう
- 指示された値を説明変数・被説明変数として,次のことをやりましょう
++ 回帰直線の傾きと切片を計算する(セルに正しい数式を書くこと)
++ 相関係数・決定係数を計算する(セルに正しい数式を書くこと)
++ 説明変数を横軸,被説明変数を縦軸とする散布図を描く.
++ 散布図にトレンドラインを追加する.
- ここで作成したグラフを課題Bでドキュメントに貼り付けてもらいます.
-- そのつもりで,グラフの各種設定(横軸縦軸の範囲や軸タイトル等)をきちんとしましょう.
上記の要件を満たしている限りは,グラフを見やすくする工夫をいろいろしてくれて構いません.
-- &color(red){''課題Bではここで提出したものを元にしてレポートを書くことになります.この課題の提出後の修正はできないことに注意.''};
** 課題B [#kadaiB]
''レポート課題B'' 分析した内容をレポートにまとめよう
//&color(red){''工事中''};
[[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のドキュメントに必要な情報を書き込んでレポートに仕上げましょう.
*** 内容に関する注意 [#w6952ee6]
次のような内容を含めること.[[ex13課題A>../ex13#kadaiA]] も参考になるかもしれません.
- どんなデータを対象としてどんな分析をしたのか
- 分析の結果
-- レポート課題Aで作成したグラフ(グラフをコピーするのではなく,当該グラフへのリンクとすること)
-- 分析によって得られた数値や式
- 結果の考察
「レポート」ですので,考察としては,データと分析結果から科学的・論理的に導かれることだけを書きましょう.感想や憶測を書くのはやめましょう.
***書き方に関する注意 [#wc05aed5]
- 適切なタイトルを付けること
- 氏名と学籍番号を記すこと
- 単に図や数値をならべるだけでなく,文章を使って記述すること
- このレポートは,「あなたが学んだ・調べたことを,その内容を詳しく知っている科目担当教員に伝える」ために書くものではありません.「あなたが学んだ・調べたことを,その内容を(あまり)知らないひとに向けて説明する」つもりで書いてください.
図の縦軸や横軸が何を表すかわかるようにする,数値や式がどのような意味を持つのか説明する等,必要な情報が伝わるようにしましょう.
**おまけ [#q808b2dd]
[[おまけ09 自分で見つけたデータを回帰分析してみよう>../omake#omake09]]