#author("2021-11-15T14:25:39+09:00","default:takataka","takataka")
[[Data/2021/ex09]]
#author("2021-11-15T16:59:08+09:00","default:takataka","takataka")
* データ分析 2021年度 ex10 [#n46efc31]

* データ分析 2021年度 ex09 [#n46efc31]

&color(red){''工事中''};

#contentsx


** 課題A [#kadaiA]

''回帰分析入門(3)'' - 方法を理解したうえでもう一度表計算ソフトに頼ってやってみよう - 
''復習'' - データの代表値,ヒストグラム,散布図と相関



*** Step1 データの準備 [#nd2aaf6d]

+ [[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のスプレッドシートに以下の CSV ファイルをインポートしましょう: [[ex10score.csv>Data:ex10score.csv]]
+ この授業の moodle コースへ行き,次のようにして,Quiz(Moodleで実施している小テスト)と Exer(実習課題)の自分の得点率を確認しましょう:
++ メニューから「評定」を選択すると,「ユーザレポート」というものが表示されるはず
++ 「Quiz(ex08まで)合計」および「Exer(ex08まで) 合計」の「パーセンテージ」の値を確認
+ 上記で得た値をスプレッドシートの「自分の値」のところに書き込む. 59.63% なら 59.63 と.

なお,この課題をやっている時点で moodle で確認できる値は,公欠その他もろもろの処理がまだの暫定値です.

+[[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のスプレッドシートに以下の CSV ファイルをインポートしましょう
*** Step2 平均,標準偏差,中央値,相関係数 [#ld516cac]

+ 「Sheet1」 の表の中に,それぞれの値を計算する数式を書きましょう
-- 標準偏差を求める関数は STDEV ではなく STDEVP であることに注意
+ 数式を入れたセルの数値は,有効数字3桁で表示されるようにしましょう

*** Step3 ヒストグラムと散布図 [#ec6d4ae6]

+ 「Sheet1」に,「Quiz 得点率 [%]」と「Exer 得点率 [%]」のそれぞれのヒストグラムを描きましょう.ただし,次のようにしてください:
-- 横軸の範囲は [0, 100]
-- 「グラフのタイトル」をつける
-- ヒストグラムは階級の幅が10ポイント(10%ぶん)となるようにする
+ 「Sheet1」に,「Quiz 得点率 [%]」と「Exer 得点率 [%]」の散布図を描きましょう.ただし,次のようにしてください.
--   「Quiz 得点率 [%]」が横軸,「Exer 得点率 [%]」が縦軸になるように
--  両軸の範囲を [0, 100] に
-- グラフの縦横比を適切に調節

*** Step4 観察 [#o45b1df2]

自分の値と代表値を比較したり,グラフを観察したりして,データ全体の傾向と自分の位置を考察しましょう.
- 自分の得点率は,受講者の半数より上?下?
-- (ここは課題ではありません)より詳しく見たければ,正規化した値や偏差値を求めたり,累積度数分布表を作ったりしてみるとよいでしょう
- Quiz 得点率が高いひとの Exer 得点率は高い?低い?
 
** 課題B [#kadaiB]

''復習'' - 回帰分析

気象庁のサイト https://www.jma.go.jp/jma/index.html から二酸化炭素濃度の年平均値のデータを入手して回帰分析しよう


&size(13){この課題そのものには点数は付きませんが,あとでこの内容に関する小テストを行います.そのできや点数には影響しますので,必ず取り組んでください.質問は Teams 上でどうぞ.};

*** Step1 データの準備 [#p21f93ab]

+ 以下の入手先から CSV ファイルをダウンロードしましょう
>
''&color(#0000a0){注意: たいていの場合,ブラウザは,ファイルを自分の PC の中にある自分用の「ダウンロード」という名前のディレクトリ/フォルダにダウンロードする設定になっています.ダウンロード先のディレクトリ/フォルダにすでに同名のファイルが存在していた場合,ブラウザが気をきかせて,「hoge.csv」という名前を勝手に「hoge (1).csv」とかに変えて保存することがあります.以下の二つのファイルは,以前にもダウンロードしたことがあるはずですので,そうなるかもしれません.ですが,中身は同じデータのはずです.「hoge (1).csv」みたいな名前のまま扱うのは混乱のもとですし超かっちょ悪いです.「ダウンロード」に存在している古い方を削除してからダウンロードし直しましょう.};''
入手先: https://ds.data.jma.go.jp/ghg/kanshi/obs/co2_yearave.html の「数値データ」のところ
<
-- [[ex08gorigori.csv>Data:ex08gorigori.csv]] 
+ 「Sheet1」に,「気温」を横軸,「アイス売上数」を縦軸にとった散布図を描きましょう
-- 横軸縦軸の範囲は [[ex07課題A>../ex07#kadaiA]] と同じで
-- ''トレンドライン''も描きましょう.トレンドラインの設定時には,「ラベル」オプションのところをいじって回帰直線の式がグラフ中に表示されるようにし,さらに,「''決定係数''を表示する」にチェックを入れましょう
-- グラフに表示される &mathjax{R^2}; の値がその決定係数の値です.この値の意味は,あとの授業で解説します.値をメモしておきましょう.
+ 「気温の平均」と「売上数の平均」と書かれたセルの下のセルに,それぞれの値を求める数式を入れましょう
+ 「回帰直線の傾き」と書かれたセルの下のセルに,LINEST関数を用いた式を書いて,回帰係数(傾きと切片)の値を求めましょう.ただし,グラフと同様に,気温を説明変数,アイス売上数を被説明変数としてください.
+ 「売上数予測値 [個]」と記されたセルの右のセルに,「気温の値 [度]」から売上数の予測値を計算する式を書きましょう.
+ 気温 &mathjax{x}; の値をいろいろ変えて,売上数の予測値がどのように変化するか観察しましょう.特に,次のときの値をメモしておきましょう.
-- 気温 10, 20, 30 度のとき
-- 気温が平均値のとき(予測値はどんな値になってるだろう?)
+ ex08gorigori.csv の最初のデータは,気温が 5.56 で売上数が 8 です.この値を手動でいじって,回帰分析の結果が,データ中に存在する ''外れ値'' (他と比べて極端に大きかったり小さかったりする値)の影響をどのように受けるか調べよう.
セルの値を書き換えて,回帰式やグラフがどのように変化するか観察してください.
++ 最初のデータの売上数を 8 から 50, 100, 1000 に変えてみる
++ 売上数を 8 に戻して,気温を 30, 50 に変えてみる
++ 最後に (5.56, 8) に戻しておこう
+ [[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のスプレッドシートに上記の CSV ファイルをインポートしましょう


注意:
- 注釈に記されているように,2011年の値は本当は特別扱いが必要かもしれませんが,この課題では気にせずそのまま扱って構いません
- 注釈に記されているように,2020年の値は速報値なので他と同じように扱うべきではないかもしれませんが,この課題では気にせずそのまま扱って構いません
- ppm という単位の意味はこちらをどうぞ: Wikipedia https://ja.wikipedia.org/wiki/Ppm

***Step2 回帰分析 [#j5adaa22]

「年」を説明変数,「二酸化炭素濃度の年平均値(綾里)[ppm]」を被説明変数として回帰分析しよう

+ 「Sheet1」の表に適切な数式を入れましょう.
+ 「Sheet1」に散布図とトレンドラインを描きましょう.横軸の範囲は「年」の範囲に合わせ,縦軸の範囲は [0, 500] としましょう.
グラフの他の設定は自分で決めてください.

注意: この課題では,表示される値の有効数字は気にしなくても構いませんが,ちゃんと考えて表示桁数を調節したいひとは,次のようにするとよいでしょう
- Google Sheets 上部の「.0」とか「.00」のボタンを押して,桁数を調節する
- 「表示形式」 > 「数字」 > 「指数」 とすると指数表記もできます.上記のボタンで桁数も調節可能

***Step3 考察 [#heaea9ff]

分析結果から,二酸化炭素濃度がどのような傾向にあるか, etc. を考えよう
** Moodle で Quiz を受験 [#y9508b90]

[[この科目のMoodleコース>https://www-tlab.math.ryukoku.ac.jp/moodle/course/view.php?id=6]]  へ行って Quiz を受験しましょう.
開始時刻等は授業時間中にお知らせします.


** 宿題 [#homework]

&color(red){''工事中''};

&color(red){''次のことを次回の授業までに必ずやっておいてください''};

(1) [[ex10>../#ex10]] の以下の Notebook を閲覧実行し動画を視聴してください
(1) [[ex11>../#ex11]] の以下の Notebook を閲覧実行し動画を視聴してください
>
<

(2) [[ex10課題A>../ex10#kadaiA]]
(2) [[ex11課題A>../ex11#kadaiA]]


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS