#author("2021-11-29T13:40:12+09:00","default:takataka","takataka")
[[Data/2021/ex10]]
#author("2021-11-29T14:11:38+09:00","default:takataka","takataka")
* データ分析 2021年度 ex11 [#n46efc31]

* データ分析 2021年度 ex10 [#n46efc31]
&color(red){''工事中''};

//&color(red){''工事中''};

#contentsx


** 課題A [#kadaiA]

''復習'' - データの代表値,ヒストグラム,散布図と相関
''表計算ソフトを用いた質的データの分析'' - ダミー変数への変換とクロス集計 -


この課題についての解説動画: [[Data2021-11-movie3]] (14m)

*** Step1 データの準備 [#nd2aaf6d]
''スプレッドシートとデータの準備''

+ [[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のスプレッドシートに以下の CSV ファイルをインポートしましょう: [[ex10score.csv>Data:ex10score.csv]]
+ この授業の moodle コースへ行き,次のようにして,Quiz(Moodleで実施している小テスト)と Exer(実習課題)の自分の得点率を確認しましょう:
++ メニューから「評定」を選択すると,「ユーザレポート」というものが表示されるはず
++ 「Quiz(ex08まで)合計」および「Exer(ex08まで) 合計」の「パーセンテージ」の値を確認
+ 上記で得た値をスプレッドシートの「自分の値」のところに書き込む. 59.63% なら 59.63 と.
+ [[ex07kinoko.csv>Data:ex07kinoko.csv]] を自分の PC にダウンロードしてください
+  [[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]]  上のこの課題のスプレッドシートにこの授業で説明した手順でインポートしてください.
+ インポートしたデータを観察しましょう.このデータは, [[今回の授業>../#ex11]] の二つ目の notebook と動画に登場しているのと同様のものです.ただし,値そのものは違います.

なお,この課題をやっている時点で moodle で確認できる値は,公欠その他もろもろの処理がまだの暫定値です.
''ダミー変数への変換''

*** Step2 平均,標準偏差,中央値,相関係数 [#ld516cac]
+ 動画の解説を参考に,インポートして作った「ex07kinoko」シートの「きのこvsたけのこ」列と「冬の味覚」列の間に,「きのこの山」と「たけのこの里」という2つの列を挿入してください
+ 挿入した列の値が次のようになるよう,数式を入力してください
-- 「きのこの山」列: 同じ行の「きのこvsたけのこ」列の値が「きのこの山」なら 1,さもなくば 0
-- 「たけのこの里」列: 同じ行の「きのこvsたけのこ」列の値が「たけのこの里」なら 1,さもなくば 0
+ 同様に,「冬の味覚」列と「こたつ」列の間に,「ブリ」,「牡蠣」,「カニ」,「みかん」という4列を挿入し,各列の値が正しい 0/1 になるように数式を入力してください

+ 「Sheet1」 の表の中に,それぞれの値を計算する数式を書きましょう
-- 標準偏差を求める関数は STDEV ではなく STDEVP であることに注意
+ 数式を入れたセルの数値は,有効数字4桁として表示されるようにしましょう
''クロス集計''

*** Step3 ヒストグラムと散布図 [#ec6d4ae6]
+ 動画の解説を参考に,「ex07kinoko」シートの「こたつ」列の右に,「きのこandブリ」,「きのこand牡蠣」,「きのこandカニ」,「きのこandみかん」列を作ってください
+ 同様に,「たけのこandY」(Yは「ブリ」,「牡蠣」,「カニ」,「みかん」)4列も作ってください
+ 作った列「XandY」の値(Xは「きのこの山」または「たけのこの里」,Yは上記と同様)が,
>
「きのこvsたけのこ」の値が X でかつ 「冬の味覚」の値が Y なら 1,さもなくば 0 
<
となるように適切な数式を入力してください

+ 「Sheet1」に,「Quiz得点率 [%]」と「Exer得点率 [%]」のそれぞれのヒストグラムを描きましょう.ただし,次のようにしてください:
-- ヒストグラムは階級の幅が5ポイント(5%ぶん)となるようにする
-- 横軸の範囲は [0, 105] (100までにすると,ヒストグラムの設定上100点満点のひとが含まれなくなってしまいます)
-- 「グラフのタイトル」をつける.2つの図のどちらがどちらかわかるように
+ 「Sheet1」に,「Quiz得点率 [%]」と「Exer得点率 [%]」の散布図を描きましょう.ただし,次のようにしてください.
--   「Quiz得点率 [%]」が横軸,「Exer得点率 [%]」が縦軸になるように
--  両軸の範囲を [0, 100] に
-- グラフの縦横比を適切に調節
''クロス集計表の完成''

*** Step4 観察 [#o45b1df2]
+ 作成した列の和を計算する数式を「Sheet1」列の適切なセルに入力し,クロス集計表を完成させてください
+ 完成したクロス集計表を眺めて,「きのこvsたけのこ」データと「冬の味覚」データの間の関係について考察しましょう

自分の値と代表値を比較したり,グラフを観察したりして,データ全体の傾向と自分の位置を考察しましょう.
- 自分の得点率は,受講者の半数より上?下?
-- (ここは課題ではありません)より詳しく見たければ,正規化した値や偏差値を求めたり,累積度数分布表を作ったりしてみるとよいでしょう
- Quiz 得点率が高いひとの Exer 得点率は高い?低い?
 
** 課題B [#kadaiB]

''レポート作成に向けた準備'' スプレッドシートで作ったグラフをドキュメントに挿入してみよう

この課題そのものには点数は付きませんが,レポート課題のための重要な準備です.必ず取り組んでください.質問は対面または Teams 上でどうぞ.

+ この課題に関連する解説動画を視聴しましょう: [[Data2021-10-movie2>https://web.microsoftstream.com/video/239d98f5-7444-4d09-9ec7-2f94fccbc04d]] (7m)
+ [[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題のドキュメントの「ここにグラフを挿入」の箇所に,[[前回の課題B>../ex09#kadaiB]] のグラフを挿入しましょう.「スプレッドシートにリンク」の方で.
+ スプレッドシートの方を適当にいじるとドキュメントに挿入したグラフも変化することを確認しましょう
+ ドキュメント中に赤字で下線付きで書かれた部分を適当に修正しましょう
+ 課題(今回の課題の方のみ)を提出しましょう

** 宿題 [#homework]

&color(red){''工事中''};

&color(red){''次のことを次回の授業までに必ずやっておいてください''};

(1) [[ex11>../#ex11]] の以下の Notebook を閲覧実行し動画を視聴してください
>
''量的データと質的データ/ダミー変数'' 
>>
[[ex11notebookA.ipynb>https://colab.research.google.com/github/takatakamanbou/Data/blob/main/ex11notebookA.ipynb]] ([[GitHub>https://github.com/takatakamanbou/Data/blob/main/ex11notebookA.ipynb]]) | [[Data2021-11-movie1>https://web.microsoftstream.com/video/9510d4b1-bc68-46eb-ae5b-333b02967fcb]] (12m)
<<
<
>
''度数分布,クロス集計表/分割表'' 
>>
[[ex11notebookB.ipynb>https://colab.research.google.com/github/takatakamanbou/Data/blob/main/ex11notebookB.ipynb]] ([[GitHub>https://github.com/takatakamanbou/Data/blob/main/ex11notebookB.ipynb]]) | [[Data2021-11-movie2>https://web.microsoftstream.com/video/bf89ac70-11ca-4412-b41e-e121ba564597]] (17m)
<<
<

(2) [[ex11課題A>../ex11#kadaiA]]


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS