#author("2021-10-06T21:02:46+09:00","default:takataka","takataka")
[[Data/2021/ex05]]
#author("2021-10-06T21:14:02+09:00","default:takataka","takataka")
* データ分析 2021年度 ex06 [#xa9b83a6]

* データ分析 2021年度 ex05 [#xa9b83a6]

&color(red){''工事中''};

#contentsx



** 課題A [#kadaiA]

この課題については,Classroom 等で提出するものはありません.
ただし,このあとの Quiz で関連の問題を出します.

[[ex05>../#ex05]] の以下の Notebook を閲覧実行するとともに動画を視聴しましょう
''この課題そのものには点数は付きません.しかし,あとでこの内容に関する小テストを行います.そのできや点数には影響しますので,必ず取り組んでください.質問は Teams 上でどうぞ.''

この課題についての解説動画: [[Data2021-06-movie3>https://web.microsoftstream.com/video/a4533a9a-0dbb-423a-978a-4dcfcd3fbd98]] (13m)

*** スプレッドシートとデータの準備 [#wda679df]

+ [[ex06mpi.csv>Data:ex06mpi.csv]] を自分の PC にダウンロードしてください
+ [[Google Classroom>https://classroom.google.com/c/Mzg5MzI5MjQyOTkw]] 上のこの課題ののスプレッドシートにこの授業で説明した手順でインポートしてください.
>
''散布図と相関(2)'' 疑似相関,相関関係があるからといって因果関係もあるとは限らない,代表値の落とし穴
>>
[[ex05notebookB.ipynb>https://github.com/takatakamanbou/Data/blob/main/ex05notebookB.ipynb]] | [[Data2021-05-movie2>https://web.microsoftstream.com/video/cf588319-8d46-47cc-a500-e826dac2471e]] (13m)
<<
「ファイル」>「インポート」>「アップロード」>(CSVファイルをアップロード)>「新しいシートを挿入する」
<
-- インポートの仕方は,[[ex02課題A>../ex02#kadaiA]] で説明している通りです.Excel で開くのではありません.
*** 元データの解釈 [#t6e0b4f5]

Colab notebook の扱い方がわからないひとは, [[第2回の課題B>../ex02#colab]] へ.
+ 「数学」,「物理」,「情報」の平均,標準偏差を計算しましょう
>
&color(blue){''注意'': 平均と標準偏差を求める関数については,[[ex03課題A>../ex03#kadaiA]] 参照};
<
+ それぞれのヒストグラムを描きましょう
+ 学籍番号「う06」のひとは,3科目とも80点ですが,どの科目の成績が「良い」と言えるか,平均,標準偏差,ヒストグラムから考えましょう

*** データの正規化 [#s19b146a]

+ CSVファイルをインポートしたシートに,「数学(正規化)」,「物理(正規化)」,「情報(正規化)」という3つの列を作り,それぞれの生徒の「数学」,「物理」,「情報」の点数を正規化した値を求める計算式を入れましょう.
>
データ &mathjax{x_1, x_2, \dots , x_N}; の平均値が &mathjax{\bar{x}};  で,標準偏差が &mathjax{s};  だったとすると,
#mathjax{{
z_n = \frac{(x_n - \bar{x})}{s}\qquad (n = 1, 2, \dots , N)
}}
として得られるデータ &mathjax{z_1, z_2, \dots , z_N}; の平均は &mathjax{0};,標準偏差は &mathjax{1}; になるのでした.
<
&color(blue){''注意'': スプレッドシートで上記の式を計算する場合,平均や標準偏差の値を毎回計算式で計算するのは無駄ですね.「シート1」にすでに算出した値がありますから,そのセルの値を利用しましょう('$'を付けて絶対参照にする).};
+ 正規化した値は,小数点以下の表示桁数が3になるように設定しよう

*** 正規化したデータの解釈 [#f2254ba0]

+ 「数学(正規化)」,「物理(正規化)」,「情報(正規化)」それぞれのヒストグラムを描きましょう
-- 横軸の範囲は -4 から 4 までにそろえておくとよいでしょう
-- パケットサイズ等はヒストグラムを解釈しやすいように修正しましょう
+ 次のものをノート等にメモしておきましょう
-- 学籍番号「う06」のひとの「数学(正規化)」,「物理(正規化)」,「情報(正規化)」の値
-- それらの値から,この生徒の「数学」「物理」「情報」の点数はどの科目が「良い」と言えそうか

** Moodle で Quiz を受験 [#y9508b90]

[[この科目のMoodleコース>https://www-tlab.math.ryukoku.ac.jp/moodle/course/view.php?id=6]]  へ行って Quiz を受験しましょう.
開始時刻等は授業時間中にお知らせします.


** 宿題 [#homework]


&color(red){''次のことを次回の授業までに必ずやっておいてください''};

[[ex06>../#ex06]] の以下の Notebook を閲覧実行し動画を視聴してください
>
<<
''データの正規化(標準化) (1)'' データを正規化したくなる気持ち,正規化,正規化と相関係数
>>
[[ex06notebookA.ipynb>https://github.com/takatakamanbou/Data/blob/main/ex06notebookA.ipynb]] | [[Data2021-06-movie1>https://web.microsoftstream.com/video/85c98dad-4b0f-4407-83e7-5331c1cfd3ad]] (17m)
<<
''データの正規化(標準化) (2)''  復習,偏差値,解釈に関する注意
>>
[[ex06notebookB.ipynb>https://github.com/takatakamanbou/Data/blob/main/ex06notebookB.ipynb]] | [[Data2021-06-movie2>https://web.microsoftstream.com/video/3854fda0-41b3-4f4e-ba1e-3b9ae7c1f217]] (18m)
<<
<
//(2) [[ex05 課題A>../ex05#kadaiA]] は次回の授業時間途中が期限です.
//早めに手を付けて,わからないところがあったら授業時間中に質問できるようにしといてね.
[[ex07>../#ex07]] の以下の Notebook を閲覧実行し動画を視聴してください


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS