データ分析 2020年度 ex02

ex02A

Google Classroom 上のこの課題. Google スプレッドシートのファイルはそこにあります. (あ),(い)が全てできたら提出してください.

(あ) 数学物理情報の度数分布表

(1) 「シート1」のA4 から C8 までに,「mpiS100」 の「数学」の点数の度数分布表があります. セル A5 から A7 までに 25, 50, 75 という整数値が格納されており,セル B5 には FREQUENCY 関数が書かれています. セルをクリックして確認しよう.

(2) FREQUENCY関数は,1つ目の引数にデータの範囲,2つ目の引数に「階級」の範囲を指定することで,この例のように条件に合うデータの個数をカウントしてその結果を返してくれます. セル B6からB8をクリックして,そこには数式は書かれてないことを確認しよう.

参考: Google スプレッドシート の FREQUENCY 関数についてのヘルプ

(3) C5からC8に説明がありますが,FREQUENCY関数は,「階級」として与えられた数を,その階級の「最大値」として扱います. 例えば,A5 が 25 で,A6 が 50 なので,B6 には 「25より大きく50以下」の点数の件数が入っています. 今扱っている数学の点数は0以上100以下の整数値なので,「26以上50以下」とも言えます.

(4) ここまでの説明をもとに,A11, B11 から下に,「数学」の度数分布表をもう一つ作ってください.ただし, 階級は,「10点未満」,「10点以上20点未満」,「20点以上30点未満」,...,「90点以上」となるようにしなければなりません(階級の指定の仕方に要注意).

(5) 次に,下に示されているヒストグラムを次のように修正しましょう.うまくできたら,度数分布と同じになるはずです.

(い) 大津市の10月1日の気温の分析

(1) Data:ex02_temp1980-2019Oct01.csv に,1980年から2019年までの大津市の気温のデータを CSV ファイルにしたものがあります. これを自分のPCにダウンロードしましょう.

(2) ダウンロードした CSV ファイルを,課題のスプレッドシートに取り込みましょう. 「ファイル」 > 「インポート」. 各列の意味は,次の通りです.

(3) E5 から G5 に,その上のセルの説明に合った値が入るように,計算式を書いてください. 例えば,「最低気温の平均」には,1980年から2019年までの最低気温の平均値が表示されるようにしてください.

(4) E11, F11 から下に,日平均気温の度数分布表を作りましょう. 階級の値は,16, 18, 20, 22, 24, 26 としてください.

ex02B

この授業の講義資料にも使っている Google Colab の notebook の扱いを理解しよう. この課題では,提出するものはありません. わからないところがあれば,Teamsの質問部屋チャネル等で質問してください.

  1. 動画を見る
  2. 上記 ex02note1.ipynb を開く(「学籍番号@mail.ryukoku.ac.jp」のGoogleアカウントで).
    • 「プレビューできません」というメッセージが出る場合は,以下のいずれかの方法で
      • ページ上部の「アプリで開く」プルダウンメニューから「Colaboratoryで開く」を選択
      • 「下記のアプリでこのアイテムを開く」のようなメッセージの下に「Colaboratory」があればそれをクリック
  3. 開いた Colab notebook に書かれた説明を読んで指示にしたがって操作する
  4. notebook 中の「ここまで来たら」に書かれたことをやってここへ戻ってくる
  5. 保存した notebook は Googleドライブの「マイドライブ」 の中の「Colab Notebooks」というフォルダ内にあるはずです. 探して,ダブルクリックして開けることを確認
  6. ファイル名が「ex02note1.ipynb のコピー」とかになってるでしょうから,「 のコピー」を取り除いておくのがよいでしょう(「の」の前の空白も削除).
  7. 上記のようにして保存した notebook は自分だけのものですから,自由にいじってください

トップ   編集 凍結解除 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-10-06 (火) 13:16:46