データ分析 2023年度 レポート課題

大事な事柄

データ

ひとによって対象とすべきデータが異なります.

データ1 「年齢階級別給与額」

政府統計の総合窓口(e-Stat) https://www.e-stat.go.jp/ から「賃金構造基本統計調査」という統計調査のデータを入手し,年齢と給与額の関係を回帰分析で調べよう.

■ データ入手法

  1. 「賃金構造基本統計調査」へ https://www.e-stat.go.jp/stat-search/files?page=1&toukei=00450091&tstat=000001011429
  2. 「■令和4年賃金構造基本統計調査」の中の「一般労働者」の中の「産業大分類」をクリック
  3. 「表番号1」の「EXCEL閲覧用」をクリックして Excel ファイル (1-1-1)aa1n11.xlsx を入手.入手したファイルを Excel で開く必要はない
  4. この課題のスプレッドシートへインポート.Excel ファイル中のすべてのシートがインポートされるが,使うのは「産業計」シートのみなので,それ以外は削除してもよい

■ データの扱い方

■ 注意

データ2 「極域の海氷域面積の変化」

気象庁のサイト https://www.jma.go.jp/jma/index.html から1979年から2022年までの極域の海氷域面積のデータを入手して回帰分析しよう

■ データ入手法

  1. 「海氷域面積の長期変化傾向(全球)」へ https://www.data.jma.go.jp/gmd/kaiyou/shindan/a_1/series_global/series_global.html
  2. そのページのグラフの下の「グラフのデータ(単位:万平方キロメートル) からファイルを入手
    • 入手可能なデータの拡張子が .csv ではなく .txt となっています.ダウンロードする際は,CSV のときと同様に,ブラウザで右クリックして「リンク先を別名で保存」等しましょう
  3. データをこの課題のスプレッドシートへインポート.入手したファイルの拡張子は .txt ですが,ファイルの中身は CSV の形式で書かれているので, いつもと同じ様にインポートできます

■ データの扱い方

「年」を説明変数,「北極域年最小値」 (単位はデータのリンク先のところに記されています)を被説明変数としましょう.

余談: \( 0 = ax+b \) を解くと,北極域の海氷域面積の最小値が 0 になってしまう(完全に海氷が消滅する)年の推定値が出せますね.

データ3 「立ち幅跳び vs 50m走」

2023年度「データ分析」のサイト https://www-tlab.math.ryukoku.ac.jp/wiki/?Data/2023 から体力測定のデータを入手して回帰分析しよう

■ データ入手法

以下のリンク先の CSV ファイルを入手してこの課題のスプレッドシートへインポートしましょう

https://www-tlab.math.ryukoku.ac.jp/~takataka/course/Data/physical.csv

■ データの扱い方

課題A

レポート課題A データを入手して回帰分析しよう

上記の要件を満たしている限りは,グラフを見やすくする工夫をいろいろしてくれて構いません.

課題B

レポート課題B 分析した内容をレポートにまとめよう

内容に関する注意

次のような内容を含めること.ex12練習X2 も参考になるかもしれません.

「レポート」ですので,考察としては,データと分析結果から科学的・論理的に導かれることだけを書きましょう.感想や憶測を書くのはやめましょう.

書き方に関する注意

おまけ

おまけ05 自分で見つけたデータを回帰分析してみよう


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS