--- title: "統計データ解析I" subtitle: "第9講 練習問題" date: "`r Sys.time()`" format: html: toc: true html-math-method: katex self-contained: true grid: margin-width: 350px execute: echo: true warning: false reference-location: margin citation-location: margin tbl-cap-location: margin fig-cap-location: margin editor: visual editor_options: chunk_output_type: console --- ## 準備 以下で利用する共通パッケージを読み込む. ```{r} library(conflicted) # 関数名の衝突を警告 conflicts_prefer( # 優先的に使う関数を指定 dplyr::filter(), dplyr::select(), dplyr::lag(), ) library(tidyverse) #' 日本語を用いるので macOS ではフォントの設定を行う if(Sys.info()["sysname"] == "Darwin") { # macOS か調べて日本語フォントを指定 theme_update(text = element_text(family = "HiraginoSans-W4")) update_geom_defaults("text", list(family = theme_get()$text$family)) update_geom_defaults("label", list(family = theme_get()$text$family))} ``` ## 平均・分散・標準偏差の計算 ### 問題 東京の気候データ (`tokyo_weather.csv`) の中の - 気温 (`temp`) , - 日射量 (`solar`) , - 風速 (`wind`) の項目について以下の問に答えよ. - 全てのデータを用いて各項目の平均・分散・標準偏差を求めよ.(データ数365) - 毎月5日のデータのみを用いて各項目の平均・分散・標準偏差を求めよ.(データ数12) - 5の付く日(各月の5,15,25)のデータを用いて各項目の平均・分散・標準偏差を求めよ.(データ数36) - ランダムに選んだ36日分のデータで各項目の平均・分散・標準偏差を求めたとき,推定量のばらつきを確認せよ. ::: callout-note データの読み込みは以下のようにすればよい. ```{r} #| eval: false tw_data <- read.csv("data/tokyo_weather.csv") # 読み込み方の例 ``` ::: ## 歪度と超過尖度の計算 ### 問題 東京の気候データ (`tokyo_weather.csv`) の中の - 気温 (`temp`) , - 日射量 (`solar`) , - 風速 (`wind`) の項目について以下の問に答えよ. - 全てのデータを用いて各項目の歪度と超過尖度を求めよ.(データ数365) - 5のつく日のデータのみを用いて各項目の歪度と超過尖度を求めよ.(データ数36) - それぞれの値から正規分布から逸脱していると思われる項目はいずれか考察せよ. - 各データのヒストグラムを描き,データから計算される平均と分散を持つ正規分布と比較せよ. ## 共分散と相関の計算 ### 問題 東京の気候データ (`tokyo_weather.csv`) の中の - 気温 (`temp`) - 降水量 (`rain`) - 日射量 (`solar`) - 風速 (`wind`) - 気圧 (`press`) - 湿度 (`humid`) の項目(いずれも数値データ)について以下の問に答えよ. - それぞれの項目間の共分散,および相関を求めよ. - 相関の高い項目の組(絶対値が大きい),および相関の低い項目の組(0に近い)を求めよ. - その項目同士の散布図を描け. ## 分位点と最頻値の計算 ### 問題 東京の気候データ (`tokyo_weather.csv`) の中の - 気温 (`temp`; 数値データ) - 最多風向 (`wdir`; ラベルデータ) を用いて 以下の問に答えよ. - 全てのデータを用いて気温の四分位点を求めよ.(データ数365) - 5の付く日(各月の5,15,25)の気温の四分位点を求めよ.(データ数36) - ランダムに選んだ36日分のデータで気温の四分位点がどのくらいばらつくか確認せよ. - 風向の最頻値を求めよ.