0.序論

数値データは純粋な数学的な値とは全く異なる

数学的な値には厳密な定義が有り、その値は一義的に決まる。例えば円周率πという数字は一つしかない。イデアの世界である。一方、数値データは数学的な値とは異なり厳密に求めることはできない。

  • 厳密に求めることがそもそも不可能。まず第一に測定では必ず誤差が生じる。また測定の限界がある。例えば普通の体重計で1g単位までははかれない。
  • 厳密に求めることに意味がない。体重をグラム単位で量ることに意味はない。

数値データによって何をしたいのか

標本から読み取れる性質をもとに、母集団の性質を知りたい。

  • 母集団にはばらつきが存在する。母集団の平均は?母集団内で基準を満たすものはどれくらいある?
  • 標本からは常に母集団の『平均』を取り出せる訳ではない。標本データからどう母集団の平均的な性質を推定するのか?

数値データを数学的に取り扱う

数値データにはつねに誤差、ばらつき、ノイズが入る。このような変動は偶然的な物と見なされることが多い、確率論の法則に従うとみなされる。そこで数値データに確率路的な偶然変動が含まれると見なし、数学的な取り扱いをおこなうことで観察された数値データとその背後にある『一般的な』事象へと橋渡しをする。

『統計学入門』概要

最近仕事で統計、正確には計量経済学的な分析に関わる機会が増えているのだけれども、いかんせん統計は素人同然。大村平先生の本をかなり読んでざっくりとした理解はしたつもりだけれども、それではいつまでたっても雑学レベルを抜け出せない。10数年前、学部時代に買った本を後生大事に持っていたのだけれどかなり忘れてしまっているので復習することにした。この本でカバーされる内容の概略。

  • 統計学の基礎概念
  • 記述統計学について; データの整理方法
  • 確率・確率分布の基礎
  • 母集団と標本の考え方
  • 標本分布とは
  • 推定・検定の基礎
  • 回帰分析の初歩

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)