0.序論

数値データは純粋な数学的な値とは全く異なる

数学的な値には厳密な定義が有り、その値は一義的に決まる。例えば円周率πという数字は一つしかない。イデアの世界である。一方、数値データは数学的な値とは異なり厳密に求めることはできない。

  • 厳密に求めることがそもそも不可能。まず第一に測定では必ず誤差が生じる。また測定の限界がある。例えば普通の体重計で1g単位までははかれない。
  • 厳密に求めることに意味がない。体重をグラム単位で量ることに意味はない。

数値データによって何をしたいのか

標本から読み取れる性質をもとに、母集団の性質を知りたい。

  • 母集団にはばらつきが存在する。母集団の平均は?母集団内で基準を満たすものはどれくらいある?
  • 標本からは常に母集団の『平均』を取り出せる訳ではない。標本データからどう母集団の平均的な性質を推定するのか?

数値データを数学的に取り扱う

数値データにはつねに誤差、ばらつき、ノイズが入る。このような変動は偶然的な物と見なされることが多い、確率論の法則に従うとみなされる。そこで数値データに確率路的な偶然変動が含まれると見なし、数学的な取り扱いをおこなうことで観察された数値データとその背後にある『一般的な』事象へと橋渡しをする。