自由度って.....φ(・ω・*)カキカキ [統計学]
昨日は標準偏差に関するまとめ その1を書いたわけですが、今日コメントをいただいておりまして、自由度についてもちょっと詳しくとのリクエストでしたので、近々書いてみようと思います(*・ω・*)b♪
コメントをいただいた方は仕事上、統計分析をされる中堅社員の方だとのことで、そんな方に真剣に読んでいただけていると思うとうれし恥ずかしで身のしまる思いです(*`σェ´*)
自由度についてはどの書籍でもHPでも説明に苦労されている感じですね(`・ω・´)ノ
苦労というか、読んでて感じるのは自由度の意味をきちんと理解している人の大半は統計学の中~上級者クラスの人で説明も専門的なものが多いので難しいですね( p′︵‵。)
と言う僕もまだまだ勉強中の身なので、とりあえず自分なりに納得はしているけど今回のコメントを受けてすこし復習してみることにしました。
前に使っていた教科書や最近の新しいHPをチェックしてなんとなく僕なりの説明の仕方がイメージできてきたので、明日には下資料の作成に掛かりたいと思います.....φ(・ω・*)カキカキ
ちなみに今の僕の理解を簡単に言うと、自由度っていうのは他のデータによって確定されないデータ数のこと。平均がなければ、平均の元になってるデータはどのデータの影響も受けず、他のデータから推定することはできません。
でも仮に10個のデータの平均を算出しておいて、その後平均値はそのまま、データを一個だけ見えないようにしたところで、これは計算すれば導き出せます。(`・ω・´)ノ
つまり、残り9個のデータと平均により確定(推定というべき?)されてしまうデータがn数のうち1つある。
だからこれは自由度として扱っちゃだめ!!ということでn-1となる。
そして、10個のデータが母集団の全てのとき、(単に母集団の特徴を知りたいとき)は未知のデータはなく、個々のデータ達からみれば「いまさら平均がわかったから何??僕らは影響されませんよ??」って話ですよね?
でも10個のデータが母集団の全てではなかったとき、(未知の母集団の性質を推定するとき)は10個の平均値と母集団全体の平均値が同じと過程すると、平均値が算出されることで確定してくるデータが必ず一個出てきます。(`・ω・´)ノ
これがさっきの10個のデータのうち一個だけ見えなくした状態!!
そして統計学の用途としては大きく二つあって、前述の「データ数が母集団すべての場合、この特徴をひとつの数字で表すと??」って場合と今書いた「このデータから母集団の特徴をひとつの数字で推測すると??」って場合後者の元データが全く同じ場合、後者はあくまで「確率的(有意水準?%の精度で)にこうなるでしょう」って言い方になるので、出てくる数字にもハバを持たせる必要がありますから、n-1という自由度が使われます。(*`σェ´*)フムフム
ここまでが、今のところの僕の自由度に対する理解ですね(`・ω・´)ノ
これであーなるほどと思った方は機会があれば、自由度で悩んでる人に同じ説明をしてあげてください。
言ってる途中で「なんかシックリこないなぁ」って思ったらそれは今の僕と同じ現象ですv(。・ω・。)ィェィ♪
僕も今改めて書いてみてシックリきてません 笑
ということで冒頭に書いたように明日からもう少し掘り下げて調べつつ、下資料の作成に掛かっていこうと思います。.....φ(・ω・*)カキカキ
要するに・・・「本件については、もっと勉強して出直して参りたいと思います。今しばらくお時間をくださいm(__)m」
じゃあ書くなよって話ですよね?(((c=(゚ロ゚;qホワチャー
でもこの内容で考え方の大筋は間違ってないと思いますので、どうしても気になる方が調べたり、解釈するための取っ掛かりにでもなれればと思いましたのでそこはご容赦ください。m(__)m
ということで長々とわかる様なわからない説明にお付き合いいただき今日もありがとうございました。
(´∀`*)ノシ バイバイ
------------------------------------------
目次へ→
------------------------------------------
コメントをいただいた方は仕事上、統計分析をされる中堅社員の方だとのことで、そんな方に真剣に読んでいただけていると思うとうれし恥ずかしで身のしまる思いです(*`σェ´*)
自由度についてはどの書籍でもHPでも説明に苦労されている感じですね(`・ω・´)ノ
苦労というか、読んでて感じるのは自由度の意味をきちんと理解している人の大半は統計学の中~上級者クラスの人で説明も専門的なものが多いので難しいですね( p′︵‵。)
と言う僕もまだまだ勉強中の身なので、とりあえず自分なりに納得はしているけど今回のコメントを受けてすこし復習してみることにしました。
前に使っていた教科書や最近の新しいHPをチェックしてなんとなく僕なりの説明の仕方がイメージできてきたので、明日には下資料の作成に掛かりたいと思います.....φ(・ω・*)カキカキ
ちなみに今の僕の理解を簡単に言うと、自由度っていうのは他のデータによって確定されないデータ数のこと。平均がなければ、平均の元になってるデータはどのデータの影響も受けず、他のデータから推定することはできません。
でも仮に10個のデータの平均を算出しておいて、その後平均値はそのまま、データを一個だけ見えないようにしたところで、これは計算すれば導き出せます。(`・ω・´)ノ
つまり、残り9個のデータと平均により確定(推定というべき?)されてしまうデータがn数のうち1つある。
だからこれは自由度として扱っちゃだめ!!ということでn-1となる。
そして、10個のデータが母集団の全てのとき、(単に母集団の特徴を知りたいとき)は未知のデータはなく、個々のデータ達からみれば「いまさら平均がわかったから何??僕らは影響されませんよ??」って話ですよね?
でも10個のデータが母集団の全てではなかったとき、(未知の母集団の性質を推定するとき)は10個の平均値と母集団全体の平均値が同じと過程すると、平均値が算出されることで確定してくるデータが必ず一個出てきます。(`・ω・´)ノ
これがさっきの10個のデータのうち一個だけ見えなくした状態!!
そして統計学の用途としては大きく二つあって、前述の「データ数が母集団すべての場合、この特徴をひとつの数字で表すと??」って場合と今書いた「このデータから母集団の特徴をひとつの数字で推測すると??」って場合後者の元データが全く同じ場合、後者はあくまで「確率的(有意水準?%の精度で)にこうなるでしょう」って言い方になるので、出てくる数字にもハバを持たせる必要がありますから、n-1という自由度が使われます。(*`σェ´*)フムフム
ここまでが、今のところの僕の自由度に対する理解ですね(`・ω・´)ノ
これであーなるほどと思った方は機会があれば、自由度で悩んでる人に同じ説明をしてあげてください。
言ってる途中で「なんかシックリこないなぁ」って思ったらそれは今の僕と同じ現象ですv(。・ω・。)ィェィ♪
僕も今改めて書いてみてシックリきてません 笑
ということで冒頭に書いたように明日からもう少し掘り下げて調べつつ、下資料の作成に掛かっていこうと思います。.....φ(・ω・*)カキカキ
要するに・・・「本件については、もっと勉強して出直して参りたいと思います。今しばらくお時間をくださいm(__)m」
じゃあ書くなよって話ですよね?(((c=(゚ロ゚;qホワチャー
でもこの内容で考え方の大筋は間違ってないと思いますので、どうしても気になる方が調べたり、解釈するための取っ掛かりにでもなれればと思いましたのでそこはご容赦ください。m(__)m
ということで長々とわかる様なわからない説明にお付き合いいただき今日もありがとうございました。
(´∀`*)ノシ バイバイ
------------------------------------------
目次へ→
------------------------------------------
わざわざ記事にしていただき有難うございます。しっくりきていない原因はお互い一緒かもしれません。今はExcelポン!で簡単に計算ができてしまいますがPQの七つ道具などとも言われますが基礎は理解しないといけませんね(汗)
by chagama1300cb (2014-02-02 15:53)