正規分布の判断.....φ(・ω・*)カキカキ [統計学]
ずいぶんまえですが、正規分布について参考データなんかをつけて書いたことがあったと思いますが、今日はその補足をしてみようと思います。(`・ω・´)ノ
品質統計で使う色んな計算値の多くはデータが正規分布していることが前提でした(*`σェ´*)フムフム
じゃあ集めたデータが正規分布かどうかを判断するのはどうすりゃいいのよ?ってお話です。
といっても思いつきで書くのでデータなんかは準備してません( p′︵‵。)
なので簡単に説明します。(`・ω・´)ノ
方法は大きく3つ!!
その1
帰無仮説:このデータは正規分布である
対立仮説:このデータは正規分布ではない
という仮説をたて、正規性の検定を行う方法!!でもこれは中々専門的です。簡単にやるためのソフトなんかもある様ですが、僕的にもちょっと敷居が高い感じ(;´Д`)
その2
ヒストグラムを作成し、視覚的に正規分布と同じ形をしているかを確認する!
この間書いたのはこれですね(`・ω・´)ノ
気になる方はこちらをご覧ください↓↓
http://yu-noppo.blog.so-net.ne.jp/2014-01-13
でもこれだけじゃ感覚的すぎない?って人!
その3!
歪度(わいど)と尖度(せんど)を調べましょう(`・ω・´)ノ
歪度とは分布のゆがみを表す数字(。・Д・)ゞ分布の形が左右均等であれば0になります。
尖度は分布の峰(ヒストグラムのてっぺん)のとんがり具合を表す数値。
正規分布の形にもよるでしょうが、標準正規分布の尖度=3です。
ただし、両方ドンピシャな数字になることなんて珍しいでしょう。
なので、この2つの数字だけで判断すると落とし穴にハマります(`・ω・´)ノ
何って?
二山型の分布になって左右均等でも歪度は0となります。(。・Д・)ゞ
このとき正規分布と言えるのか?いえません(;´Д`)
じゃあどうすんの??
その2とその3をミックスしちゃえばいいんです(`・ω・´)ノ
視覚的にある程度正規分布に近いことを確認し、歪度と尖度で自分の判断を確信させるんです(*`σェ´*)
ちなみに僕は歪度0,2〜0,4くらいならOKと判断してます(`・ω・´)ノ
いやn数増やし続ければいずれ限りなく0に近づくのは確認したんですが、0.4の時もほぼ0の時も、得られた工程能力とかの数値の変化はホント微細なもんでしたので・・・|д・) ソォーッ…
まぁこれもどんな状況のデータをどんな精度で保証したいのかって事によると思うので一概には言えませんが・・・(。・Д・)ゞ
ということで久々の統計学ネタでございました。
本日もお付き合い頂きありがとうございます(ノシ=´ω`=)ノシ
-------------------------------------
目次へ→
------------------------------------
品質統計で使う色んな計算値の多くはデータが正規分布していることが前提でした(*`σェ´*)フムフム
じゃあ集めたデータが正規分布かどうかを判断するのはどうすりゃいいのよ?ってお話です。
といっても思いつきで書くのでデータなんかは準備してません( p′︵‵。)
なので簡単に説明します。(`・ω・´)ノ
方法は大きく3つ!!
その1
帰無仮説:このデータは正規分布である
対立仮説:このデータは正規分布ではない
という仮説をたて、正規性の検定を行う方法!!でもこれは中々専門的です。簡単にやるためのソフトなんかもある様ですが、僕的にもちょっと敷居が高い感じ(;´Д`)
その2
ヒストグラムを作成し、視覚的に正規分布と同じ形をしているかを確認する!
この間書いたのはこれですね(`・ω・´)ノ
気になる方はこちらをご覧ください↓↓
http://yu-noppo.blog.so-net.ne.jp/2014-01-13
でもこれだけじゃ感覚的すぎない?って人!
その3!
歪度(わいど)と尖度(せんど)を調べましょう(`・ω・´)ノ
歪度とは分布のゆがみを表す数字(。・Д・)ゞ分布の形が左右均等であれば0になります。
尖度は分布の峰(ヒストグラムのてっぺん)のとんがり具合を表す数値。
正規分布の形にもよるでしょうが、標準正規分布の尖度=3です。
ただし、両方ドンピシャな数字になることなんて珍しいでしょう。
なので、この2つの数字だけで判断すると落とし穴にハマります(`・ω・´)ノ
何って?
二山型の分布になって左右均等でも歪度は0となります。(。・Д・)ゞ
このとき正規分布と言えるのか?いえません(;´Д`)
じゃあどうすんの??
その2とその3をミックスしちゃえばいいんです(`・ω・´)ノ
視覚的にある程度正規分布に近いことを確認し、歪度と尖度で自分の判断を確信させるんです(*`σェ´*)
ちなみに僕は歪度0,2〜0,4くらいならOKと判断してます(`・ω・´)ノ
いやn数増やし続ければいずれ限りなく0に近づくのは確認したんですが、0.4の時もほぼ0の時も、得られた工程能力とかの数値の変化はホント微細なもんでしたので・・・|д・) ソォーッ…
まぁこれもどんな状況のデータをどんな精度で保証したいのかって事によると思うので一概には言えませんが・・・(。・Д・)ゞ
ということで久々の統計学ネタでございました。
本日もお付き合い頂きありがとうございます(ノシ=´ω`=)ノシ
-------------------------------------
目次へ→
------------------------------------
「イメージ・2」にご訪問いただき有難うございます。
これからもよろしくお願いいたします。
by lamer (2014-04-27 00:41)