標準偏差.....φ(・ω・*) [統計学]
さてこの前ちょっとだけ統計学のお話をしましたが、しばらくさぼってしまいました|д・) ソォーッ…
なぜさぼっていたかというと・・・Excelで作った資料や画像のブログへの挿入方法がわかりませんでした( p′︵‵。) そして・・・まだわかっていませんッ(((c=(゚ロ゚;qホワチャー
けどだからといっていつまでも更新しないのも如何なものかと思うので、文字だけで頑張ってみようと思います。 わかりづらい場合は、ダメ出しのコメントを下さい(傷つかない程度に優しい言葉でお願いします( p′︵‵。))
でわでわ標準偏差について!!(`・ω・´)ノ
仮に10000個の製品があったとして、その10000個の仕上がり寸法が大丈夫かどうかを把握したい場合には、平均と標準偏差(σ)を算出し、平均±(3×σ)を算出する事で、10000個全体の最小値(平均ー3σ)と最大値(平均+3σ)が推測され、これは実際にすべて測った時にこの推測範囲からはみ出すであろうものが0.3%程度だというのが前回のお話(*`σェ´*)フムフム
いや、そうじゃなくて、不良が発生しているのか?いないのか?この機械の加工精度はどの程度信頼していいの?って場合は工程能力指数といってCpとCpkという指数を導きます。
このときも標準偏差(σ)が使われます。
計算方法は・・・
Cp=(規格上限ー規格下限)÷(6×σ)
Cpk=Min((規格上限ー平均)÷(3×σ),(平均ー規格下限)÷(3×σ))
となります。(Cpkの方はExcelの計算式として書いてます(`・ω・´)ノ)
一般的にこの数値が1,333以上なら100万本作って不良は2本とかのレベルで信頼に足る品質と言われています。1.666を超えると申し分なし!! これでお客様や品質部隊から文句が出るのであればいじめでしかないですね。゚(゚´Д`゚)゚
基本的にはみなさん1.333以上を要求される事と思いますが、お客様によりけりなのでそこはご確認を!! 工程能力指数についてはまたまた詳しく説明しますが、ここでもやっぱ鍵になるのは標準偏差!!!
じゃあそもそも標準偏差ってなによ?というお話からしましょう(*・ω・*)b♪
一言で言えばバラツキをひとつの数値で表す為に平均化したもの。
じゃあバラツキって??? 下の表をみて下さい。
ある製品の仕上げ寸法を50㎜狙いで加工し、うち5個を測定した結果です。
個々のデータと5つの平均の差を算出したもの(つまりバラツキ)を偏差(へんさ)といいます。
データNo. データ 偏差
1 50 0
2 51 1
3 50 0
4 52 2
5 47 -3
平均 50 0
5個だからわかりやすいけど、これが100個もあったらいちいちみても意味わかんねーよΣ( ̄□ ̄;)
でも全体としておおよそどのくらいバラツキがあるのかはパッとわかりたいなぁ(*`σェ´*)
じゃぁ偏差の平均をみてみようぜぇ゚+。:.゚(*゚Д゚*)キタコレ゚.:。+゚
偏差の平均=(0+1+0+2+(−3))÷5=0
・・・・バラツキ=0???んなわけねぇだろッ( ´Д`)=○ )`ъ’)・:’.,
ってなります。 だって偏差は個々のデータから全部のデータの平均を引いたもの、合計した時点で0になって当たり前.....φ(・ω・*)
いやいや、じゃぁバラツキを1つの数字でみる事はできないの??って昔の人は賢いッ!! ここで諦めなかったすごい人が居たんですね゚+。:.゚(*゚Д゚*)キタコレ゚.:。+゚
ざっくり言うと符号がプラスだろうがマイナスだろうが、平均からそれだけズレている事に代わりはないんじゃね??ってことに気付かれたんです。(*・ω・*)b♪
データNo. データ 偏差
1 50 0
2 51 1
3 50 0
4 52 2
5 47 -3 ←この−(マイナス)をとっちまおうぜ!!
平均 50 0
なので偏差をすべて2乗します。
(理由は別にあるんですが、符号をとるためで納得された方が一旦はスムーズかと・・・ぶっちゃけ僕も完璧に説明できるほど理解できてなかったり|д・) ソォーッ…)
以下計算方法を箇条書きにしますので、一度Excelで検証してみて下さい。
1 全データの平均を算出。
2 個々のデータから平均を引いて偏差を算出。
3 個々の偏差を2乗した値を算出。
4 偏差の2乗を合計。
5 偏差の2乗の合計 ÷ (データ数−1)
※データ数から1を引く理由・・・抜きとったデータから大元の集団を予測する場合
平均を算出するのにも同様の事を行います。
これは自由度というものです。
気になる方は調べてみて下さい。
僕も機会があればクローズアップします。
6 2乗したのを元に戻すため平方根をとります。
Excelでは =sqrt(セル)で平方根できます。
※2乗を元に戻す理由・・・例えばデータの単位が㎜だった場合、
2乗しちゃってるのでここで
算出した数字の単位は㎟(平方ミリメートル)
になっちゃってます。
単位をそろえないと後々の±3σや
Cp、Cpkの計算に使えません。
7 6の値とExcelの標準偏差の計算 =Stdev(セル:セル)を比べてみて下さい。|д・) ソォーッ…
・・・おんなじでしょ?゚+。:.゚(*゚Д゚*)キタコレ゚.:。+゚
つまり標準偏差とはバラツキを平均化して、ひとつの数値で表したいけど、バラツキとは平均からのズレなので、単純に平均として数値を出せないฅ(´-ω-`)ฅ
なので、遠回しな計算を加えて算出してみましたぁ(*・ω・*)b♪的な話です。
そして偶然か、必然かこの標準偏差という数字は色んな事に使える便利なものだったという事。
その代表格が±3σや工程能力指数(Cp、Cpk)なんですね(*`σェ´*)フムフム
これは僕の経験則なんですけど、標準偏差については、Excelで一撃で計算できちゃうので、だいたいの文献やHPでは公式と文字による解説をしているんですけど、僕はさっぱりわかりませんでした。
ホントに理解するのに半年くらい掛かったかな?? あるときさっきの様な手計算の解説をしてる本に出会って、その数値を暗算できるくらい簡単な数字に置き換えて初めてピンと来たんです。(*・ω・*)b♪
でもこういう解説をしているHPはやっぱ未だになかったのであえてこんな感じに解説してみました。
多分、統計学を専門にやっておられる先生や学生さんからみたらハショリ過ぎの突っ込み所満載な解説だと思います。( ̄◇ ̄;)
でも一応この理解で僕自身が評価したり算出してきたデータも実績を積んでるし、大きく間違ってもいないので基本的な品質管理に用いる範疇では間違いはないと思うのでこの程度でご容赦ください
(ノシ=´ω`=)ノシ
でわ本日はこれにて!!⊂(・∀・)∂))バイバイ
ーーーーーーーーーーーーー
目次へ→
関連記事です(*・ω・*)b♪
・ヒストグラムと正規分布について
・ヒストグラムと正規分布Ⅱ
・正規分布の判断
・標準偏差
・標準偏差のまとめ1
自由度って
・工程能力指数
・工程能力指数と不良率
・Cp、Cpkから不良率算出
なぜさぼっていたかというと・・・Excelで作った資料や画像のブログへの挿入方法がわかりませんでした( p′︵‵。) そして・・・まだわかっていませんッ(((c=(゚ロ゚;qホワチャー
けどだからといっていつまでも更新しないのも如何なものかと思うので、文字だけで頑張ってみようと思います。 わかりづらい場合は、ダメ出しのコメントを下さい(傷つかない程度に優しい言葉でお願いします( p′︵‵。))
でわでわ標準偏差について!!(`・ω・´)ノ
仮に10000個の製品があったとして、その10000個の仕上がり寸法が大丈夫かどうかを把握したい場合には、平均と標準偏差(σ)を算出し、平均±(3×σ)を算出する事で、10000個全体の最小値(平均ー3σ)と最大値(平均+3σ)が推測され、これは実際にすべて測った時にこの推測範囲からはみ出すであろうものが0.3%程度だというのが前回のお話(*`σェ´*)フムフム
いや、そうじゃなくて、不良が発生しているのか?いないのか?この機械の加工精度はどの程度信頼していいの?って場合は工程能力指数といってCpとCpkという指数を導きます。
このときも標準偏差(σ)が使われます。
計算方法は・・・
Cp=(規格上限ー規格下限)÷(6×σ)
Cpk=Min((規格上限ー平均)÷(3×σ),(平均ー規格下限)÷(3×σ))
となります。(Cpkの方はExcelの計算式として書いてます(`・ω・´)ノ)
一般的にこの数値が1,333以上なら100万本作って不良は2本とかのレベルで信頼に足る品質と言われています。1.666を超えると申し分なし!! これでお客様や品質部隊から文句が出るのであればいじめでしかないですね。゚(゚´Д`゚)゚
基本的にはみなさん1.333以上を要求される事と思いますが、お客様によりけりなのでそこはご確認を!! 工程能力指数についてはまたまた詳しく説明しますが、ここでもやっぱ鍵になるのは標準偏差!!!
じゃあそもそも標準偏差ってなによ?というお話からしましょう(*・ω・*)b♪
一言で言えばバラツキをひとつの数値で表す為に平均化したもの。
じゃあバラツキって??? 下の表をみて下さい。
ある製品の仕上げ寸法を50㎜狙いで加工し、うち5個を測定した結果です。
個々のデータと5つの平均の差を算出したもの(つまりバラツキ)を偏差(へんさ)といいます。
データNo. データ 偏差
1 50 0
2 51 1
3 50 0
4 52 2
5 47 -3
平均 50 0
5個だからわかりやすいけど、これが100個もあったらいちいちみても意味わかんねーよΣ( ̄□ ̄;)
でも全体としておおよそどのくらいバラツキがあるのかはパッとわかりたいなぁ(*`σェ´*)
じゃぁ偏差の平均をみてみようぜぇ゚+。:.゚(*゚Д゚*)キタコレ゚.:。+゚
偏差の平均=(0+1+0+2+(−3))÷5=0
・・・・バラツキ=0???んなわけねぇだろッ( ´Д`)=○ )`ъ’)・:’.,
ってなります。 だって偏差は個々のデータから全部のデータの平均を引いたもの、合計した時点で0になって当たり前.....φ(・ω・*)
いやいや、じゃぁバラツキを1つの数字でみる事はできないの??って昔の人は賢いッ!! ここで諦めなかったすごい人が居たんですね゚+。:.゚(*゚Д゚*)キタコレ゚.:。+゚
ざっくり言うと符号がプラスだろうがマイナスだろうが、平均からそれだけズレている事に代わりはないんじゃね??ってことに気付かれたんです。(*・ω・*)b♪
データNo. データ 偏差
1 50 0
2 51 1
3 50 0
4 52 2
5 47 -3 ←この−(マイナス)をとっちまおうぜ!!
平均 50 0
なので偏差をすべて2乗します。
(理由は別にあるんですが、符号をとるためで納得された方が一旦はスムーズかと・・・ぶっちゃけ僕も完璧に説明できるほど理解できてなかったり|д・) ソォーッ…)
以下計算方法を箇条書きにしますので、一度Excelで検証してみて下さい。
1 全データの平均を算出。
2 個々のデータから平均を引いて偏差を算出。
3 個々の偏差を2乗した値を算出。
4 偏差の2乗を合計。
5 偏差の2乗の合計 ÷ (データ数−1)
※データ数から1を引く理由・・・抜きとったデータから大元の集団を予測する場合
平均を算出するのにも同様の事を行います。
これは自由度というものです。
気になる方は調べてみて下さい。
僕も機会があればクローズアップします。
6 2乗したのを元に戻すため平方根をとります。
Excelでは =sqrt(セル)で平方根できます。
※2乗を元に戻す理由・・・例えばデータの単位が㎜だった場合、
2乗しちゃってるのでここで
算出した数字の単位は㎟(平方ミリメートル)
になっちゃってます。
単位をそろえないと後々の±3σや
Cp、Cpkの計算に使えません。
7 6の値とExcelの標準偏差の計算 =Stdev(セル:セル)を比べてみて下さい。|д・) ソォーッ…
・・・おんなじでしょ?゚+。:.゚(*゚Д゚*)キタコレ゚.:。+゚
つまり標準偏差とはバラツキを平均化して、ひとつの数値で表したいけど、バラツキとは平均からのズレなので、単純に平均として数値を出せないฅ(´-ω-`)ฅ
なので、遠回しな計算を加えて算出してみましたぁ(*・ω・*)b♪的な話です。
そして偶然か、必然かこの標準偏差という数字は色んな事に使える便利なものだったという事。
その代表格が±3σや工程能力指数(Cp、Cpk)なんですね(*`σェ´*)フムフム
これは僕の経験則なんですけど、標準偏差については、Excelで一撃で計算できちゃうので、だいたいの文献やHPでは公式と文字による解説をしているんですけど、僕はさっぱりわかりませんでした。
ホントに理解するのに半年くらい掛かったかな?? あるときさっきの様な手計算の解説をしてる本に出会って、その数値を暗算できるくらい簡単な数字に置き換えて初めてピンと来たんです。(*・ω・*)b♪
でもこういう解説をしているHPはやっぱ未だになかったのであえてこんな感じに解説してみました。
多分、統計学を専門にやっておられる先生や学生さんからみたらハショリ過ぎの突っ込み所満載な解説だと思います。( ̄◇ ̄;)
でも一応この理解で僕自身が評価したり算出してきたデータも実績を積んでるし、大きく間違ってもいないので基本的な品質管理に用いる範疇では間違いはないと思うのでこの程度でご容赦ください
(ノシ=´ω`=)ノシ
でわ本日はこれにて!!⊂(・∀・)∂))バイバイ
ーーーーーーーーーーーーー
目次へ→
関連記事です(*・ω・*)b♪
・ヒストグラムと正規分布について
・ヒストグラムと正規分布Ⅱ
・正規分布の判断
・標準偏差
・標準偏差のまとめ1
自由度って
・工程能力指数
・工程能力指数と不良率
・Cp、Cpkから不良率算出
Excelで学ぶ統計解析入門 Excel2013/2010対応版
- 作者: 菅 民郎
- 出版社/メーカー: オーム社
- 発売日: 2013/09/04
- メディア: 単行本(ソフトカバー)
私は本当にあなたの執筆能力とあなたのブログのフォーマットにも感銘を受けています。
これは有料のトピックですか、それともカスタマイズしましたか
あなた自身?とにかく優れた高品質のライティングを続け、
最近のこのような素敵なウェブログを見るのはまれです。
by Josh (2018-03-03 16:08)