- 1. M2 - 基礎統計學 - 進階篇(Advanced Basic Statistics)Pg *
- 2. Pg *回顧中心趨勢量測
衆數, 中位數 和 平均數
回顧偏差量測
全距, 變異數, 標準差
回顧“形狀”量測
基本繪圖工具 點狀圖, 直方圖, 箱形圖
論述機率概念和機率分佈概念
基本機率概念
常態分配:Anderson Darling,Skew,kurtosis
伯努利程式 (Bernoulli)
伯努力分佈和卜瓦松分配 (Poisson)
時間量測之指數與加瑪分配 章節目的與用途
- 3. Pg *測量階段:可能取得的成果明確專案定義
項目描述
運用 Metric.xls確立項目關鍵測量指標及文件跟踪
確認輸入及输出測量指標
製程流程圖及精簡製造(Lean Manufacturing)簡介
因果矩陣及魚骨圖
測量系統分析
數據系統和 Minitab軟體簡介
基礎統計學
量具研究: 定性型 / 定量型測量系統
確定製程能力
計算短期和長期 Cpk, Ppk, Sigma 水準, DPU, RTY
完成階段總段
結論,問題和下階段任務
- 4. Pg *還記得 Taguchi 嗎?LSLUSL凡超出標準的部分
即表示品質損失球門柱心態 傳統觀念LSLUSL凡因偏離目標而對社會造成的損失
即表示品質損失變異有害無益 Taguchi 觀念?
- 5. Pg *屬性及變異數資料增加資訊類別敘述例子統計工具名目尺度不連續的:
無秩序的
離散數據
無區間資料.通過/失敗l
計算資料
屬性資料
產出資料Chi2 Test
Contingency Tables
1- & 2-proportion tests順序尺度不連續的:
有條理的
離散數據
無區間資料Good/Better/Best
適合的尺度
小/中/大
刻度 1 to 5Nominal tests plus:
Sign Test
Wilcoxon Rank-Sum
Wilcoxon Signed-Rank區間尺度 連續的:
Equal intervals;
No absolute zero.Temperature (°C)
Position
Ordinal tests plus:
ANOVA Chi2 Test
DOE z, t tests
Regression F test
Kruskal-Wallis & More…比率尺度連續的:
Equal intervals;
Absolute zero.Dimensions
Pressure
Concentration分佈區域是離散或連續的。
- 6. Pg *什麽是“統計值”?從資料樣本中所提取的資訊:
最小值
最大值
百分位數(值): 25th, 50th,75th
分配次數
總數
缺點百分數
?
- 7. Pg *基礎統計學概念樣本統計學用於
估計 母體特徵12.4 15.2 16.4
09.2 18.7 15.4
32.6 14.2 19.1
08.5 10.7 06.3AnalysisSAMPLEMeasurePOPULATION
- 8. Pg *爲什麽要産生基本統計資料?透過解答下列問題藉以協助流程管理:
製程的輸出指標達到目標了嗎?
製程的輸出指標達到規格的程度是多少?
製程的績效改變了嗎?
兩條平行的製程是否一樣?
製程的輸出指標能達到什麽程度?
缺點率是多少呢?
- 9. Pg *基礎統計學主要的母體屬性:
位置 分 散 程 度分 佈 的 形 狀一致性
- 10. Pg *中心趨勢量測衆數
一組測量值的衆數的定義是出現次數最多(頻率最高)的測量值
如果將此組資料用直方圖或點圖來表示的話, 則最高的柱條或堆疊區間的中心點即爲衆值
中位數
一組測量值的中位數其定義是當測量值按大小順序排列時所取的中間數
- 11. Pg *中心趨勢量測算術平均數 (或平均數)
平均數是母體中所有可能的值乘以其發生的頻率之總和
母體平均數用希臘字母 m來表示
樣本平均數用 X 來表示, 並且用
?估 計
- 12. Pg *散佈與變異的量測全距
一組測量值的全距是這一組測量值的最大值與最小值之差
?這兩個分佈都有相同的全距值
但是它們的分佈形狀完全不同
- 13. Pg *母體變異數 (s2)
變異數是所有規測數值與平均數之差平方的總和除以資料總個數.
用以估計母體變異數 (s2)
利用樣本變異數(s2) 形成一個“無偏差”估計值來估計母體變異數(s2)
散佈與變異的量測?估計
- 14. Pg *散佈與變異的量測母體標準差 (s)
標準差是變異數的正平方根
樣本標準差用以估計母體標準差
(s or Sigma “hat”)
- 15. Pg *變異數的重要特性變異數可相加性; 標準差不能相加
變異數後才可計算出“平均”標準差
- 16. Pg *母體參數與樣本統計值母體參數
母體平均數 (m)
母體變異數 (s2)樣本統計量
樣本平均數(X-bar)
變異數估計值
- 17. Pg *使用敘述統計的例子收集資料來監控食品服務業浪費的情況
浪費的食物將以金錢呈現,且每個月累積
- 18. Pg *使用統計和 Minitab作探測性的分析?Foodfight.mtw使用 Minitab
計算
食物浪費資料的
敘述性統計值描述性統計量: 浪費
Descriptive Statistics: Waste
去除兩端5%的極值後
變數 樣本數 平均數 中位數 平均數 標準差 平均標準誤差
Variable N Mean Median TrMean StDev SE Mean
Waste浪费 33 707.1 740.0 714.3 128.9 22.4
變數 最小值 最大值 第一個四分數 第三個四分數
Variable Minimum Maximum Q1 Q3
Waste浪费 449.8 846.8 639.8 819.6
- 19. Pg *?重Run Minitab ,再作一次分析, 這次包括圖形選擇使用統計和 Minitab作探測性的分析
- 20. Pg *位置
分散程度
形狀假設資料是穩定的下一步: 檢查資料隨時間延續的穩定性使用統計和 Minitab作探測性的分析
- 21. Pg *?使用 Minitab 製作一個 運行圖 (Run Chart)使用統計學和 Minitab作探測性的分析
- 22. Pg *選擇: Editor Brush Set ID Variables單擊 Brush 圖示使用統計和 Minitab作探測性的分析
- 23. Pg *拖曳滑鼠框住一組點來檢查子集合使用統計和 Minitab作探測性的分析
- 24. Pg *1/31/98 832.39 1
2/28/98 757.79 1
3/31/98 814.95 1
4/30/98 775.01 1
5/31/98 844.39 1
6/30/98 780.69 1
7/31/98 814.38 1
8/31/98 820.01 1
9/30/98 767.18 1
10/31/98 841.67 1
11/30/98 826.54 1
12/31/98 819.26 1
1/31/99 822.63 1
2/28/99 737.45 1
3/31/99 846.84 1
4/30/99 841.35 15/31/99 690.82 2
6/30/99 658.23 2
7/31/99 689.27 2
8/31/99 740.02 2
9/30/99 680.79 2
10/31/99 722.13 2
11/30/99 732.18 2
12/31/99 621.44 2
1/31/00 750.42 2
2/29/00 673.67 23/31/00 504.51 3
4/30/00 488.15 3
5/31/00 508.24 3
6/30/00 449.77 3
7/31/00 525.34 3重新再作一次分析將資料以分組變數的形式分割開來1st 組2nd 組3rd 組使用統計和 Minitab作探測性的分析
- 25. Pg *?Variable Group N Mean Median TrMean StDev
Waste 1 16 808.91 819.63 811.30 34.23
2 10 695.9 690.0 698.4 40.4
3 7 490.32 488.15 490.32 24.82
Variable Group SE Mean Minimum Maximum Q1 Q3
Waste 1 8.56 737.45 846.84 776.43 839.11
2 12.8 621.4 750.4 669.8 734.1
3 9.38 449.77 525.34 477.76 508.24使用統計和 Minitab作探測性的分析
- 26. Pg *使用敘述統計:預測結果敘述統計用於回答流程績效和客戶期望的眾多相關問題:
‘典型’的結果應為何?
結果的變動量是多少?
過了一段時間後,流程是否仍舊一致?
這些敘述統計工具,如機率分配可以用於:
解釋過去現象
預測未來
由次數或機率預測投資結果
- 27. Pg *這些利益的頻率為何?客戶滿意的頻率為何?在流程中浪費的比率有多少?在一小時內來店超過15個客戶的比率高不高?零件出錯的比率為何?打電話進來訂貨的放棄比率是多少?(可能在線上等太久而放棄.)文件出錯的比率為何?
- 28. Pg *在流程中浪費的比率有多少?讓郵件上有正確的郵資
fcmail.mtw隨機抽取50 份郵件來衡量它們的重量,而這些資料將刊在fcmail.mtw
你猜有多少比率郵件是用第一類郵件的郵資,但其超過1盎司重量?郵件是由大小分類.
所有商業大小的信封當於平信郵資,屬於第一類郵件
最大重量的第一類郵件的規定是1盎司.
- 29. Pg *FC 郵件的敘述統計位置, 散佈,形狀
Stat>Basic Statistics>Display Descriptive Statistics
(平均數) 0.733
(標準差) 0.144
Shape (Normal??)
Proportion > 1oz = 1/50 = .02
Note:Proportion estimate has low resolution
?How can a better estimate for defectives be generated?
- 30. Pg *母體分佈
- 31. Pg *母體分佈
- 32. Pg *常態檢定: Anderson-DarlingAnderson-Darling 試驗:
比較實際資料分配次數與理論常態分配, 使用樣本估計推算 m 與 s:
如果理論分佈適合這個資料分佈,計算出的試驗統計值A2 應該較小。
由p值大小可看出檢驗值A2 是否符合常態分配。
- 33. Pg *介紹 Z-值什麽是 Z-值?
Z-值 是基於標準常態分佈的
常態分佈機率 = 0 和 = 1
機率已知並記錄在案
可用 Z-值計算其他常態分佈的機率 標準常態分佈
所有常態分佈皆可轉換成標準常態分佈 ChamberTemp2.mtw
- 34. Pg *Z-轉換Z-轉換將任何一個常態分佈(其 m 和 s) 轉換成一個標準常態分佈 (m = 0, s = 1)
其值, z (z-值), 表明以標準差爲單位 X 中的任何一個數距平均數有多遠ChamberTemp2.mtw
- 35. Pg *實例: 評估蒸汽殺菌製程性能組裝前, 對一台醫學儀器的某一子部件進行蒸汽殺菌以減少污染水平使其符合污染標準.
殺菌製程要求在“曝光”階段的全距非常小, 其標準爲 1250C ± 1.50C.
每天, 在其中某次殺菌曝光運行中, 用控制探測棒提取樣本溫度.
一位技師已收集了兩個月的資料以供分析. 資料可在 ChamberTemp2.mtw 文件中找到.
- 36. Pg *Z-轉換
實例: 在 ChamberTemp2.mtw 文件中研究來自高壓滅菌器過程的溫度資料
使用 Minitab 生成敘述性統計量
平均數 = 124.61 標準差 = 0.49
對於第一個容器溫度資料點, 其 z 值是多少?ChamberTemp2.mtw
- 37. Pg *計算容器溫度 2的 Z-值選 Calc>Calculator…然後鍵入下列資訊:
- 38. Pg *真實世界與 Z 世界將溫度 和 Z 的資料產生直方圖
Graph>Histogram…
- 39. Pg *真實世界與 Z 世界 – 直方圖?真實世界Z 世界
- 40. Pg *Z 的詮釋Z-轉換值是以Sigma為單位 Z 距平均數的距離
有多少缺點是由此製程産生的 ?真實世界Z世界?
- 41. Pg *從 Z 中計算不良率缺點數是:缺點數是:真實世界Z 世界P(Temp < 123.5)P(Temp > 126.5) +P(Z < -2.27)P(Z > 3.86) +
- 42. Pg *Z > 3.86st 的機率是多少?01 23-1-2-399.7%~ 95%~ 68%Z 世界~.006%較高的不良率
0.006%
或 百萬分之不良品率
60 DPPM?
- 43. Pg *常態分配機率68%95%99.7%曲線下的面積就等於機率
- 44. Pg *常態分佈平均值和標準差決定整個曲線
- 45. Pg *經驗性機率規則下列值是對理論與經驗常態分佈機率的估計得出來的標準差個數標準差個數標準差個數± 1 s68%60-75%± 2 s95%90-98%± 3 s99.7%99-100%
- 46. Pg *第一堂課所談的重量是常態的嗎?
- 47. Pg *常態檢定的例子Bstatshapes.mtw
- 48. Pg *常態檢定(Normality Test)Stat>Basic Statistic>Normality TestBstatshapes.mtw?從這些資料判斷其為什麼樣的圖案特徵?常態機率圖機率服務時間
- 49. Pg *常態的量測: 偏斜(Skew)常能機率分配的資料應平均的分佈於平均數週邊:50%分配於兩側
Skew (偏斜的)在衡量其不對稱調和
完美的對稱時 Skew = 0.0
正常正偏負偏
- 50. Pg *常態的量測: 峰態 (Kurtosis)常態分配應有標準的形狀對應其平均數與變異數
Kurtosis在衡量其壓扁(太扁或太平)或擠壓(太高或太瘦)的次數分配圖形與常態分配相關
Kurtosis 為 0.0 乃完美的適合度
壓扁的正常擠壓
- 51. Pg *偏斜(Skew)和峰態(Kurtosis): Statistics from MinitabBstatshapes.mtw?
- 52. Pg *使用常態模式計算第一類郵件的不良率試驗分佈常態分佈Cumulative Distribution Function
Normal with mean = 0.733
and std dev = 0.1436
x P(X <= x)
1.000 0.9685
Calc>Probability Distributions>Normal
- 53. Pg *練習:漢堡餡肉的重量 對漢堡餡肉而言,多少比例是人們不易察覺,是0.25磅?
Bstatshapes.mtw x P( X <= x )
0.2500 0.1791
- 54. Pg *文件中有多少比例會出現錯誤?採購所花的時間用於重覆處理採購訂單
150張訂單中的58張樣本需要加強審核
由樣本估計所有文件的錯誤率是58/150=.387
平均每週有40張新的訂單被送到採購部門
對任何一週而言,預期有更多人力投入此工作,訂單需要重工的最大可能數目為何?
- 55. Pg *常用的機率分配介紹
- 56. Pg *介紹二項式分配 (Bernoulli Distribution) 二項式分配是當傾向成功為p,而 0 p 1時,在一系列試驗中觀察成功的機率
此分配在下列情況下成立 :
所有結果各自獨立
傾向成功對所有試驗而言是一致的
符合這些條件的流程稱之為 :Bernoulli Process
- 57. Pg *二項式(Bernoulli)分配的例子投擲一公平的硬幣,設定硬幣“正面人頭朝上“為成功.
成功的機率是p = 0.50
二項式分配可算出投擲十次硬幣出現4次正面的機率 = 0.2051
重複試驗中,“成功”代表發現的瑕疵品 。
如果p = 0.08代表在95% 的信心下,100次試驗中,瑕疵品不超過12個
區分服務電話的成功,透過時間長度來決定 .
如果成功率= 98%,下20次服務電話成功的機率為0.67
- 58. Pg *二項式分配公式二項式分配機率
N次試驗的伯努力實驗中,p代表成功,機率分配如下:
舉例:
過去,成功機率為3/4,現在6個中有4個失敗,所有事情改變了嗎?找出6個中有4個失敗的機率,你的結論為何? DO NOT
MEMORIZE
- 59. Pg *二項式分配 (Binomial Distributions)以下為兩種不同的二項式分配.
第一種為每個試驗出現許多成功,最終會趨近於常態分配
第二種則每個試驗僅出現少數成功,最終趨近於卜瓦松(Poisson)分配
- 60. Pg *計算訂單不良品的最大數量對p的最佳估計為58/150 = .387
試驗的次數= 40(每週)
99%信心水準下不良品的最大數量?
Calc>Probability Distributions>Binomialx P(X<=x ) x P(X<=x )
22 0.9877 23 0.9949
為何有2個值?
- 61. Pg *卜瓦松分配 (Poisson Distribution)卜瓦松分配可以用來計算流程結果的機率,如下列比率:mice/公畝、缺點/單位、來電量/小時等等。
Mice, 缺點, 及來電量是 “事件”
公畝、單位及小時代表事件發生的“機會區域“
卜瓦松分配有下列情況 :
事件的發生次數是相等的在整個機會區域內
事件發生的可能性在整體發生區域上各自獨立,互不影響
符合此條件者稱之為“卜瓦松分配(Poisson Process)”卜瓦松試驗是比率試驗。
- 62. Pg *卜瓦松分配 (Poisson Distribution) - 離散比較此兩種分配
第一種為低成功次數之伯努力分配
第二種為相同平均數下之卜瓦松分配
?
- 63. Pg *卜瓦松分配 (Poisson Distribution) 定義:
在Poisson實驗中,代表在特定機會區域內的平均成功數, e=2.71828… 機率分配被定義為:
舉例:
在正常上班日的早晨,實驗室需求產出是每小時四件 .
在任何一個小時此產出水準到達每小時六件的機率為何? Binomial and Poisson are used in attribute SPC charts.DO NOT
MEMORIZE
- 64. Pg *使用 Minitab計算卜瓦松機率(Poisson Probabilities)在正常上班日的早晨,實驗室需求產出是每小時四件 .
在任何一個小時此產出水準到達每小時六件的機率為何?
Calc>Probability Distributions>PoissonPoisson with mu = 4.00
x P(X = x )
6.00 0.1042
- 65. Pg *指數分配 (Exponential Distributions)用來指定工作週期時間的機率
v不須
記憶Good News for
“Less the Better” Targets
- 66. Pg *指數應用的例子 當量測服務時間時,蒐集資料用以決定印刷服務的品質
問題:所有工作的99%完成需多久時間?Note the calculated mean and standard deviationv
- 67. Pg *指數分配能夠被使用嗎?Graph>Probability PlotvDistexamples.mtw
- 68. Pg *指數應用的例子 假設 m = 82 分鐘
假設頻率的型態是指數分配
In Minitab: Calc>Probability Distribution>Exponential
P( X <= x ) x
0.9900 377.62406.3 hours
- 69. Pg *經驗 vs. 理論考量單一工作週期時間的直方圖
經驗分配如何展現?
Two modes?
單一工作 10?
另外多重工作 33?
系統是否從單一工作流程轉化為多重工作流程 ?
為細節調查工作提供方向
- 70. Pg * Gamma 分配用來決定週期時間的機率
適用於一系列工作
Two Parameters:
a = 按順序執行的工作數目
b = 每一工作的平均服務時間 (1/b = Mean Service Rate)For the stout
of Heart
- 71. Pg *二個工作週期時間 = ab
2 = ab2
舉例:
b = 10分鐘/平均週期時間
a = 2 個工作
= 20 分鐘
= 14.1 分鐘
- 72. Pg *三個工作週期時間 = ab
2 = ab2
舉例:
b = 10分鐘/平均週期時間
a = 3 個工作
= 30
= 17.32
- 73. Pg *十個工作週期時間 = ab
2 = ab2
舉例:
b = 10 分鐘/平均週期時間
a = 10 個工作
= 100
= 31.6
- 74. Pg *經驗 vs. 理論從一個多重任務週期中思考描述性統計
平均數 = 20.75
變異數 = 117.03
平均數 = ab
變異數 = ab2
b = 2/ = 5.64
平均服務時間
1/b = .18
平均服務時間的比率
a = / b = 3.68
# Tasks
- 75. Pg *練習資料按整體批次記錄程序收集
回答以下的問題:
每批記錄中批次良品比率為多少?
如果以平均來看,每個班別生產25批,在任何一個班別中,少於5個不良品的機率為何?
每批記錄超過3個不良的機會為多少?
從回顧資料,有多少工作被包含於中,並且每個工作平均週期時間為多少?
每批於10分鐘內被記錄的機率?
Batchrecord.mtw
- 76. Pg *課後作業批量記錄:
評估缺點率和流程時間的一致性,以班別、產品類型和週次
若任何因子看來很顯著,以因子水準評估第一次就做對,缺點率和流程時間 Batchrecord.mtw