項目1 抽樣
【學習目標】
1.掌握抽樣方法及基本原則。
2.能按要求對紡織品進行抽樣。
一、抽樣檢驗
抽樣檢驗,簡稱“抽檢”,是按統計的方法要求,用適當的抽樣方法從母體中抽取適當的樣本進行檢查或測定,將檢驗結果與檢驗標準相比較,利用統計方法判定該群體是否合格。
1.統計推斷 在收集數據時,通常不太可能為了掌握一批產品的質量信息而對整批產品全部進行檢驗,尤其是需要進行破壞性檢驗的時候或產品數量巨大的時候。一般的方法是采用統計推斷的方式,即采用在全部產品中采取隨機抽樣的方式,選取一定的樣品來進行測試,將樣品測試的結果組成樣本數據,然后通過對樣品數據的分析來推斷整批(全部)產品的質量。
在統計推斷中,涉及一些名詞如總體、樣本等,分別簡述如下。
(1)總體。總體也稱為“母體”,是研究對象的全體。如一批零件、一個工序或某段時間內生產的同類產品的全部都可以稱為總體。
(2)個體。構成總體的基本單位,稱為個體。如每個零件、每件產品都是一個個體。
(3)總體容量。總體中所包含的個體數量稱為總體容量,通常用N來表示。如一批零件、一個工序或某段時間內生產的同類產品的總數量。
(4)樣本。樣本又稱子樣,是從總體中抽出來一部分個體的集合。
一般我們用X1,X2,…,Xn來表示總體的一個樣本。
樣本中每個個體稱為樣品,樣本中所包含樣品數目稱為樣本大小,也叫樣本量,常用n表示。
對樣本的質量特性進行測定,所得的數據稱為樣本值。
樣本數據的取值記為X1,X2,…,Xn,稱為樣本觀測值。
當樣本個數越多時,分析結果越接近總體值,樣本對總體的代表性就越好。
對于紡織品的各種檢驗,實際上只能限于全部產品中的極小一部分。一般情況下,被測對象的總體總是比較大的,且大多數是破壞性的,不可能對它的全部進行檢驗。因此,通常都是從被測對象總體中抽取子樣進行檢驗。
總體、樣本、數據間的關系如圖2-1所示。
圖2-1 總體、樣本、數據間的關系
2.取樣數量 為了控制和消除儀器誤差,試樣量的大小(樣本容量)在大多數情況下是根據數理統計方法確定的。最常用的確定取樣數量的統計方法可分為有限總體和無限總體兩種。
(1)有限總體的樣本容量。有限總體的數量是有限的,如從N包纖維中抽取n包檢驗,可由式(2-1)求得:
式中:n——取樣數量;
t——取決于要求概率水平的系數,可查t值表(表2-1)得到;
CV——變異系數;
Δ——允許誤差;
E——保證誤差率;
N——有限總體的個數。
表2-1 t值表
(2)無限總體的樣本容量。對某些紡織品的性能進行檢測(如纖維、紗線的強力)時,檢測數量n'遠小于總體數量,可認為總體是無限的,即N→∞,則:
當CV值未知時,可先指定一個試驗次數n,根據這n次試驗結果求出CV值,再代入公式求出n'。若n'<n,則認可原設定的n,否則需要補做(n'-n)次試驗。
一般試驗取E=±3%,樣品性質離散性大的項目,如強力試驗取E=±4%或±5%。置信概率水平一般取95%(即顯著性水平α=5%),要求高時用99%(α=1%),要求低時用90%(α=10%)。
二、抽樣方法
子樣檢驗的結果能在多大程度上代表被測對象總體的特征,取決于子樣試樣量的大小和抽樣方法。在紡織產品中,總體內單位產品之間或多或少總存在質量差異,試樣量越大,即試樣中所含個體數量越多,所測結果越接近總體的結果(真值)。試樣量的大小,可以用統計方法來確定。要保證試樣對總體的代表性就要采用合理的抽樣方法,即要盡量避免抽樣的系統誤差,既排除傾向性抽樣,又要盡量減小隨機誤差。為此,應采用隨機抽樣方法。
1.隨機抽樣 隨機抽樣是指從總體中隨機抽取一定數目的個體單位作為樣本進行觀察,使每個個體單位都有一定的概率被選入樣本,從而使根據樣本所做出的結論對總體具有充分的代表性。隨機抽樣能有效地避免主觀性導致的傾向性誤差(系統誤差),使得樣本資料能夠用來有效地估計和推斷總體的數量特征,并通過計算抽樣誤差,說明估計結果的可靠程度。
2.隨機抽樣的方法 隨機抽樣的方法有很多,常用隨機抽樣方法如圖2-2所示。
(1)簡單隨機抽樣。簡單隨機抽樣也稱為單純隨機抽樣、純隨機抽樣、SRS抽樣,是指從總體N個單位中任意抽取n個單位作為樣本,使每個可能的樣本被抽中的概率相等的一種抽樣方式。
當總體容量不大時,隨機抽樣是一種有效的抽樣方法。
簡單隨機抽樣是最基本的抽樣方法。分為重復抽樣和不重復抽樣。在重復抽樣中,每次抽中的單位仍放回總體,樣本中的單位可能不止一次被抽中。不重復抽樣中,抽中的單位不再放回總體,樣本中的單位只能抽中一次。
簡單隨機抽樣的具體做法有抽簽法、隨機數法,分別簡述如下。
①抽簽法。一般地,抽簽法就是把總體中的N個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續抽取n次,就得到一個容量為n的樣本。
②隨機數法。利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣,叫作隨機數法。
簡單隨機抽樣方法簡單直觀,由于總體中每個個體抽取的概率相等,計算抽樣誤差及對總體參數加以推斷比較方便。
但這種抽樣方法的抽樣順序比較復雜,在實際工作中,真正做到總體中每個個體被抽到機會完全一樣是不容易的。
(2)系統抽樣。系統抽樣又稱機械隨機抽樣或等距隨機抽,即將總體單位按某一標志(如時間)排序,然后按一定間隔來隨機抽取樣本。
如果被抽總體足夠大,并且易做某種次序的整理時,用系統抽樣較為合適,這種方法適用于大批量生產的流水線上產品的抽查。
系統抽樣實施方便,同時能夠保證樣本對總體的代表性。
圖2-2 抽樣方法分類
但如果總體單位排序后呈現一定的規律性甚至周期性,而抽樣間隔的周期正好與之吻合,系統抽樣就會導致系統性的偏差。
(3)分層抽樣。分層抽樣是先將總體按照與研究內容密切相關的主要因素分類或分層,然后在各層中按照隨機原則抽取樣本。分層抽樣可以減少層內差異,增加樣本的代表性。當獲得的資料不均勻,或呈偏態分布時,分層抽樣是一種有效的抽樣方法,特別適用于對產品質量的驗收。這種抽樣方法誤差小,但抽樣手續比較煩瑣。
(4)整群抽樣。整群抽樣也稱集團抽樣,即在總體中,不是抽取個別樣品,而是隨機抽取整群的產品。這種方法是先將總體按某個標志(企業、車間、班組、工序或一段時間內生產的一批零件)分成若干群,然后隨機抽取若干群,并由抽中的所有個體組成樣本。
這種方法常用于工序控制中,抽樣實施比較方便。但由于抽樣來自個別幾個群,而不能均勻分布在總體中,因而代表性差,抽樣誤差大。
三、抽樣檢驗的分類
抽樣檢驗的分類方法很多,主要有以下幾種類型。
1.按抽樣檢驗數的數量分類
(1)全檢。全數檢驗,簡稱為“全檢”,是對全數物品檢驗的方法,又稱為100%檢驗。它不僅耗時且耗費較高的成本,常用在機械化、自動化程度高,非常關鍵、較少數檢驗中。
全數檢驗一般使用于以下幾種狀況。
①不允許有不合格產品,任何不合格產品將造成安全上或經濟上損失時。
②制品品質水準惡化,亟待修正為規定品質水準時。
③需要了解該批制品實際品質狀況時。
④檢驗手續簡單,不會大量浪費人力、時間、經費時。
⑤檢驗的數量較少時。
(2)抽檢。抽樣檢驗,簡稱為“抽檢”,是按一定的產品抽樣水準及抽樣計劃,用適當的抽樣方法從母體數中抽取適當的樣本數,經檢驗結果與原定檢驗標準比較,利用統計方法以判定該群體是否合格。
以下狀況可使用抽樣檢驗。
①破壞性檢驗。
②允許有少數不合格品。
③節省檢驗費用及時間。
④受驗物品個數很多時。
⑤100%全檢不可行時,全檢影響交貨期時。
⑥全檢之成本遠高于不合格品所造成之成本時。
⑦檢驗對象是散裝或流程性材料時,如煤炭、礦石、鋼水、整卷紙張、電線等。
(3)免檢。免檢,是指產品檢驗時對產品不予檢驗。理論上,免檢是最經濟的,可以大量節約人力、物力、財力、時間等資源,在實際工作中,在有一定保障的基礎上盡可能免檢。
以下狀況可使用免檢。
①時間非常緊急,沒有時間檢驗。
②對于產品的不重要的特性的檢驗,且對產品使用沒有影響,也沒有風險的檢驗。③無法對產品的某種特性進行檢驗,如對于芯片的性能,一般只能免檢。
④在上游供貨商已做檢驗且被認可,如對于世界知名企業的產品可列為免檢產品。
⑤在商業檢測中,如果產品檢測歷史記錄非常好,對其中某一批或某幾批產品可采用免檢。
2.按抽樣檢驗次數分類
(1)單次抽樣。單次抽樣,就是指在抽樣的過程中,只從檢驗批中抽取一次來檢驗。在商業檢驗中,大多數都有采用單次抽樣。
(2)雙次抽樣。雙次抽樣是指在抽樣的過程中,從檢驗產品中抽取一組樣品來進行檢驗之后,再從中間抽一組樣品來檢驗。這中間又有兩種狀況:一是第一組樣品檢驗之后,樣品不放回去;二是第一組樣品檢驗之后,樣品又放回原批中再重新抽第二組。
(3)多次抽樣。多次抽樣實際上是雙次抽樣的延續,只不過是將雙次抽樣的次數增多而已。
3.根據檢驗嚴格程度分類 在各種抽樣計劃中,為了考慮產品的品質可能有連續性和成本等要求,一般都會設立三種不同嚴格程度的檢驗。
(1)正常檢驗。正常檢驗就是在抽樣計劃中,在正常狀況下使用的檢驗。
(2)加嚴檢驗。加嚴檢驗就是比正常檢驗的數量更多,如原來要抽100個,加嚴檢驗要抽125個。
(3)放寬檢驗。放寬檢驗就是比正常檢驗的數量更少,如原來要抽100個,放寬檢驗卻只要檢驗70個。
4.按檢驗對象的屬性分類
(1)計數抽樣檢驗。根據給定的技術標準,將單位產品簡單地分成合格品或不合格品的檢驗;或是統計出單位產品中不合格數,進而推斷整批產品的接收與否的檢驗。前一種檢驗又稱“計件抽樣檢驗”;后一種檢驗又稱“計點抽樣檢驗”。
計數抽樣檢驗適用于下列檢驗:
①連續批產品。
②原材料、外購、外協件,成品、半成品交接。
③庫存品復檢。
④無形的產品(服務、旅游等),工序管理和維修操作。
⑤一定條件下的孤立批。
(2)計量抽樣檢驗。根據給定的技術標準,將單位產品的質量特性(如長度、重量等)用連續尺度測量出具體數值并與標準對比的檢驗,進而推斷整批產品的接收與否的檢驗。
與計數抽樣相比,計量抽樣的特點有以下幾點。
①計量抽樣檢驗的數據比計數抽樣檢驗的數據更精確地反映產品質量。
②計量抽樣檢驗雖然所需樣本量較少,但檢驗程序復雜,且單位產品檢驗費用更高,更耗時。
③當檢驗費用昂貴時,如對價值較高的產品進行破壞性檢驗時,計量抽樣檢驗具有優勢。
④計量抽樣檢驗必須針對每一個特性制訂一個抽樣計劃,隨著產品測量項目的增多,計量抽樣計劃的實施變得更為復雜。
由于計量抽樣檢驗方案的設計是基于質量特性值服從正態分布的,所以計量抽樣檢驗只適用于質量特性的測量值服從正態分布的情形。
四、質量數據統計特征的描述
抽樣的目的是通過樣本來反映總體特征。在質量管理中,常常將測試的樣本數據,通過整理加工,找出它們的特性,從而推斷總體的變化規律、趨勢和性質。例如,可以用中心傾向及數據的分散程度來表示數據的分布情況,表示中心傾向的有平均值、中位值等,表示數據分散程度的有方差、標準偏差、極差等。
1.表示樣本集中程度的特征量
(1)樣本平均值。表示n個樣本測定值為Χ1,Χ2,…,Χn,則樣本平均值為樣本中的多數數據分布在樣本均值附近,因此,樣本均值表示了樣本數據的“質量中心”,是數據高低相抵、誤差正負相抵后客觀事物必然性數量特征的一種反映。
在數學上,均值有兩個非常重要的數學性質。
①各個樣本數據與均值的離差之和為零。
②各個樣本數據與均值的離差平方和最小。
(2)樣本中位數。當樣本數據中存在極端數據時(個別數據特別大或者特別小),樣本均值不適合作為數據集中趨勢的代表,而應以樣本中位數來表示數據的集中程度。樣本中位數是將樣本數據從小到大排列后處在中間位置上的數據。當樣本容量n為奇數時,它恰為中間的一個數;當樣本容量n為偶數時它是中間兩個數據的平均值。
若記排序后的樣本測定值為x1≤x2≤…≤xn,則
在實際應用中,要根據不同的研究目的和不同的數據分布特征來選擇均值或中位數作為集中趨勢的代表值。
一般來說,當數據呈現對稱分布或近似對稱分布時,均值與中位數是一致的,此時應選擇均值作為數據集中趨勢的代表值。
但當數據分布的偏斜度較大(出現極端值情況)時,均值容易受到極端數據的影響,不能很好地反映樣本數據的集中趨勢,此時應選擇中位數作為集中趨勢的代表值。
(3)眾數。在一批數據中,出現次數最多的那個數稱為眾數,記作M0。
例如,某廠先后對本廠的某型號的一批產品的不合格數進行統計,得到如下表(表2-2)所示的數據。
表2-2 眾數
觀察表2-2,出現3個不合格品的次數最多,共有48次。故眾數M0=3。
2.表示樣本數據離散程度的特征數 表示樣本數據離散程度的特征數有極差、方差、標準差。
(1)極差。極差能正確反映數據的范圍,記為R。
若記排序后的樣本測定值為x1≤x2≤…≤xn,則
(2)方差。當樣本容量增大時,數據中出現最大或最小異常值的可能性也隨之增大,這時用樣本極差表示數據的波動程度的可靠性隨之下降。為了充分利用樣本數據,常用樣本方差來表示數據的波動。
方差是樣本數據集中所有觀測值的離差平方和的“平均值”,記為S2。
(3)標準差。由于樣本方差的綱量與原始數據的綱量不同,方差綱量是原始綱量的平方,所以在實際的應用中,常用方差的算術平方根來表示數據的波動程度,稱為樣本標準差,記為S。
3.收集質量數據的注意事項 收集質量數據時應注意以下幾個方面的問題。
(1)明確收集數據目的與方法。
(2)注意數據的修正,剔除異常數據。
(3)數據記錄要真實、可靠、準確。
(4)測定和記錄工作應標準規范。
(5)注意記錄與數據有關的數據背景,如測試時間、地點、數量、測試者、批號、名稱、規格及必要的環境條件等,這樣有利于分析問題,且可以避免不同條件的數據混淆。
4.質量變異及統計特征描述 質量變異是指同一批量的產品,即使所采用的原材料、生產工藝和操作方法都相同,但各產品的質量也不會完全相同,它們之間或多或少會有些差別,這種差別被稱為質量變異。
承認質量變異,通過找出其變異過程中的統計規律性來控制產品質量,是現代質量管理學和傳統質量管理學的重要差別。
(1)產品質量的變異性。由于在生產的過程中,工藝條件總是存在一定的變化,因此產品的質量在產品生產過程中不停地變化著,這就是產品的變異性,也稱為質量的波動性。
(2)產品質量變異的統計規律性。產品質量變異具有統計規律性。在生產正常的情況下,通過對產品質量變異大量調查與分析后,可以用概率論與數理統計的方法來精確地找出產品質量變異的幅度,以及不同大小的變異幅度出現的可能性,即找出產品質量的分布規律,這就是產品質量變異的統計規律。
在質量管理中,計量質量特性值常見的分布有正態分布等,計件質量特征值常見的分布有二項分布等,計點質量特征值常見的分布有泊松分布等。
掌握了這些統計規律的特點與性質,就可以用來控制與改進產品的質量。
(3)質量因素的分類。把影響質量的因素,稱為質量因素。根據不同的劃分標準,質量因素可以分類如下:
①按不同的來源分類。按不同來源可分為操作人員、設備、原材料、操作方法、環境、測量等。
②按影響大小與作用性質分類。
a.偶然因素,又稱為隨機因素。偶然因素具有如下特點:影響微小,對產品質量影響微小;始終存在,只要存在生產,這些因素就一定存在;逐件不同,由于偶然因素是隨機變化的,所以每件產品受到偶然因素的影響是不同的;難以除去,指偶然因素是在技術上有困難或在經濟上不允許消除的。
隨著科技的進步,有些偶然因素可以逐步得到減少和消除,但是不可能完全消除所有的偶然因素,因此偶然因素引起的質量波動是不可避免的,同時也是影響微小的。
對于偶然因素,可以忽略,不必特別處理。
b.異常因素,又稱為系統因素。異常因素有如下特點:影響較大,即對產品質量影響較大;有時存在,它是由某種原因所產生的,不是在生產過程中始終存在的;一系列產品受到同一方向的影響,指加工件質量指標受到的影響是都變大或都變小;不難除去,指這類因素在技術上不難識別和消除,而在經濟成本上往往是允許消除的。
異常因素對產品的質量影響較大,可造成產品質量過大的異常波動,以致產品質量不合格,同時它也不難加以消除。
在生產過程中異常因素是應該注意的對象。一旦發現產品質量有異常波動,就應盡快找
出其異常因素,加以排除,并采取措施使之不再出現。