- 創造價值的根因分析與問題解決之道:成為根因分析與問題解決高手
- 郭彬等
- 12字
- 2022-05-10 20:30:18
第二節 根因分析的五個方法
一、正向演繹邏輯方法
不管是文科類問題,還是理科類問題,最重要的一點是注重邏輯。嚴密的邏輯從精準把握問題開始。如果問題剛開始比較模糊或籠統,則后面的原因分析就不精準了,邏輯性也會比較差。因此,一般情況下,根因分析首先要明確問題關鍵,把問題逐步從較為籠統的大問題Y轉化成中Y,最后分解成具體的問題關鍵小Y,然后再利用Y=F(Xs)的關系分析是什么輸入因子Xs導致的問題小Y。
對問題Y進行分解的邏輯有幾種常用的分析方法,如邏輯樹、思維導圖及麥肯錫的相互獨立、完全窮盡(Mutually Exclusive Collectively Exhaustive,MECE)。其實,思維導圖是邏輯樹通過計算機軟件實現的可視化的美觀應用,而MECE是邏輯思維的指導原則。這些邏輯方法不僅適合對問題做分解和分析,也適合開放性的思維討論分析。
以上三種方法是管理及工程領域常見的問題分析方法,但也有一定局限性,在分析各個原因Xs時不能區分它們之間是“與”的關系還是“或”的關系。因此,工程領域用得比較多的是故障樹分析(Fault Tree Analysis,FTA),這是一種更具有數學思想的邏輯樹表達方法。其實FTA的思路同樣可以用于分析文科領域的問題。
邏輯樹和FTA是用演繹法分析問題,即從問題入手尋找原因,原因和問題之間有一種理論上的因果關系,原因導致問題。
用邏輯樹對問題進行原因分析的過程如下圖所示。

一般來說,針對具體問題Y(這里的具體問題Y是指前面經過層層分解的問題關鍵小Y),其直接原因不超過5個,通常是1個、2個、3個或4個。如上圖所示,針對具體問題Y有4個直接原因。這4個直接原因須滿足MECE原則,即它們之間相互獨立、互不影響,而且問題Y100%就是由X1、X2、X3和X4導致。但X1、X2、X3和X4與Y是什么關系,常規的邏輯樹或思維導圖不能清晰表達,如上圖所示可以是以下幾種情況的任意一種情況:
1)X1、X2、X3和X4中任何一個原因單獨發生都會導致Y。
2)X1、X2、X3和X4中有任何兩個同時發生會導致Y。
3)X1、X2、X3和X4中有任何三個同時發生就會導致Y。
4)X1、X2、X3和X4要同時發生才導致Y。
以上總共有15種可能的情況,即2k-1種,k是導致Y發生的直接原因總數。
雖然邏輯樹不能清晰地把Y和Xs之間的具體關系表達準確,但一般來說,某一個具體的技術問題,或者某一個管理問題,Y和因子Xs之間的關系都是一個具體的且唯一的對應關系Y=F(Xs)。
為了清楚表示X1、X2、X3和X4四個因子和問題Y之間究竟是哪一種關系,可以用FTA方法表示。比如說,X1發生,同時X2、X3、X4當中任何一個發生會導致Y。用FTA表示會是什么樣子呢?答案如下圖。“AND”是與門關系(即同時發生),“OR”是或門關系(任何一個發生),這是FTA的最基本的兩種邏輯關系。下圖只是把Y和X1、X2、X3、X4四個因子的關系用FTA表示,再往下的因子關系(如X1和X11、X12)未用FTA邏輯關系表達,仍然是邏輯樹,在此說明一下。

雖然FTA比邏輯樹能更準確地表達Y和Xs之間的關系,但不能表達Y和Xs之間究竟是什么數學關系。在尋找問題Y的根因時,數學關系不是很重要,只要找準影響Y和Xs即可。因此,FTA是進行根因分析的一個好工具。找到根因Xs后要對其進行優化,則可以根據工作原理或通過試驗得到數據進行數學模擬的方法進行優化。對于非數據型的根因Xs改進,用不著數學公式。
用邏輯樹或FTA表示原因Xs和Y之間的關系,這是演繹法。用演繹法分析有前提條件,即必須清楚Y和Xs之間的工作原理,不管是管理原理還是數理化生(指數學、物理、化學、生物)原理。一般來說,文科類問題,不同人對同一件事理或人理的Y=F(Xs)認識有差異,但要盡可能客觀地分析輸入Xs和輸出Y之間的關系。而理科類問題一般是客觀的,只要清楚問題Y和Xs之間的工作原理,不同人的分析幾乎是相同的。
一般來說用正向的演繹邏輯方法做原因進行分析,最符合邏輯,也最有效率。
案例3:某手機聽筒焊接問題
201×年某電子零部件大廠在某兩個月遇到某個型號的聽筒焊接不良率偏高的問題,做了很多試驗和數據分析都查不出原因何在。工廠內部很痛苦,因為聽筒焊接不良的報廢率從5%到20%,造成巨大經濟損失。聽筒組裝廠把責任推給銅片注塑廠,而注塑廠說憑什么把問題推給注塑廠。雙方也是不斷較勁掰手腕。
此聽筒焊接的主要制造過程如下圖所示,先由外部供應商把銅片切割成既定形狀,然后電鍍。之后由注塑廠(內部供應商)把電鍍后的銅片注塑到聽筒的塑料殼上。最后由聽筒組裝廠將揚聲器引線焊接在銅片上。

聽筒焊接后的產品示意圖如下,焊接有兩個焊點,即焊點1和焊點2。銅片的電鍍廠商有A供應商和B供應商。

針對上述質量問題,如果按照六西格瑪傳統的DMAIC思路去分析,沒有幾個月是很難分析出原因來的。這個問題用頭腦風暴和魚骨圖分析,可能的原因太多了,抓不住要點。比如用魚骨圖分析,魚頭是焊接不良,魚刺有很多,由于不知道問題出在哪個環節,要把與電鍍廠、注塑廠及組裝廠的所有4M1E的因素都進行考慮。
因此,解決問題最直接的方式是針對問題順藤摸瓜。此焊接問題的產生原因較多,且涉及材料化學、設備參數及整個生產過程等諸多因素。如果你是作為問題解決的外部顧問,應該如何利用團隊的既有資料來分析原因呢?
此時,對此問題一竅不通的你,只有通過問問題來尋找原因線索。別小看問問題,愛因斯坦有一句名言是,“提出一個問題比解決一個問題更重要”。當我們遇到問題時,只有提出正確的問題,才能夠找到問題的根源在哪里,才能最終正確地解決問題。因此,如果不能提出好的問題,就別想解決問題。請仔細品味一下這兩句,這里面的幾個問題各自指什么?!
針對這個焊接不良,可以有下面兩種詢問問題的方法,來體會和比較一下。
方法一,通過詢問遠端存在的可能問題,逐步向近端的問題靠攏。下面Q1代表問題1,A1代表答案1,以此類推。
Q1:兩個銅片電鍍供應商的焊接不良率有差別嗎?
A1:沒有。說明與不同供應商沒有關系。
Q2:兩個銅片的電鍍是在不同電鍍槽(電鍍液)中實施的嗎?
A2:是在同樣環境中電鍍的。說明與電鍍過程沒有關系。
Q3:注塑電鍍銅片有幾臺設備?
A3:有四臺不同設備。
Q4:不同設備之間注塑出來的銅片(后面簡稱“注塑銅片”)的焊接不良率有差別嗎?
A4:可能有,但暫時沒有數據,因為混在一起焊接的。說明需要排查焊接不良是否與不同的注塑設備有關。這也是聽筒組裝廠懷疑注塑廠的理由之一。
Q5:焊接不良是一直都存在的問題呢,還是只是某些批次存在的問題?
A5:自7月份以來,焊接不良率為3%~10%,偶爾高達20%。注塑銅片焊接質量有較大差異,有的整包都是好的,有的不良率很高。注塑銅片是按包來包裝好的,每包200件。這說明不同包的注塑銅片有質量差異,可能與答案A4所講的不同注塑設備有關,因為注塑后就是按包分裝好的。
Q6:注塑不良的銅片與注塑合格的銅片有什么差別嗎?
A6:這個差別沒有測試過,但是之前團隊取焊接有問題的注塑銅片做測試,并與標準比較,發現某個元素S超標了。這個測試有必要,但只能說明元素S超標可能是導致焊接不良的原因。但比較方法不對,因為有可能焊接質量合格的注塑銅片的元素S也超標。如果要用正確的比較分析方法,應該用BoB/WoW方法,具體可以參見《世界級質量管理工具》或作者之前寫的《創造價值的質量管理》中介紹的方法。
Q7:這些不良的注塑銅片產品是否與儲存時間相關?
A7:7月份后的焊接產品確實是在倉庫里儲存超過一個月的注塑銅片產品,而之前沒有遇到這樣的焊接質量問題。說明焊接不良可能與儲存環境導致的問題有關系。
Q8:焊接不良與不同的焊接設備有關系嗎?
A8:沒有,3條生產線的焊接設備都有焊接不良。說明焊接不良與焊接設備沒有關系。
Q9:聽筒的兩個焊點都是差不多的焊接不良率嗎?
A9:不是,焊接不良只有第一個焊點的,第二個焊點的質量都是好的。說明焊接不良與焊點位置有密切關系。
Q10:把容易造成焊接不良的焊點1交換到焊接設備的焊頭2焊接,把焊點2交換到焊接設備的焊頭1焊接,比較不良率是否有變化?
A10:因為產品焊點1、2位置形狀固定,兩個焊頭也固定在設備上,不便做上述的交換試驗。但曾經用十來個產品人為調換位置做試驗,發現焊點1換到焊頭2后仍然容易產生不良;焊點2換到焊頭1后仍然沒有發現不良。說明與焊接設備的兩個焊頭沒有關系,焊接不良與產品的兩個焊點位置有關。
Q11:焊點位置差異難道是因為注塑銅片質量與注塑的結構位置相關嗎?
A11:兩個銅片在注塑件上有結構差異,可能因為注塑過程的排氣等差異導致位于焊點1的銅片容易有臟污,因而導致焊接不良。
Q12:除了注塑件結構的微小差異,其他都是同樣材質或過程:兩個銅片是同樣的材質,同樣的電鍍過程,同樣的注塑過程,同樣的貯存環境,同樣的焊接操作人員,同樣的焊接設備。但一個焊點有問題,一個焊點沒有問題,難道兩個銅片上的兩根焊線不同嗎?
A12:應該是一樣的,外觀上看兩根焊線是一樣的。后來經技術確認,兩根線確實不同,一根焊線是錦絲線,另一根是電纜(cable)線。說明兩根焊線的材質不同是觸發兩個焊點質量差異的一個原因。
Q13:兩根焊線在期間有變更嗎?焊線質量在焊接質量問題發生前后有差異嗎?
A13:沒有變更,也沒有差異。
Q14:經過上述十三個問題,以及對問題的確認,可以初步確定的是,一、兩個焊點的焊線不同是導致兩個焊點質量差異的原因之一;二、經過倉儲一段時間的銅片質量不滿足要求;三、這兩個條件疊加在一起導致在某個時間點后的焊點1的焊接質量出現問題,而焊點2的質量暫時良好。因此,需要確認這個時間點前后的注塑銅片的材質質量是否有變化?
A14:把有問題批次的注塑銅片與沒有問題批次的注塑銅片送到化學試驗室,由兩個材料學博士對材質進行化學成分剖析、測試和分析,發現那些儲存時間比較久的有焊接質量問題批次的注塑銅片被氧化了,被氧化后的銅片在焊接性能上的質量降低,當焊接到不同焊接性能的錦絲線和電纜(cable)線就表現出明顯質量差異。原因到此被找到并確認。
上面詢問問題的方法是由遠及近的方法,類似六西格瑪的分析思路,從產品的原材料的源頭開始追溯,到中間注塑過程,再到存儲和焊接等全過程。但它又比傳統的六西格瑪方法直接,因為都是基于最終焊接問題在層層推理,應用的是演繹邏輯推理方法。
方法二,從問題的核心往外層打開,由近及遠的方式詢問問題并推理,比由遠及近的推理更直接,更貼近問題本質,可以少走彎路。當然,前提條件是對每個問題都可以通過相關事實、數據或測試、試驗等手段給出正確的答案。下面是第二種方法的一問一答。
Q1:聽筒的兩個焊點的焊接不良率有差異嗎?
A1:有差異,且是0和1的差異。焊接不良只存在于焊點1這個焊接位置,焊點2沒有焊接不良。說明焊接不良與這兩個焊接位置有密切關系。
Q2:把焊接不良較高的焊點1交換到焊接設備的焊頭2焊接,把沒有不良的焊點2交換到焊接設備的焊頭1焊接,不良率是否有變化?
A2:因為產品焊點1、2位置形狀固定,兩個焊頭也固定在設備上,不便做上述的交換試驗。但曾經用十來個產品人為調換位置做試驗,發現焊點1換到焊頭2后仍然容易產生不良;焊點2換到焊頭1后仍然沒有發現不良。說明與焊接設備的兩個焊頭沒有關系,焊接不良與產品的兩個焊點位置有關。
Q3:焊接不良與不同的焊接設備有關系嗎?
A3:沒有,3條生產線的焊接設備都有焊接不良。說明焊接不良與焊接設備沒有關系。
Q4:兩個焊點的焊接材料是一樣的嗎?
A4:兩個焊點的銅片幾乎一樣,除了注塑位置不同。兩根焊線雖然外觀看起來一樣,但經與技術確認,一根焊線是錦絲線,另一根是電纜(cable)線。說明兩根焊線的材質不同觸發兩個焊點質量差異。
Q5:焊接不良是一直都存在的問題呢,還是只是某些批次有問題?
A5:自7月份以來,焊接不良率為3%~10%,偶爾高達20%。注塑銅片焊接質量有較大差異,有的整包都是好的,有的不良率很高。注塑銅片是按包來包裝好的,每包200件。結合上面A4所講的,說明焊接不良與兩個因素有關。其中一個是不同材質的焊線,這是導火索,是誘發原因;另一個是7月份以來使用的注塑銅片與之前不一樣,這是問題的直接原因。
Q6:那么7月份以來,焊接合格率近100%的與不良率較高的注塑銅片有什么區別呢?
A6:區別在于焊接不良率較高的注塑銅片是貯存超過1個月的庫存品,而庫存時間短或當天注塑的銅片在焊接后沒有焊接不良。
Q7:經過上述六個問題,以及對問題的確認,可以初步確定的是,一、兩個焊點的焊線不同是導致兩個焊點質量差異的原因之一;二、經過倉儲一段時間的銅片質量惡化;三、這兩個條件疊加在一起導致在某個時間點后的焊點1(揚聲器引線1)的焊接質量出現問題,而焊點2(揚聲器引線2)的焊接質量暫時良好。因此,需要確認這個時間點前后的注塑銅片的材質質量是否有變化?
A7:把有問題批次的注塑銅片與沒有問題批次的注塑銅片送到化學試驗室,由兩個材料學博士對材質進行化學成分剖析、測試和分析,發現那些儲存時間比較久的有焊接質量問題批次的注塑銅片被氧化了,被氧化后的銅片在焊接性能上的質量降低,當焊接到不同焊接性能的錦絲線和電纜(cable)線就表現出明顯質量差異。原因到此被找到并確認。
此案例的焊接問題有兩個原因:貯存環境(溫度、濕度和時間的綜合作用)導致注塑銅片被氧化,焊接性能質量下降,這是原發性原因;不同材質焊接線(錦絲線和電纜線)的焊接能力不一樣,這是導致問題的誘發性原因。
針對同一個問題的根因分析,作者用了兩種不同的邏輯方法來詢問,目的是為了讓大家對比兩種邏輯推理方式的優劣。顯然第二種更具優勢。詢問從問題的核心著手,更為直接、精簡、高效。第二種邏輯推理是較為徹底的演繹法,應用FTA的根因分析思路,從頂事件(是FTA中的名詞,就是根因分析的分析對象,即前面說的問題關鍵小Y)逐步向相關的原因展開,少走彎路。
第一種詢問方法是通過可能的因子逐步逼近到頂事件,從下到上,不容易把握從底端的什么層級、什么角度、什么因子開始來逐步逼近頂事件。
下面用FTA方法對此焊接不良的問題做個梳理,并且把上面的第二種詢問方法的問題號標記在相應的輸入因子Xs旁邊,如下圖所示。可以看出,第二種詢問方法基本上是沿著FTA的分析思路在詢問問題,這樣的效率很高,且更容易命中靶心。而第一種詢問方法類似從FTA的低端因素分析和詢問問題,這樣的效率低下,搞不好甚至迷失方向,脫離靶心。

從上面FTA示意圖可以直觀地看出,發生焊接不良的原因有兩個:一是焊接位置相關的揚聲器引線,二是貯存時間較長的注塑銅片。最根本的原因是注塑銅片的在正常環境下貯存時間較長。再做深入分析的話,就涉及管理體系的原因了,如敏感元器件的性能特性辨識、貯存環境標準、貯存的定期監控管理等。
上述內容用Office軟件做FTA很麻煩,特別是稍微復雜的問題。有條件的可以用相關軟件做輔助,如下圖就是用可靠性分析工具ITEM軟件所做的分析。該軟件不僅方便畫FTA中的故障樹,而且還可以自動求出最小割集,以及對頂事件的可靠性預計等功能。我用ITEM軟件對一個稍微復雜的問題進行根因分析的案例,放在本書附錄,有興趣的讀者可以進一步閱讀。

從FTA示意圖看出,揚聲器引線和注塑銅片變質屬于與門事件,即兩個同時發生才會導致焊接不良。其實揚聲器引線本身沒有質量問題,只是因為材質不同導致焊接性能不同,屬于誘發原因,也可以叫作次要原因(secondary cause)。而注塑銅片確實因為儲存一段時間后被氧化而質量退化,屬于原發性原因,也可以叫作主要原因(primary cause)。FTA圖中有個六邊形,是表示在“常規倉貯環境”這個前提條件下,貯存時間較長會導致存放的環境不滿足質量要求。
雖然FTA比常規的邏輯樹包含更豐富的信息,但因子之間的交互作用在圖中也不能清晰表達。比如這個揚聲器引線有兩種:一個是錦絲線,一個是電纜(cable)線。當注塑銅片質量正常時,焊接質量都合格;但當注塑銅片出現氧化后,焊點2處的揚聲器引線的焊接質量雖然有下降,但下降幅度很低,仍在合格范圍。但焊點1處的揚聲器引線的焊接質量下降較多,且變成不合格。這個變化過程如下圖所示,焊點1處的揚聲器引線和焊點2處的揚聲器引線在銅片質量由合格變為不合格時,焊接質量變化速率不一樣,因此兩條線相交,不同焊點揚聲器引線和銅片質量就存在交互作用。相交的角度越大,交互作用越強。交互作用這個概念是由1920年英國統計學大師費歇爾(R.A.Fisher)從他發明的DOE方法里提煉出來的。

導致問題的不同因子之間存在的交互作用,是進行根因分析時需要注意的。舉個生活中的例子說明一下交互作用,比如某個帥哥,很多美女鄰居都說他對人熱情,愿意助人為樂;但公司很多同事說他工作上拈輕怕重,不愿承擔責任。你看,對同一個人,不同人的評價相差懸殊。這其中就有交互作用,這位帥哥在非工作場合的美女面前表現出熱心、和善的一面,但在工作場合表現出消極的一面。這是方向有點相反的交互作用。上面案例中兩個位置的揚聲器引線在銅片質量不同的情況下表現出同樣方向的質量趨勢,但是變化速率不一樣。再拿日常工作舉例子,如周末加班,白天聽著電視聲音寫文件每小時可以寫800字,不聽電視聲音安靜寫文件每小時可以寫1000字;但晚上聽著電視聲音寫文件每小時可以寫900字,不聽電視聲音安靜寫文件每小時可以寫1300字。這說明晚上安靜寫文件速度的提升高于白天的提升,這有明顯的交互作用。交互作用可以用DOE方法來分析和解釋,大家可以參閱相應專業書籍。