睿地可靠度論壇（TW-REDI Forum）

標題: 20200211_群組有關可靠度指數分佈失效率的對話 [打印本頁]

作者: hlperng 時間: 2020-2-12 09:07:35 標題: 20200211_群組有關可靠度指數分佈失效率的對話

本帖最後由 hlperng 於 2020-2-12 09:31 編輯

2020-02-11 CRE 聯誼會 Line 群組的一段對話：

不好意思, 想請教大家一個觀念, 這是在 wiki 上所說的.--->由於指數分配是無記憶性的，
指數函數的一個重要特徵是無記憶性（Memoryless Property，又稱遺失記憶性）。這表示如果一個隨機變量呈指數分布，假設我們規定3年的板子要做更換，要看換完板子後是否還能撐一年, 它在一年後失效的機率，跟我們不換板子，它在一年後失效的機率是一樣的。

http://reliawiki.org/index.php/Preventive_Maintenance

這觀念看起來是對的, 因為是隨機失效, 但是我一直覺得很奇怪, 一個東西明明已經使用了 3 年, 然後說再使用一年的失效率跟新品一樣。

隨機失效一般是指功能特性，不會老化、彼此獨立，在此假設下，可以採用指數分布描述此一失效時間行為。
物品除了功能特性之外，還有實體（或物理）特性。物理特性會隨時間老化、彼此也有某些程度上的相關性。
可靠度的嚴謹定義是功能失效，假設實體是好的。
解決問題要先從理想狀況下手，當然現實問題必須考慮系統與介面的議題，所以評估結果通常不是百分之百確定，必須保留樣本與模型的不確定性，這是統計評估的信心議題 (confidence level)。

我們要區分好失效機率: Probability of failure (1- Reliability)
失效率: Failure Rate。

假設我們要看一塊 PCBA 是否需要維護或更換, 是要用預估的失效機率還是失效率。

所以一個東西使用了 3 年, 再使用一年後的失效率的確可能跟新品一樣 (指數分布)，不過失效機率應該不會一樣。
我會說是失效機率。

是的, 失效機率是有累積的概念, 而失效率是瞬時的概念。

失效機率 x 樣本數 = 失效數
失效率是失效機率 (或失效數) 對時間一次微分，亦即時間變率 (速度)。
這個案例可以計算一下，會有親身體會感覺。

那麼 wiki 上面所說的, 他用條件機率的方式來解釋, 說第三年活到第四年跟新品或一年的機率一樣, 跟我們現在所說的要用累積的失效機率來看有衝突。

沒有衝突，因為隨機失效的假設前提是不考慮物品的機構、結構部分本質上會老化的問題。現實世界，東西不用，累積久了一定會老化變壞。

我了解失效率跟失效機率以及計算上的差異, 只是看到 wiki 上這個說明感覺很困惑, 看起來說的都對, 但是跟認知上又有落差。

只考慮隨機失效，可以用接力賽跑比擬，在每一棒正堂體能下表現跑步速度的累積。

wiki 百科是人寫的，目前願意參與撰寫的專業人士不多。
系統操作與維護階段，是不會考慮個別物品的價值，累了就換下來休息，壞了就淘汰換新的，只要系統維持好的是終極目標。
基於這樣的思維，所以可以採用隨機失效數學模型處理與解釋問題。
有了理想架設狀況的初步答案之後，當然還是要回到現實面思考。

但是目前大部分預估。
可靠度的前提都是用隨機失效。
我們是想用理想的預估去建立一個汰舊換新的基準。

假如預估結果滿意，當然可以。
隨機失效只是為了可以繼續走下去的前提假設。可靠度是一項工程工作，沒有結束的時候。
基層靠實力、高層靠關係、出門靠運氣。
只是現在困惑的是用失效率去作為基準的話, 有沒有汰舊換新度沒差, 當然前提是這個東西符合指數分布, 但是用失效機率去作為基準的話, 就會隨時間增加而增加, 就會有在某一年需要更換的基準。
有了失效率，所以知道時間累積一定有東西會壞(失效)，當然要準備備品因應，維持系統正持運作。指數失效是最簡單的數學公式，也還算合理。所以利用指數分布的常數失效率參數，乘上時間計算失效數量，做為準備備品數量的依據。
當然也可以假設非常數失效率，只是計算公式太複雜，一般行政或是非可靠度專業同仁願意不願意等，或是相信不相信你計算出來結果，那是可靠度工程的自信心和公司文化的問題。
機率的問題是每個人都很有自信把握自己永遠是對的，但是永遠質疑不相信別人的結果。
所以最後只有官大學問大，解決現實的工程專業議題。

我們加一點工程思維
「物」
如果最終產品是
1. 那一塊 PCBA
2. PCBA 只是零件
在第一種情形可以排除
因為換新品與原三年舊品
都屬於 PCBA 原設計 PCBA 的 Lambda 0 指數分佈的 MTBF
討論的是三年為何要更換？
是隨機失效？累積數很多嗎？
還是只有三年壽命就零件老化？
第二種情形是基於第一種情境 PCBA 三年更換的背後原因之下，產生為兩組次群組
A. 出廠新品
B. 出場三年 PCBA 更換後 Rework
這是兩個群組其往後壽命分析的行為要分開分析，在回推其差異。

考慮的是 PCBA 電子零件一般可靠度都比機構件和 display 高出許多, 所以一般市售的消費性電子產品可退大部分都不是因為PCBA, 而是因為外觀瑕疵, 或是螢幕問題, 所以要評估該退回的 PCBA 是否可以在更換外觀件後繼續使用。

2-3, 3-4 的失效率在指數分布下一樣, 但是以失效機率去算的話會是一個產品活到第三年, 或活到第四年的失效機率, 那就不一樣了 F(t)=EXP(-lamda*t), 所以一個 t 會帶 3, 一個 t 會帶 4?

修好之後可靠度恢復 100 %，然後隨時間指數衰減。
t 都是帶 1，操作時間只有一年。
老化的部分要外掛。

是阿，但是這種情況t也都是帶 1?

但是只有換外觀件, PCBA 繼續使用, 是沒有做任何重工處理。
應該是韌體更新要淘汰舊板為多，很少壽命只有三年。

其實指數無記憶性質最適合應用於現實的情境是在探討一些純機率問題下的情境。
例如：棒球
如果已經知道一打擊手平均來說有兩成打擊率下，那麼前面他已經揮棒落空 4 次了，我們直覺上會合理期待他第五次揮棒能成功擊出，但數學理性上來講，這第五次還是等同第一次揮棒一樣只能以 1/5 的機率去期待，不能因為他前面輸很多次了所以覺得他下一次成功機率會大幅增加。
因此，為了描述這種不管你前面幹了多少次，其實你當下要決策接下來可能發生的機率還是一模一樣，就有了這個無記憶性質的數學描述。
上述例子屬几何分布的無記憶性質,而几何分布屬離散型RV，處理離散性實務問題，指數分布則屬屬連續型 RV，處理連續性的資料問題。
至於實務上老化的電子機器，應該按電子專業決定用幾年屬老化機子，重新定義資料範圍內屬新母體，再由指數分布計算資料。
例如：公司有批用了 5 年 - 8 年的機子定義為老化機，其故障率已統計得知，那就已這 5 年 - 8 年的 data 當新母體去算指數分布機率做為決策。
至於決策風險，則由計算型一型二誤差來做合理評估..
至於如何用專業去切割母體做為新的分析基礎，必須利用業界常見的檢視資料間是否有差異的手段，來做為如何切出新母體。
如上例：
應該判斷 5 - 8 年機為老化機還是2年以上就是老化機？要靠分析資料是否有差異來決定正確的切割點。

歡迎光臨睿地可靠度論壇（TW-REDI Forum） (http://60-251-32-214.hinet-ip.hinet.net/)