軟錯(cuò)誤是指RAM或FF中非由硬錯(cuò)誤引起的位翻轉(zhuǎn),因此在斷電再重啟后會(huì)消失。以前,軟錯(cuò)誤在很大程度上被忽略了,可靠性預(yù)測(cè)主要集中在硬錯(cuò)誤上,但在IEC 61508-2:2010提到軟錯(cuò)誤后,人們?cè)僖膊荒芎雎攒涘e(cuò)誤了。這是好現(xiàn)象,因?yàn)樵谟泻艽驲AM的器件中,軟錯(cuò)誤率可能輕而易舉地比硬錯(cuò)誤率高出三個(gè)數(shù)量級(jí)。另一方面,器件即使沒(méi)有RAM,也可能存在大量FF,因此每個(gè)器件都會(huì)有一定程度的軟錯(cuò)誤。甚至模擬電路(例如使用開(kāi)關(guān)電容架構(gòu)的那些電路)也可能發(fā)生軟錯(cuò)誤,但考慮到問(wèn)題的相對(duì)規(guī)模,這個(gè)問(wèn)題在很大程度上被忽略了。
軟錯(cuò)誤主要是由封裝材料中的α粒子和源于銀河系的中子引起的。在地面高度,二者的貢獻(xiàn)大致相同。α粒子不能深深地滲透到硅中,但它們來(lái)自芯片頂部,因此難以屏蔽,不過(guò)有文獻(xiàn)表明,聚酰胺可以幫助解決這個(gè)問(wèn)題。另一方面,不使用幾米厚的水泥或鉛的話,很難屏蔽中子。因此,需要在CMOS器件層次、IC上的模塊層次、IC上的系統(tǒng)層次或高級(jí)系統(tǒng)層次采取措施予以解決。
如果您沒(méi)有更好的信息,可以使用IEC 61508-7:2010第7部分倡導(dǎo)的值——1000 FIT/兆位。廣泛接受的Siemens SN29500系列標(biāo)準(zhǔn)倡導(dǎo)的值是1200 FIT/兆位。實(shí)際上,1000 FIT/兆位已被廣為接受。最佳方案是測(cè)試每個(gè)IC,但這仍然不是沒(méi)有爭(zhēng)議,因?yàn)槟銜?huì)遇到與典型器件中使用的許多不同類(lèi)型FF相關(guān)的問(wèn)題,與加速測(cè)試和山頂測(cè)試相關(guān)的問(wèn)題,以及關(guān)于AVF(架構(gòu)漏洞因子)的討論,許多軟錯(cuò)誤可能永遠(yuǎn)不會(huì)傳播出去造成系統(tǒng)故障。

在CMOS器件層次,您可以使用加固器件(三阱、SOI、額外電容),但處理軟件錯(cuò)誤最常見(jiàn)的方法是在硅模塊層次給RAM增加奇偶校驗(yàn)或ECC。奇偶校驗(yàn)位檢測(cè)受保護(hù)的字節(jié)或字中是否有一位發(fā)生翻轉(zhuǎn)。但是,它無(wú)法檢測(cè)兩位翻轉(zhuǎn)的情況。如果奇偶校驗(yàn)與邏輯連續(xù)位物理分隔相結(jié)合,就可以解決這個(gè)問(wèn)題,因?yàn)橐粋€(gè)粒子不再能翻轉(zhuǎn)同一個(gè)字中的兩位。另一方面,ECC通常可以檢測(cè)所有一位、兩位錯(cuò)誤和大部分更多位錯(cuò)誤。ECC優(yōu)于奇偶校驗(yàn)的一大優(yōu)勢(shì)實(shí)際上是它可以從一位錯(cuò)誤中恢復(fù)而無(wú)需干預(yù)。對(duì)于奇偶校驗(yàn)錯(cuò)誤,通常需要重啟系統(tǒng)才能清除錯(cuò)誤,但這取決于最終應(yīng)用。如果ECC或奇偶校驗(yàn)不可用,應(yīng)用設(shè)計(jì)人員仍能解決軟錯(cuò)誤,方法是將關(guān)鍵值存儲(chǔ)在兩個(gè)存儲(chǔ)器位置,使用之前比較這兩個(gè)結(jié)果。然而,這往往會(huì)擾亂應(yīng)用代碼。其他方案包括使用雙通道系統(tǒng)進(jìn)行比較。這有點(diǎn)類(lèi)似于ISO 13849中的典型CAT 3或CAT 4架構(gòu)。雙核同步架構(gòu)具有類(lèi)似的優(yōu)點(diǎn)。

諸如ADI的ADSP-CM417F等器件有助于實(shí)現(xiàn)上述幾種解決方案。片內(nèi)RAM具有ECC和物理分隔,RAM由多個(gè)獨(dú)立的32k模塊組成,其包含兩個(gè)核心,可提供充分的隔離。而AD7124(24位Σ-Δ ADC)之類(lèi)的器件包含一個(gè)片內(nèi)狀態(tài)機(jī),它在配置狀態(tài)結(jié)束時(shí)會(huì)存儲(chǔ)一個(gè)標(biāo)準(zhǔn)CRC,然后狀態(tài)機(jī)以不到500uS的間隔重新計(jì)算CRC,檢查是否有任何配置位翻轉(zhuǎn)。這兩者還說(shuō)明了安全數(shù)據(jù)手冊(cè)的價(jià)值,最終用戶可以獲得額外信息以幫助進(jìn)行安全分析,例如:關(guān)于RAM中邏輯連續(xù)位的物理分隔的信息;RAM不是作為一個(gè)大模塊實(shí)現(xiàn)的,而是作為幾個(gè)較小模塊實(shí)現(xiàn)的......

近來(lái)最著名的軟錯(cuò)誤案例來(lái)自汽車(chē),人們質(zhì)疑一位翻轉(zhuǎn)便可能導(dǎo)致意外加速。其他案例包括投票機(jī)錯(cuò)誤和變電站關(guān)閉。
-
存儲(chǔ)器
+關(guān)注
關(guān)注
39文章
7753瀏覽量
172148 -
RAM
+關(guān)注
關(guān)注
8文章
1400瀏覽量
120964 -
CMOS器件
+關(guān)注
關(guān)注
0文章
75瀏覽量
12166
原文標(biāo)題:【工程師博客】總被忽視的軟錯(cuò)誤詳析
文章出處:【微信號(hào):motorcontrol365,微信公眾號(hào):電機(jī)控制設(shè)計(jì)加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
詳析示波器的使用方法和步驟
選購(gòu)電視易被忽視的參數(shù)
人機(jī)交互:一個(gè)被忽視的重要領(lǐng)域
監(jiān)控系統(tǒng)設(shè)備構(gòu)成的分層次結(jié)構(gòu)詳析
PCB優(yōu)化設(shè)計(jì)詳析(中)
繼電保護(hù)中常被忽視的問(wèn)題
被忽視已久的新能源發(fā)電殺手
基于不變量的軟錯(cuò)誤檢測(cè)方法
8位單片機(jī)中那個(gè)溢出問(wèn)題最容易被忽視
最容易被忽視的儲(chǔ)能逆變器參數(shù)這里全寫(xiě)了
容易被忽視的五款辦公軟件,用對(duì)一個(gè)就效率翻倍
電平匹配問(wèn)題,簡(jiǎn)單卻容易被忽視
總被忽視的軟錯(cuò)誤詳析
評(píng)論