容錯,讓數位化關鍵應用程式“永遠在線”

專訪美國容錯(Stratus)技術有限公司大中華區總經理余秀琍

隨著工業 4.0 時代的到來,數位化、智慧化已經成為各個行業的發展趨勢,越來越多的數位化系統在企業的生產經營中承擔起更加關鍵的作用。特別是 IT 和 OT 不斷融合,企業對 IT 基礎設施的依賴越來越高,因此企業非常重視關鍵應用程式的“故障預防”能力和強調資料的完整性。

那如何保證這些基礎設施的高可靠性使得數位化關鍵應用程式“Always-on”,最大程度減少系統的停機成本呢?CONTROL ENGINEERING China 為此專門採訪了長期致力於打造更高可用性解決方案的硬體廠商,美國容錯(Stratus)技術有限公司的大中華區總經理余秀琍女士,請她來談談數位化時代如何保證系統的高可用性。

容錯,是一家公司也是一項技術

容錯,其實是一項 IT 技術,是指一個系統容納錯誤的能力。它和工業上常見的“冗餘”技術類似,都是提高系統可靠性的方法。

但容錯和冗餘的實現原理卻並不相同,冗餘是通過同時運行兩台一模一樣的設備,當一台出現問題的時候切換到另一台設備上,儘管切換時間能做到毫秒級,但還是存在一定的延時。而採用容錯技術的話,是容許系統出現一定的故障或者錯誤,系統會自動以某種方式彌補錯誤,不存在切換時間。所以兩者雖然很接近,但實際上有著本質的區別。

容錯技術起初是應用在證券、電信等關鍵領域,進入 21 世紀後,容錯技術開始進入製造業、能源、物流、交通及有著“7×24”不間斷營運需求的行業。

其實提到容錯技術,就不得不提到一家公司 – 美國 Stratus 公司。Stratus 公司不僅是最早提供容錯技術的廠商之一,二期也是容錯技術領域的全球標準制定者和技術領先者,可以說 Stratus 就是容錯伺服器的代名詞。為此,Stratus 公司的中文名稱就直接被稱作了美國容錯公司。

從 99.99% 到 99.999%,不僅僅是差一點

對於一個 IT 系統來說,可用性是衡量其運行水準和可靠性的重要指標。對於可用性等級,通常用幾個“9”來劃分。如果一個系統在 99% 的時間內都是可用的(2 個 9 水準),那就意味著它在 1% 的時間內是不可用的,那麼您可以預測到“2 個 9 水準”的系統一年會有不超過 88 小時處於停機狀態。如果是 99.99% 的可用性,那就意味著一年的停機時間不會超過 53 分鐘,這樣的系統可以稱為“高可用性”系統。

而如果系統的可用性達到 99.999%,也就是 5 個 9 的水準,那一年的停機時間不會超過 5 分鐘,這時就可稱之為“容錯”系統。

一般的商用或者工業伺服器,大致可以做到 3 個 9 或者 4 個 9 的可用性,但是要達到 5 個 9 的水準是非常困難的,而我們的容錯技術可以達到 5 個 9 以上的水準,這是因為我們 40 多年來積累了大量經驗和專利技術,這一點也是其他公司不可比擬的。”余秀琍表示“儘管只提高了 0.009 個點可用性,但對於越來越重要的關鍵 IT 基礎設施來說,任何細微的停機時間的代價可能就是非常昂貴的。”

不同的容錯方式滿足不同的應用需求

自上世紀 80 年代,第一代容錯技術開始進入應用領域,美國 Stratus 公司就以獨特的硬體級容錯技術佔領了主要的市場份額。如今,美國 Stratus 公司已經具備硬體容錯和軟體容錯等多種解決方案,為客戶提供多樣的服務。

Stratus ftServer 是 Stratus 公司的硬體容錯產品,可以為各種關鍵業務處理器和資料密集型應用程式,包括高級 SCADA、MES、SCM、AI 和 ML 等系統提供最高等級的可用性。ftServer 採用專用同步晶片設計,實現 CPU、晶片組、記憶體、PCI 匯流排、SAS 匯流排等幾乎全部配件的冗餘,可以保證在任何硬體損壞的情況下,伺服器不間斷運行。

對此,余秀琍表示,“ftServer 是一個全面整合的持續可用平臺,幫助企業實現收入、品質和生產力的最大化。沒有計劃外的停機時間,無資料損壞或資料丟失,而且部署起來非常簡單,無需修改軟體應用程式或編寫容錯移轉腳本。”

對於資料儲存,Stratus 提供 ftScalable 容錯儲存系統,ftScalable 配合 ftServer 組成一個系統,可為企業的資料中心等 IT 基礎設施提供真正高靠性的應用方案。

而對於一些不使用 ftServer 伺服器的使用者,Stratus 可以用軟體容錯的方式幫助使用者打造一個容錯系統。“everRun 是一個高度通用且價格合理的持續可用性軟體解決方案,它與行業標準的 x86 系統相結合,可快速、輕鬆地保護您的虛擬化工作負載和資料。”余秀琍介紹說。

ztC Edge – 邊緣計算的容錯解決方案

為了實現更高效、安全的卓越營運,在工業系統中,越來越多的計算在資料收集和分析的實際位置附近進行,而不是在集中式伺服器或雲中進行。邊緣計算成為實現營運方式數位化轉型的領先方法。

據 Gartner 分析,目前 91% 的資料是在集中化的資料中心產生和處理的,而到 2022 年,約有 75% 的資料需要在邊緣進行分析並採取措施。為此,Stratus 推出了邊緣計算的容錯解決方案 ztC Edge。

“Stratus ztC Edge 是一款安全、耐用、高度自動化的邊緣計算平臺,可以快速、可靠且高效地實現業務關鍵性工業應用。借助內建虛擬化、自動重啟和資料保護、自動本地恢復、簡化安全操作,以及基於雲的系統運行情況監測和託管支援服務,企業可以提高效率,降低對 IT 的依賴,同時最大程度降低現場機器設備的停機風險。”余秀琍介紹說。

不同於 IPC 和 IT 伺服器,ztC Edge 更適合作為一個邊緣計算伺服器使用,比如部署到 OEM 機器裡面,使其成為一台智慧的機器。IPC 雖然適合工業等級,但不提供任何冗餘,這意味著不得不定期手動干預機器和客戶的操作。而傳統 IT 伺服器不適合工業等級,需要放置在環境較好的位置,如伺服器室,這不利於智慧製造。

ztC Edge 在硬體設計上是非常特殊的,用的是一款無風扇的,並且是純固態的硬體設計,十分輕便且堅固耐用,適合在工業現場惡劣的工況環境下使用。利用 ztC Edge 雙節點的解決方案,可以構建一個更加穩定、可靠、安全的冗餘系統。

余秀琍強調,ztC Edge 同時也是一個高度自動化的平臺,工程師能夠在 30 分鐘內為智慧型機器部署冗餘 SCADA/HMI 系統,快速、輕鬆、可靠地提供工業物聯網和控制應用程式。

容錯,讓數位化關鍵應用“Always-on”

成立於 1980 年的美國 Stratus 公司,在上世紀 90 年代就進入了中國市場,其產品在國內的通信、金融、醫療、市政、交通以及製造業都有了廣泛的應用。

據余秀琍介紹,在國內某大型鋼鐵公司,容錯的 ftServer 幾乎成為了他們二級系統的伺服器標配,保證了鋼鐵廠最重要的二級系統連續線上運行。在製藥行業,如信達生物製藥、上海天偉生物製藥等,ftServer 保證了製藥產線的連續可靠性。在水處理行業,比如九溪水廠、上海迪士尼水處理系統等,也都在用 ftServer 線上收集資料進行即時監控。

“隨著國內所有行業都朝著高、精、尖的方向發展,我們的產品應用的範圍越來越廣,不僅在傳統的通信、金融和製造行業,而且在新興的電商物流、智慧樓宇和智慧城市等領域都有了應用。”余秀琍表示,除了一些關鍵應用程式,一些客戶為了保證系統的“Always-on”,甚至在自己的 OA 系統、郵件系統、呼叫中心等數位化應用上都用上了容錯的產品。

之所以能夠取得如此廣泛地應用,其實和 Stratus 公司一貫的開放的合作生態分不開的。Stratus 一直以來不僅有管道合作夥伴、OEM 合作夥伴,而且還十分注重與解決方案構建商、系統整合商建立廣泛的合作關係。在中國,Stratus 一直擁有強有力的管道合作夥伴,而羅克韋爾自動化、施耐德電氣等 OT 大廠則是其全球戰略合作夥伴。在今天這個不間斷營運的全球經濟中,幾秒鐘很重要。關鍵業務應用程式的停頓會產生深遠的經濟、安全和法律後果。從故障中恢復,無論多快,都不再是一個選項。我們可以篤信,容錯技術將在越來越數位化的關鍵業務領域發揮重要作用,而容錯公司,憑藉其全球領先的容錯技術,可以讓這些數位化關鍵應用程式“Always-on”。

文章來源:http://article.cechina.cn/21/1122/03/20211122035244.htm