半夏小說

重生一年,家裡資產破億_第961章 課程表雲的試運營(2)

關燈

主要是在設計峰值容量下,驗收GPU任務調度延遲是否<10s,CUDA應用能是否有明顯衰減,在極限7*24小時長穩測下是否有GPU、CPU宕機況,有沒有驅崩潰。

要不是在這塊花費了太多時間,其實蔣玉寧早就回申城了。

又不擅長跟地方政府打道,再加上現場還有很多在跟蹤採訪報道。

時間在所有人的屏息注視中一點點流逝。

一個半小時後,所有故障恢復完,業務全量續跑驗證通過。

最終結果:RTO≤1.5小時,RPO≤30分鐘。

這個數據意味着,哪怕出現極端的機房全故障,課程表雲也能在1個半小時業務恢復,僅丟失最多30分鐘的計算結果,不僅遠超國標四級災備的要求,甚至到了五級異地災備的標準線。

要知道國標是國標,真正商用時,行業對外的可用SLA承諾普遍是99.9%,對應全年累計不可用時間不超過8.76小時。

而這次課程表單次故障2小時恢復的能力,已經遠超行業通用標準了。

同時只丟了30分鐘的計算結果,這個預期也高於國際標準。

蔣玉寧對這些數據倒是早有預料。

畢竟之前很多企業都是採用CPU服務集群,課程表算是全球第一個以GPU集群為核心架構、大規模落地雲服務的企業。

ADUC

5UPC%02UPG使

UPGUPC

poT

便

使