Gmail 和 Google Drive 上星期出現問題,不少用戶無法寄出附件和下載檔案。 Google 日前正式公布事故詳細原因。
據 Google 表示,事故是在美國時間 3 月 12 日下午 6 時 40 分至晚上 10 時 50 分發生,原因是出於 Google 內部用來儲存圖片、聲音等檔案的 BLOB (二進位大型物件)儲存服務出現問題,這連累到使用 BLOB 儲存服務的 Gmail 、 Google Photo 和 Google Drive 都出現問題。
原來在美國時間 3 月 11 日,內部 BLOB 儲存服務所使用,用來儲存元數據( Metadata )的儲存資源出現緊迫狀況。為了減低資源使用量, Google 的工程師就在 12 日變更設定,誰知這改變產生的副作用令到找尋 BLOB 資料位置的系統的主要部份出現過載,最終導致骨牌式故障。
Google 在美國時間 12 日下午 6 時 56 分停止變更設定的工作,而為了復修故障,更以人手方式降低了 BLOB 服務的流量級別,以允許任務啟動而不會因為高負載而崩潰。
事件之後, Google 表示會採取多項措施,包括將改善儲存服務的區域隔離,以免故障影響至全球,並會以軟件測量來防止任何會引致系統主要部分產生高負荷的設定變更。