營運持續計畫和災難復原

本頁適用於 ApigeeApigee Hybrid

查看 Apigee Edge 說明文件。

Apigee 是多租戶、自助式、雲端平台,在全球多個地區的多個資料中心中以完全備援 (即時/即時) 設定運作。Apigee 使用 Google Cloud 建構雲端平台。我們在 Google Cloud 上建構的服務會使用各個區域內的多個資料中心,並在這些資料中心為客戶提供即時流量服務。我們沒有「正常運作」資料中心和「待命」(或「次要」或「備援」) 資料中心。我們有兩個 (或更多) 資料中心,持續同時為全球各區域的客戶流量提供服務。

BCP/DR 計畫

Apigee 業務持續性規劃和災難復原 (BCP/DR) 是平台級別的計畫,不包含個別客戶的詳細工作。相反地,平台會在客戶資料要求發生中斷和停機時處理。即使整個資料中心離線,資料仍會持續傳送。如果整個區域都離線,單一區域的客戶可能會遇到 API 處理服務中斷的情況。如果客戶需要的備援服務不只限於「區域內」服務,Apigee 可提供全球備援層級的備援資料中心,在多個區域或國家/地區提供流量服務,因此即使整個區域離線,資料仍可順利傳送。

單一區域的客戶服務不會自動轉移至其他區域,因為資料處理和存取可能受到地理位置限制。Apigee 服務會代為客戶在客戶指定的區域託管。由於資料的地理位置可能受到特定法規規範,或客戶對使用者有承諾,因此服務不會自動移至其他區域,因為這可能會影響 Google 對客戶的承諾,或 Google 客戶對其客戶的承諾。

Google 不會與任何個別客戶分享完整的 BCP/DR 計畫,因為其中包含內部機密資訊和客戶參照資料。根據我們的隱私權政策,我們不會與個別客戶分享平台 BCP/DR 計畫,以免洩露其他客戶的姓名。我們為每位客戶提供相同程度的隱私權。

BCP/DR 管理

Google 資訊安全團隊負責監督企業復原計畫,而輪值事件指揮官則負責管理及解決所有事件。事件指揮官隨時都會安排營運和工程人員待命,並提供應對所有可能行動的應對手冊。

BCP/DR 測試

Google 會執行作業程序,以便支援平台的 BCP/DR 測試,且頻率高於年度完整 BCP/DR 測試。我們每個月都會在實際/實際環境中執行負載波動,同時更新執行服務的系統。這項程序會在負載由同級資料中心處理的同時,關閉整個資料中心的系統。在這個程序中,執行任何更新後,第一個資料中心會重新啟動,並再次執行服務/Live,以驗證是否有任何問題。接著,同樣的更新會導致對等資料中心關閉,然後又重新上線。Google 會使用工具和技術來排除流量,並將一小部分流量傳送至最近更新的服務,以便檢查是否有任何問題或錯誤,然後再恢復全負載處理。

這個一致的作業程序會將服務的彈性「測試」納入更頻繁的作業工作,超越業界標準的半年一次彈性「測試」。

除了上述作業程序外,Google 也至少每年進行一次 BCP/DR 演練,讓工程和作業團隊成員測試真實的災難情境。除了服務本身,我們也為人員提供額外的訓練和經驗,讓他們瞭解企業整體的 BCP/DR 計畫。

Google 執行的 BCP/DR 測試不會使用「備援演練」或「次要位置」,因為這些項目都已內建於執行中的系統。

Google 確實會維護應對手冊,供所有營運和工程團隊使用。這些劇本集會至少每年審查及更新一次,並用於所有 BCP/DR 測試和訓練演練。

客戶可以取得年度 BCP/DR 測試報告。我們也會將營運工作和年度 DR 演練測試報告結果提供給第三方稽核人員,以便稽核人員審查我們是否符合 PCI、HIPAA、ISO、合約和其他規定。

客戶 BCP/DR 測試

建議客戶將自己的 DR 計畫納入 Apigee 服務。客戶可以且應考慮 Apigee 如何視需要重新導向流量,讓客戶即使在客戶資料中心停機或發生其他災難事件時,也能維持使用者服務。不過,這類測試不在 Apigee DR 計畫的範圍內。我們建議客戶對自己的應用程式執行 BCP/DR 測試,並在測試中納入 Apigee。

復原時間目標/復原點目標

Apigee 不會為客戶或與 BCP/DR 活動相關的合約提供復原點和復原時間目標 (RPO/RTO)。服務水準協議是 RTO/RPO 資料點的雲端等價項目。由於 Apigee 是備援的雲端服務,管理和執行階段服務皆以備援的運作中服務架構而成,因此 RTO 和 RPO 皆可視為「即時」。單一區域的客戶至少會在同一個區域內的不同資料中心中獲得備援服務。如需更高等級的備援服務,客戶可以選擇多區域服務。

Pandemic 計畫

Google 在整體 BCP/DR 計畫和程序中納入了流行病計畫。針對支援等業務運作,Google 在多個辦公室和遠端地點設有 24 小時全年無休的全球支援團隊。如果全球某個地區發生大流行,導致我們的某個支援地點受到影響,其他辦公室的人員就會收到通知,並接手處理該受影響辦公室平時負責的輪班。至於銷售等其他業務服務,則是全球分散式人力。所有 Google 團隊都已準備好在必要時進行遠端工作。使用的工具是雲端工具,因此非常適合用於因應大流行的應變計畫。

更新

Google 至少每年會審查及更新 BCP/DR 計畫。從事件、產品變更、業界標準、風險分析活動和 BCP/DB 測試中收集的資訊,可用於更新計畫。

業務影響分析和風險評估

Google 每年會進行業務影響分析和風險評估。BIA 和 RA 的結果會在問題追蹤系統中優先處理並記錄。