很簡單:同時用多個供應商。蘋果供應鏈非常發達,僅組裝廠全球就有 18 家,如富士康 7 家、廣達 3 家、和碩 2 家。而在每個零部件環節也都會有多個供應商支持(用了哪幾家供應商都成了新聞)。並在產品層面采取了統一標准,確保哪怕地震、洪水也能按時交付同樣質量的產品。
反過來說,一些較小的手機廠商經常因為“泰國洪水”、“日本地震”、“台灣斷電”而無法正常發貨。
用互聯網行業的話來說,蘋果做到了“業務永續”。而其它手機商出現了典型的“單點故障”導致的“停擺”。
小結:供應鏈出現問題就會影響到品牌形象。所以業務永續是你和客戶之間的約定,“多個供應商”是你做到這個約定的手段之一。
而方法呢?業務永續首先是架構設計層的職責。盡可能消除單點故障風險,做好關鍵節點的冗余。換成人話就是:想好可能出現問題的地方,做好准備,比如說多備點存貨,用多個供應商,避免出現一個天災人禍你就跪了的局面。
雲計算故障了,但為什麼有的網站沒掛供應鏈不是制造業獨有的,互聯網行業也是如此。雲計算可以看作是很多公司的供應商,當它宕機時,有很多公司也會受到影響。
比如說,去年 AWS 弗吉尼亞節點宕機,導致包括 Netflix、Airbnb、Product Hunt、Medium、SocialFlow、Buffer、GroupMe、Pocket、Viber 和亞馬遜 Echo 等停擺。而國內雲計算廠商也遭遇過雷擊、挖掘機、斷電等多種問題。
雲計算出現宕機當然是導致網站停擺的導火索,持續提高穩定性是雲計算公司該承擔的責任沒跑。但大部分人沒有看到的是,同樣是這個節點故障,卻還是有很多網站並沒有掛掉。真正該問的問題是,為什麼有的掛了而有的沒掛!
“因為不僅僅是在弗吉尼亞有服務器,一出問題我就切到另一個節點了。”狡兔三窟的客戶都是這麼回答的。“雲計算廠商只承諾全年 99.999% 的時間是可靠的,剩下的時間要看運氣了。如果我只是依賴一個節點,它掛我就一定會掛掉,就會影響品牌形象。”
可能會出問題的就必然會出問題,這就是墨菲定律。除了自己應用層的可靠性,在基礎資源上索性就在不同的“可用區”(AZ)、“地域節點”(Region)都做一些部署。一些大型的公司甚至是在不同的雲計算廠商之間都做了准備。
雲計算公司為什麼不做“異地多活”還有人好奇,為什麼 AWS 和阿裡雲會出問題?雲計算不也是“異地多活”嗎?
這裡有個致命的錯誤,雲計算行業尤其是 IaaS 層一般會提供一個可用性指標(SLA),例如說 99.999%,即承諾全年有這個概率是可用的。而比如淘寶為了實現業務永續做了一個技術方案“異地多活”,這是它對於自己消費者的承諾(保證買買買不停)的實現手段。淘寶用了多個 99.999% 的節點同時運行,只要不是這些節點同時掛,它就不會掛。(不用說,難度很高也很貴)
它們之間的關系是:消費者——>亞馬遜網站、淘寶——>(雲計算 1 + 雲計算 2 + 雲計算 3)。雲計算 1、2、3 隨意掛掉一個都不會影響業務的穩定。
也就是說靠譜的雲計算廠商會告訴你自己服務能力的邊界和極限是什麼,使用它們的時候要根據它們的能力來規劃自己的業務設計,以達到自己的業務永續。
打個比方,你把女朋友的照片同時放在 iCloud、電腦、移動硬盤裡,只要不是 3 個同時丟失,你女朋友的照片就不會丟。但如果只存了一個地方,不幸又丟失了,那你說該怪誰?
總結關鍵看你有多關心用戶,錢有多少。
原文來自:https://linux.cn/article-7592-1.html
本文地址:http://www.linuxprobe.com/cloud-continuity-live.html
http://xxxxxx/Linuxjc/1144514.html TechArticle