譯者 | 李睿
審校 | 孫淑娟
希望升級(jí)云計(jì)算戰(zhàn)略的企業(yè)正在轉(zhuǎn)向CloudOps這一新興框架,以優(yōu)化性能,并管理在云中開展業(yè)務(wù)的成本。
任何參與創(chuàng)建軟件產(chǎn)品的人都應(yīng)該非常熟悉DevOps,這是一套結(jié)合軟件開發(fā)和IT運(yùn)維的實(shí)踐,旨在縮短開發(fā)生命周期并提供持續(xù)交付和高質(zhì)量的產(chǎn)品。
隨著企業(yè)越來越多地將應(yīng)用程序開發(fā)和工作負(fù)載轉(zhuǎn)移到云中,并且這些云支出變得更加復(fù)雜,出現(xiàn)了一個(gè)相關(guān)的概念,即“云運(yùn)維”(CloudOps)。
本文將研究CloudOps是什么,它如何使企業(yè)受益,以及在企業(yè)中實(shí)施CloudOps時(shí)應(yīng)牢記的關(guān)鍵問題。
1.什么是CloudOps?
CloudOps是一種運(yùn)營實(shí)踐,用于管理在云計(jì)算運(yùn)營環(huán)境中運(yùn)行的IT服務(wù)和工作負(fù)載的交付、優(yōu)化和性能。
無論企業(yè)是采用多云、混合云還是私有云戰(zhàn)略,CloudOps都旨在為基于云計(jì)算的流程建立程序和最佳實(shí)踐,這與DevOps為應(yīng)用程序開發(fā)和交付所做的方式非常相似。
2.CloudOps云運(yùn)維的多層框架
咨詢機(jī)構(gòu)凱捷美洲公司副總裁兼云卓越中心負(fù)責(zé)人Jason Hatch表示:“整體云運(yùn)維是一個(gè)具有多個(gè)層次的框架,可以幫助企業(yè)管理其云生態(tài)系統(tǒng)的各個(gè)方面?!?/p>
其中一個(gè)是治理層,包括財(cái)務(wù)運(yùn)營(也稱為FinOps)等活動(dòng),以控制成本和管理云預(yù)算。Hatch說,“治理層還應(yīng)該包含關(guān)于如何以及在云中部署什么的架構(gòu)標(biāo)準(zhǔn),并有辦法以編程方式執(zhí)行這些標(biāo)準(zhǔn)?!?/p>
其他框架層包括:云應(yīng)用層,該層涵蓋了企業(yè)如何在云中部署和管理/監(jiān)控應(yīng)用程序和特定于應(yīng)用程序的服務(wù);云運(yùn)維層,主要用于云計(jì)算服務(wù)的部署、管理、監(jiān)控和運(yùn)營;云基礎(chǔ)層,包括身份、網(wǎng)絡(luò)管理、日志記錄、中央備份管理、基礎(chǔ)設(shè)施即代碼和中央監(jiān)控功能等核心服務(wù)。
Hatch說,“跨越所有這些層的是‘安全層’,其中包括漏洞和威脅管理、工作負(fù)載保護(hù)以及與企業(yè)更大的網(wǎng)絡(luò)安全管理功能的集成?!?/p>
3.CloudOps在企業(yè)中的應(yīng)用
CloudOps模型與應(yīng)用程序交付特別相關(guān),許多企業(yè)都在關(guān)注旨在增加銷售額和增強(qiáng)客戶體驗(yàn)的數(shù)字計(jì)劃。
云計(jì)算服務(wù)提供商Replicon負(fù)責(zé)工程和運(yùn)營的執(zhí)行副總裁Suresh Kuppahally說:“CloudOps將構(gòu)建、部署、運(yùn)營、監(jiān)控和管理云中(Web)應(yīng)用程序交付功能的五項(xiàng)首要職責(zé)結(jié)合在一起?!?/p>
Kuppahally指出,網(wǎng)絡(luò)、計(jì)算、安全和存儲(chǔ)是在初始構(gòu)建和設(shè)計(jì)階段必須牢記的四個(gè)關(guān)鍵組件。他說,“從那里,企業(yè)或者自動(dòng)部署他們的應(yīng)用程序,或者通過持續(xù)集成和持續(xù)交付部署他們的應(yīng)用程序。”
Kuppahally說,企業(yè)的CloudOps團(tuán)隊(duì)還應(yīng)明確區(qū)分職責(zé)和獨(dú)立于工程或產(chǎn)品團(tuán)隊(duì),這樣做使CloudOps能夠帶來企業(yè)內(nèi)部的透明度和服務(wù)質(zhì)量[QoS] 責(zé)任制。
4.CloudOps的好處
凱捷美洲公司的Hatch表示,CloudOps的商業(yè)利益是相當(dāng)可觀的,首先是企業(yè)對(duì)云服務(wù)的整體部署。
他說,“CloudOps有助于推動(dòng)企業(yè)內(nèi)部進(jìn)一步采用和使用云計(jì)算服務(wù)。如果企業(yè)能夠有效地部署、管理和保護(hù)他們的云環(huán)境,它應(yīng)該增加他們對(duì)云計(jì)算的使用,并提供對(duì)新服務(wù)和技術(shù)進(jìn)行試驗(yàn)和創(chuàng)新的能力,這反過來又可以使他們更加敏捷,提供更快的上市時(shí)間,并有助于推動(dòng)創(chuàng)新?!?/p>
Hatch補(bǔ)充說,利用CloudOps的企業(yè)還可以對(duì)他們使用的越來越多的云計(jì)算服務(wù)實(shí)現(xiàn)更好的管理和財(cái)務(wù)控制。
Hatch說,“我們不斷從客戶那里聽到他們超出了他們的云預(yù)算,他們或者不知道為什么,或者無法實(shí)施控制來管理它。有效的CloudOps有助于緩解這種情況。在治理層,我們可以實(shí)施更好的預(yù)算和財(cái)務(wù)跟蹤和優(yōu)化。這在運(yùn)維層也得到了促進(jìn),部署和管理方面的自動(dòng)化程度更高?!?/p>
咨詢機(jī)構(gòu)Protiviti公司的客戶引用的另一個(gè)最大好處是能夠在云中自動(dòng)釋放授權(quán)資源,該公司總經(jīng)理Will Thomas說,該公司幫助客戶管理云計(jì)算日益復(fù)雜的問題。
Thomas說,增強(qiáng)的安全性是CloudOps的另一個(gè)關(guān)鍵優(yōu)勢(shì),因?yàn)樵撃P痛_保與安全控制、標(biāo)準(zhǔn)或框架保持一致,并建立可以限制不合規(guī)行為的策略,同時(shí)報(bào)告云中的健康和活動(dòng)。
Thomas還認(rèn)為,實(shí)施CloudOps的企業(yè)能夠更好地優(yōu)化其云環(huán)境,因?yàn)镃loudOps工程師將專注于利用云中的授權(quán)資源,通過最新和最優(yōu)質(zhì)的服務(wù)實(shí)現(xiàn)應(yīng)用程序的現(xiàn)代化。
此外,部署CloudOps的企業(yè)可以根據(jù)性能和成本考慮制定適當(dāng)?shù)馁Y源分配時(shí)間表;持續(xù)報(bào)告和審查有關(guān)云健康狀況的指標(biāo);支持主動(dòng)配置資源,同時(shí)保持云中的合規(guī)性。
Replicon公司的Kuppahally指出,CloudOps能夠在不影響QoS的情況下經(jīng)濟(jì)有效地?cái)U(kuò)展云服務(wù)。他說,“使QoS目標(biāo)和CloudOps投資保持一致是非常具有戰(zhàn)略意義的,因?yàn)榭梢约?lì)專門的CloudOps團(tuán)隊(duì)來管理運(yùn)營成本,因此將在降低運(yùn)營成本方面獲得既得利益?!?/p>
5.CloudOps的實(shí)踐
Stretto公司是一家受益于采用CloudOps的公司。該公司首席技術(shù)官George Tsounis說,這家服務(wù)于企業(yè)和消費(fèi)者破產(chǎn)部門的破產(chǎn)服務(wù)和技術(shù)公司很早就確定了對(duì)CloudOps實(shí)踐的需求,并將關(guān)鍵原則納入其在云中運(yùn)行的應(yīng)用程序和系統(tǒng)中。
Tsounis說,“例如,我們制定了嚴(yán)格、快速的規(guī)則,我們只會(huì)將基礎(chǔ)設(shè)施即代碼[IaC]實(shí)踐用于任何部署。我們通過決定所有的應(yīng)用程序/系統(tǒng)將始終跨兩個(gè)可用性區(qū)域運(yùn)行來實(shí)現(xiàn)冗余,因此我們利用了云計(jì)算提供商的內(nèi)置高可用性功能?!?/p>
Tsounis表示,Stretto公司戰(zhàn)略的關(guān)鍵部分是利用CloudOps實(shí)踐來確保對(duì)其技術(shù)運(yùn)營采取更積極主動(dòng)的方法。他說,“我們更愿意授權(quán)我們的架構(gòu)師和工程師為我們的內(nèi)部和外部客戶創(chuàng)建高性能、自我修復(fù)和彈性的云原生解決方案,而不是繼續(xù)以被動(dòng)的方式運(yùn)營?!?/p>
Tsounis表示,云服務(wù)的引入甚至是向無服務(wù)器功能過渡的過程,都帶來了獨(dú)特的挑戰(zhàn)。他說,“CloudOps是幫助我們應(yīng)對(duì)這些挑戰(zhàn)的戰(zhàn)略?!?/p>
CloudOps最終為Stretto公司帶來的好處包括降低成本、可擴(kuò)展性、自動(dòng)化、簡(jiǎn)化的災(zāi)難恢復(fù)以及隨著基礎(chǔ)設(shè)施成為應(yīng)用程序的一部分而無縫集成。
Tsounis說:“我們的團(tuán)隊(duì)受益于應(yīng)用程序的全面改進(jìn),這些CloudOps理念已被采用。CloudOps實(shí)踐也提高了質(zhì)量。這可以通過利用基礎(chǔ)設(shè)施即代碼方法使云計(jì)算基礎(chǔ)設(shè)施的部署和配置可重復(fù)來實(shí)現(xiàn)。隨著我們?cè)诟鞣N環(huán)境中推出應(yīng)用程序,減少了配置錯(cuò)誤,現(xiàn)在利用基礎(chǔ)設(shè)施即代碼擁有一致的基礎(chǔ)設(shè)施配置?!?/p>
Tsounis表示,Stretto公司通過取消對(duì)其云計(jì)算基礎(chǔ)設(shè)施的人工配置,質(zhì)量問題減少了大約20%。
他說,“利用CloupOps實(shí)踐為工程師提供了他們需要知道的應(yīng)用程序/系統(tǒng)行為在預(yù)生產(chǎn)環(huán)境中發(fā)布到生產(chǎn)環(huán)境時(shí)的成功信心。此外,由于我們的應(yīng)用程序質(zhì)量改進(jìn),服務(wù)臺(tái)和內(nèi)部票證減少,我們看到了整體IT運(yùn)營的改進(jìn)?!?/p>
6.跟上不斷發(fā)展的方法
在云服務(wù)及其使用方式方面,沒有什么是一成不變的,因此采用CloudOps的企業(yè)需要定期調(diào)整他們的方法以跟上變化。
對(duì)于許多企業(yè)來說,這仍然是一個(gè)需要克服學(xué)習(xí)曲線的新領(lǐng)域。凱捷美洲公司的Hatch 說,“隨著越來越多的企業(yè)采用真正的多云部署,他們的CloudOps實(shí)施也需要成熟和擴(kuò)展。許多客戶在孤島中管理他們的云環(huán)境,使用不同的工具和流程管理每個(gè)云計(jì)算環(huán)境,而從整體上查看整個(gè)云環(huán)境。
為了更加高效和有效,企業(yè)需要開發(fā)他們的CloudOps框架,以便能夠輕松插入新的云提供商和服務(wù),同時(shí)仍然提供適當(dāng)級(jí)別的管理、監(jiān)控和運(yùn)營嚴(yán)謹(jǐn)性。”
Kuppahally表示,企業(yè)在云中處理事件管理的方式也可以得以改進(jìn)。
他說,“這是大多數(shù)CloudOps團(tuán)隊(duì)都在陷于困境的領(lǐng)域,他們充斥著內(nèi)部和外部事件,并且無法有效管理它們。擁有專門的項(xiàng)目管理流程來簡(jiǎn)化事件管理分類和優(yōu)先級(jí)排序是降低風(fēng)險(xiǎn)的方法之一。
與此同時(shí),企業(yè)需要降低事件誤報(bào)率。當(dāng)CloudOps團(tuán)隊(duì)無法跟上高誤報(bào)率時(shí),他們就會(huì)不堪重負(fù)。制定有效的策略和計(jì)劃來減少或消除誤報(bào)是非常關(guān)鍵的成功因素。”
研究和教育服務(wù)提供商Wiley公司的執(zhí)行副總裁兼首席技術(shù)官Aref Matin表示,CloudOps可以從人工智能(AI)和機(jī)器學(xué)習(xí)等技術(shù)中受益。
Matin說,“通過機(jī)器學(xué)習(xí),CloudOps工具可以幫助定義企業(yè)范圍的策略,檢測(cè)和報(bào)告異常情況,并以自動(dòng)化的方式采取糾正措施,以維護(hù)云計(jì)算最佳實(shí)踐策略?!?/p>
7.CloudOps文化
與DevOps一樣,CloudOps的成功很大程度上取決于培養(yǎng)一種旨在充分利用框架和工具的文化。隨著越來越多的企業(yè)將更多的工作和流程轉(zhuǎn)移到云端,他們需要專注于構(gòu)建CloudOps專業(yè)知識(shí)。
Protiviti公司的Thomas說,“大多數(shù)客戶在處理云計(jì)算服務(wù)時(shí)處于反應(yīng)狀態(tài),無法響應(yīng)事件、更改或?qū)π路?wù)的請(qǐng)求。CloudOps通過自動(dòng)化啟用的部署建立了結(jié)構(gòu),允許監(jiān)控、審查和優(yōu)化現(xiàn)有資源,并檢查企業(yè)政策以與云計(jì)算保持一致?!?/p>
Stretto公司的Tsounis對(duì)此表示認(rèn)同。他指出 ,企業(yè)需要更廣泛地了解適當(dāng)?shù)慕M織結(jié)構(gòu)、專業(yè)知識(shí)和協(xié)作的適當(dāng)協(xié)調(diào),CloudOps才能真正發(fā)揮作用。
Tsounis說,“CloudOps不是一個(gè)單獨(dú)的團(tuán)隊(duì)或部門。IT、安全、架構(gòu)和應(yīng)用程序團(tuán)隊(duì)需要協(xié)作并在常見的CloudOps實(shí)踐上保持一致。如果這些團(tuán)隊(duì)在孤島中工作,CloudOps就不能很好地工作?!?/p>
根據(jù)將CloudOps付諸實(shí)踐的經(jīng)驗(yàn),Tsounis認(rèn)為,企業(yè)還需要更好地定義CloudOps所需的基本技能才能取得成功,而不是重新發(fā)明輪子。
他說,“技術(shù)團(tuán)隊(duì)需要了解基于云的架構(gòu)、網(wǎng)絡(luò)、安全和自動(dòng)化。如果沒有基礎(chǔ)技能,團(tuán)隊(duì)可能會(huì)冒險(xiǎn)在已經(jīng)存在云服務(wù)的情況下實(shí)施解決方案?!?/p>
原文鏈接:https://www.cio.com/article/100000992/cloudops-a-framework-for-optimizing-your-cloud-operations.html
來源: 51CTO技術(shù)棧