初入行運維從業(yè)人員也來談?wù)処T運維
來源:湖北國菱計算機科技有限公司-荊州網(wǎng)站建設(shè)-荊州軟件開發(fā)-政府網(wǎng)站建設(shè)公司
時間:2017-06-06
快畢業(yè)時經(jīng)常和同學(xué)討論以后以后哪個行業(yè)最有前途,哪個行業(yè)最吃香,但是現(xiàn)在IT行業(yè)發(fā)展迅速,每天都有新技術(shù)產(chǎn)生,到底哪行好對于還沒有畢業(yè)的學(xué)生來說是一頭霧水。曾經(jīng)有個同學(xué)說,在未來運維將是最吃香的行業(yè)。我一直不以為然!畢業(yè)后,稀里糊涂的進(jìn)了公司,一直從事的都是運維方面的工作,曾經(jīng)一度認(rèn)為運維就是簡單的運行和維護,現(xiàn)在才知道運維沒那么簡單,只怪自己當(dāng)初的覺悟太低了!下面就來談?wù)勎宜赖倪\維吧!
1、 負(fù)載均衡和故障轉(zhuǎn)移流量大了,或者業(yè)務(wù)重要性高,就要求最大可能提供服務(wù)器的高可用性和數(shù)據(jù)容災(zāi),自然要部署負(fù)載均衡和故障轉(zhuǎn)移;是采用硬件F5,cisco還是軟件lvs,keepalvie,heartbeat,nginx方式實現(xiàn),效果如何?都需要去考量。
2、 運維團隊和人才的培養(yǎng)千金易得,一將難求。對于企業(yè)來講,運維人才的流失是比較可惜的,如何去留住一批優(yōu)秀的運維人才也是企業(yè)需要考慮的問題。其實不只運維,企業(yè)要想有長遠(yuǎn)的發(fā)展都應(yīng)當(dāng)想方設(shè)法留住人才,控制公司的人員流失率,要讓員工有歸屬感和榮譽感,而不是只有赤裸裸的雇傭關(guān)系;企業(yè)應(yīng)該著重培養(yǎng)一支高素質(zhì),高凝聚力的運維團隊,而不是只當(dāng)運維是業(yè)務(wù)部門和程序部門間的夾心餅,里外不是人,這樣的環(huán)境和團隊是留不住人才的。
3、運維人員的職業(yè)發(fā)展和出路每一個IT從業(yè)人員的心里都有個CIO的夢想吧,我也不例外,但是基礎(chǔ)的運維工作是年輕人的行業(yè),隨時年齡和經(jīng)驗的增長,轉(zhuǎn)向做管理或者架構(gòu),或者專攻DBA,是我目前的想法,但是未來的路很多,也許我會選擇自己創(chuàng)業(yè),或者去培訓(xùn)中心做教員也不一定。不過現(xiàn)在最主要的還是在有限的運維時間內(nèi)學(xué)習(xí)更多的運維知識,掌握更多的技能,為自己和企業(yè)創(chuàng)造更多的價值。
一、 企業(yè)運維人員的工作職責(zé)
1、運維的首要職責(zé)是參與確定公司的整體IT框架,當(dāng)然這也不完全是運維的事;框架這詞本身就比較籠統(tǒng)。框架大概包括服務(wù)器的系統(tǒng),程序使用何種語言,配合什么數(shù)據(jù)庫,使用何種容器來發(fā)布內(nèi)容,需要多少服務(wù)器,如何分配資源等。
決定使用什么操作系統(tǒng)也是件很重要的事,用windows,linux,aix還是freebSD,將來如何升級都對企業(yè)的運維產(chǎn)生著深遠(yuǎn)的影響,一般來講運維人員會建議管理層使用自己所熟練的操作系統(tǒng)。程序使用何種語言就和企業(yè)本身的業(yè)務(wù)息息相關(guān),例如銀行都首推java,一般的門戶網(wǎng)站,論壇都用php,asp.net等,程序語言對使用何種數(shù)據(jù)庫和web容器起著決定性的作用,如果是php,那一般是lamp,lnmp之類的經(jīng)典模型,如果是java,那選擇面相對比較廣些,容器部分可以選擇weblogic,websphere,jboss,tomcat等等;數(shù)據(jù)庫可以選擇oracle,db2, sysbase等,在這個時候,企業(yè)的經(jīng)濟實力也起著至關(guān)重要的作用!
2、保證服務(wù)器上正常的運行怎么樣才能算正常的運行呢?論壇卡,服務(wù)器慢,網(wǎng)站打不開之類的問題,出問題的有可能是服務(wù)器,也可能是用戶端或者就是中間的網(wǎng)絡(luò)傳輸問題,在中國最典型的就是南北互通的問題,曾有戲言:世界上最遠(yuǎn)的距離是中國電信到中國聯(lián)通之間的距離!因為這種問題很難判斷,所以一般管理者會要求運維每年的故障時間不能超過一定的值,說7*24*365服務(wù)不間斷運行,那是扯淡!總會有各種各樣的問題,無論你用了什么負(fù)載均衡,故障轉(zhuǎn)移技術(shù),服務(wù)臨時中斷也是避免不了的,運維的價值在于在縮短服務(wù)中斷后的MTTR時間,可見運維的壓力是很大的!
3、備份關(guān)鍵數(shù)據(jù),及時處理各種故障,保證服務(wù)器安全備份是為了恢復(fù),一般想到或者用到備份的時候,都是出現(xiàn)麻煩的時候,所以平常工作中對備份一定要足夠的重視,尤其是數(shù)據(jù)庫,在某些時候,看起來N年前的備份可能會給你的恢復(fù)工作帶來意想不到的作用;服務(wù)器的安全部分又是個拎不清的概念,因為安全本身就是相對的,而且安全和性能,用戶體驗之間是成反比的,運維在很多時候都是犧牲安全來換取性能和更好的用戶體驗,等將來安全上出現(xiàn)問題的時候再調(diào)整,例如關(guān)閉服務(wù)器的selinux,關(guān)閉服務(wù)器內(nèi)網(wǎng)間的防火墻,允許任意IP進(jìn)行FTP連接等等
4、及時調(diào)整服務(wù)器各項設(shè)定滿足業(yè)務(wù)需要,這是運維工作中的重頭戲,框架定了,服務(wù)器選了,一般是不會輕易改動的,但設(shè)置服務(wù)器的工作卻是每天都有的。程序今天需要部署個memcache,明天需要個中文分詞系統(tǒng),后天需要加個虛擬主機…… 這種事情一般是怎么做都做不完的,只能來一樣做一樣。但這種工作最能讓你的運維水平得到提高。運維人員在做這類工作的時候不能像應(yīng)付任務(wù)那樣,但求過關(guān)即可,否則日積月累下來,服務(wù)器會出現(xiàn)意想不到的情況。在處理這類工作上運維人員應(yīng)當(dāng)做到規(guī)范和文檔記錄,長期做下來,不但自己的運維專業(yè)水平會提高,對于后期的維護也會起到良性循環(huán)作用
5、記錄服務(wù)器維護日志和技術(shù)文檔這點都是在處理完問題后記錄下,方便加快日后處理同類問題的速度和效率;至于技術(shù)文檔,身為運維人員一定要認(rèn)真編寫,寫的很糟糕的文檔會給人誤導(dǎo)作用,internet上這類文章不在少數(shù),本身IT這個行業(yè)就是很浮躁的,如果不能靜下心來好好整理知識,總有一天會被淘汰的;對于過去整理的文檔要定期的去溫習(xí),有錯的要及時更正。所謂溫故而知新,孔夫子的教誨還是要聽的,否則等你有天在搜索引擎搜到自己的文章的時候,怎么想也想不明白當(dāng)初為什么要這樣做。筆者一直倡導(dǎo)和internet的朋友分享自己的知識,這樣有利于自己和他人的共同進(jìn)步
二、企業(yè)運維工具的選擇隨著企業(yè)的業(yè)務(wù)對IT的依賴越來越多,企業(yè)的服務(wù)器的架構(gòu)規(guī)模不斷擴展,為了更有效率的執(zhí)行任務(wù),為了我們運維人員不再像流水線上的一名工人一樣不斷重復(fù)的做著同樣的工作,我們將會用一類工具,這類工具是可編程的,我們只是需要寫上一些代碼就可以幫我們自動完成所有的工作。像我們公司用的是瑞寧CAM,集中審計管控系統(tǒng),除了能完成自動化運維的工作,比如系統(tǒng)安裝、系統(tǒng)升級、批量修改密碼、主機名規(guī)范、終端資源監(jiān)控、批量配置管理、終端批量實時操控等等,還有事后審計回放的功能,對于事后總結(jié)自己的工作,查找錯誤點非常有幫助。此外常見的運維工具還有:Kickstart、Chef、Nagios、Cobbler、ControlTier、OpenNMS、OpenQRM、Func、Zabbix、Spacewalk、Puppet、Cacti等。
三、 企業(yè)運維的主要難題
1、 IDC服務(wù)商的選擇
服務(wù)器多了,自然要找好的IDC運營商;這點很重要,差的IDC會把你服務(wù)器裝錯,會無緣無故把你的域名白名單取消,機柜的帶寬流量無法實時監(jiān)控,CDN效果不佳,服務(wù)器出問題的不是先想著如何處理問題,而是找各種各樣的借口,什么機房網(wǎng)絡(luò)被攻擊,電源跳閘之類的,各種悲??!
2、 服務(wù)器提供商和型號的選擇
這個也很重要,筆者先前遇到一批DELL R410固件問題,每當(dāng)服務(wù)器高流量的時候,服務(wù)器網(wǎng)卡會自動斷流,需要手動重啟網(wǎng)卡,這個問題悲劇了許久,到最后也未能完全解決;之前還遇到過內(nèi)存,主板故障等問題,服務(wù)器的硬件一旦出現(xiàn)問題,就意味著停機檢修,服務(wù)自然要中斷。所以在服務(wù)器的選擇上也要慎重,而不是只考慮價格問題
以上內(nèi)容轉(zhuǎn)自 http://www.cnyunwei.com/thread-2071-1-1.html。