日前,263完成了對企業郵箱系統的全面升級與合并工作,涉及超過十萬企業用戶,數百萬商務個人,這對于一家牢牢占據企業郵箱市場份額第一的服務型企業來說,要保證所用用戶平穩、無感知的過渡到新xmail系統及云存儲平臺,是一項浩大的系統工程。對此,我們與263郵件應用開發部資深部門經理李志濤面對面,深喉探訪263企業郵箱系統升級、整合之路。
系統改造化繁為簡,合并前問題都解決
263企業郵箱的市場份額連續15年保持第一,用戶數據量之大可想而知。據悉,此次263企業郵箱系統改造是從2013年12月啟動。對于合并之前的狀況,李志濤表示:“系統合并前是三個獨立系統,運行規則以及程序版本都是多套,即以前的1套、2套和3套系統。開發與維護工作量非常大,需多套兼顧,管理起來非常不便,且維護成本成倍增加。”
的確,作為三套獨立的系統,資源配置存在差異性,導致三個系統上的用戶享受的資源不均等,常會出現1套用戶向2套遷移等現象。并且,三個系統上的用戶配置也是不同的,使得用戶使用起來也非常不便。而3套系統合并后,無論是在管理運維方面還是在用戶使用方面,都將大幅優化。
分階段逐層“遷徙”,難點逐一攻破
據李志濤介紹,改造項目是從2013年12月啟動,共分為三個階段。第一階段是郵件儲存遷移。重點是將之前的淡季磁盤存放的郵件遷移到云儲存平臺,對郵件安全儲存加大保障。遷往云端,是順應發展與時俱進的必然之舉,但是在現今數據量日益巨大的環境下,郵件的遷移成為了一道難點。
大數據量的遷移對接收程序的穩定性、準確性有較高要求,但同時對云儲存平臺的安全性、穩定性和處理性能的要求更高,進而對云儲存平臺可擴展性,動態擴容也提出了要求。
對于解決辦法,李志濤表示:“系統設計除盡量考慮周全外,開發時采用交叉審查,即開發互相代碼走查審閱對方的程序,測試和開發綁定,深入程序內部細節,精細測試每一個環節;另外,我們還將運維24小時備勤,及時查看遷移情況,有問題及時解決,確保遷移按時按量完成,以及數據準確性。最大限度降低對用戶的影響,事實證明,緊密盯查下,我們做到了用戶對改造波動無感知。”
第二階段即業務合并,各套系統統一程序、統一配置,用戶數據集中管理,功能服務集中,化繁為簡。對于本階段難點為二,一是在于舊系統規則多,個性化規則更多,調研難度大,工作量劇增,且無經驗可參考。二是系統合并需改動模塊,但有些模塊只能合并當天才能上,并且線下不能復制線上環境,無法模擬演練,因此合并時有可能會出現不確定因素。
“項目組對此投入了相當大的人力物力,可謂群策群力之下一場緊張的‘戰斗’。”李志濤提到人力投入時這樣說。“產品團隊此次集眾人力量,做了細致入微的調研工作,每隔一段時間進行一次評審與溝通,不斷沙盤演練模擬整個合并過程,記錄每個合并細節,注意攻破、完成。為最大限度降低對用戶的影響,反復論證合并策略,確保各模塊有序進行。相關工作人員全部以合并工作為先,保證了此次合并的順利與高效。”
第三階段即域名統一。部署統一中樞,以均衡資源。此舉主要是為客戶IP加白,以及使用新域名。這個過程中客服人員承擔的較多,投入更大的精力與人力,去通知數量龐大的客戶。
系統合并極力“減震”,讓客戶無感知
系統做這么大的調整,可能最擔心的就是客戶端出現“震蕩”。郵件收發不穩定、遺漏丟失都是很嚴重的問題。如何避免客戶受到影響,也是李志濤團隊細致去思考與解決的問題。
李志濤說道:“首先,團隊執行過程中,選擇的合并時間通常是空閑期,即周五晚上10點到早晨6點,大部分客戶不使用系統的時段。其次對于時差客戶,我們也提前通知到,盡量避開更新時間。最后對于更新的方案選擇我們十分慎重,不能提前上線的模塊討論出最合理的更新方法,減少對用戶的影響,并且在開發、測試、運維端全部備勤,便于立即處理異常。”
系統合并之后,用戶配置客戶端簡單統一,并且所有用戶都共享資源,系統資源更新可以統一、高效,杜絕資源不均的情況。如此新產品的新功能開發速度會大大提高,用戶需求可以及時響應。最后,李志濤經理表示:“如此大規模的系統改造,一定是就用戶利益出發而決心規劃的,即一切為用戶考慮,改造后用戶都用上云存儲,郵件存放更安全更高效,這也是用戶關心的最大問題,也是我們所關心的最大問題。對待用戶,必須用心,用戶至上。”