一、現(xiàn)有硬件及應(yīng)用環(huán)境(已具備,本次無需采購)
1.服務(wù)器兩臺(安裝操作系統(tǒng)且用于運行客戶的應(yīng)用服務(wù));
2.服務(wù)器的操作系統(tǒng):Windows NT Server;
3.應(yīng)用服務(wù):Interlib(圖創(chuàng)圖書館集群化管理系統(tǒng))
二、熱備方案應(yīng)達到的目的
本項目為解決基于存儲共享或者雙機鏡像的熱備軟件系統(tǒng)中存在的共享存儲設(shè)備單點故障問題,可建立異地存儲(容災(zāi))子系統(tǒng),避免今后基礎(chǔ)設(shè)施的重建,為下一步整合和擴大圖書館資源建設(shè)和服務(wù)提供保障。
通過搭建純軟雙機的系統(tǒng)高可用性解決方案在兩臺服務(wù)器運行Oracle和Interlib。使用兩臺服務(wù)器構(gòu)造高可用系統(tǒng),實現(xiàn)Oracle和Interlib應(yīng)用服務(wù)7*24運行,同時服務(wù)器之間數(shù)據(jù)實時鏡像,保證數(shù)據(jù)的高可用性。
1.兩臺服務(wù)器,每臺服務(wù)器都裝上Oracle數(shù)據(jù)庫,Interlib應(yīng)用服務(wù),并能夠單獨運行。
2.系統(tǒng)中相關(guān)的數(shù)據(jù)都存放在Oracle數(shù)據(jù)庫中。
3. Interlib應(yīng)用服務(wù)對外提供服務(wù),對應(yīng)于Tomcat配置多個活動IP。(注意的是配置的活動IP與服務(wù)器上的本地IP要在不同的網(wǎng)段上)
4.服務(wù)器之間用RS232串口或TCP/IP socket作為心跳線,傳輸熱備軟件的心跳信息。(建議用戶至少建立兩條心跳線,避免服務(wù)器間通信的單點故障)
5.服務(wù)器之間通過基于TCP/IP協(xié)議的網(wǎng)絡(luò)進行數(shù)據(jù)實時復(fù)制。
熱備軟件將分別安裝在兩臺服務(wù)器上,其中一臺作為Interlib(圖書館自動化集群管理系統(tǒng))和Oracle數(shù)據(jù)庫兩個應(yīng)用服務(wù)的主服務(wù)器,另外一臺作 為Interlib和Oracle數(shù)據(jù)庫的備服務(wù)器,雙機軟件在這兩臺服務(wù)器之間做虛擬公用ip以提供對外服務(wù),正常情況下一臺服務(wù)器對外提供服務(wù) (Oracle作為后臺數(shù)據(jù)庫),同時其服務(wù)變動的數(shù)據(jù)會實時傳遞到另外一臺主機上進行備份。一旦某個服務(wù)器上的服務(wù)出現(xiàn)故障,另外一臺服務(wù)器便在不影響 自身的應(yīng)用服務(wù)的情況下接管其任務(wù),直到故障服務(wù)器恢復(fù)為止。
三、熱備軟件技術(shù)和方案要求
1.熱備軟件工作模式
軟件需支持Active/Standby和Active/Active兩種模式。
2.保證業(yè)務(wù)的持續(xù)不間斷
正常情況下應(yīng)用服務(wù)(Interlib圖書館集群化管理系統(tǒng))在主服務(wù)器上運行,熱備軟件將主服務(wù)器的數(shù)據(jù)實時鏡像到備服務(wù)器上,并實時監(jiān)控應(yīng)用、網(wǎng)絡(luò)等 狀態(tài)。當主服務(wù)器發(fā)生故障時,熱備軟件會迅速地將應(yīng)用服務(wù)以及相關(guān)資源切換到備服務(wù)器上,使用備服務(wù)器上的鏡像數(shù)據(jù)繼續(xù)運行應(yīng)用服務(wù),并持續(xù)對外提供服 務(wù)。
3.在線備份數(shù)據(jù)或維護
當需要對備機上復(fù)制的數(shù)據(jù)進行備份、查看的操作,不希望新的數(shù)據(jù)寫入時,可以使備機暫停寫入,暫停后數(shù)據(jù)仍將發(fā)送到備機,備機將暫停后的數(shù)據(jù)緩存起來。備 機完成數(shù)據(jù)操作后,再將緩存的數(shù)據(jù)寫入到備機磁盤中,恢復(fù)正常操作狀態(tài),熱備軟件 允許對Active主機復(fù)制的數(shù)據(jù)暫停發(fā)送,暫停后變化的數(shù)據(jù)仍將被截獲,變化的數(shù)據(jù)將被存入source端pagefile中,等待傳輸暫?;謴?fù)后發(fā) 送。
4.智能的故障處理恢復(fù)
在網(wǎng)絡(luò)故障、傳輸暫停等情況下,數(shù)據(jù)無法發(fā)送時,服務(wù)可將數(shù)據(jù)暫存在pagefile中,當可以發(fā)送后繼續(xù)進行發(fā)送,保證數(shù)據(jù)不會丟失。pagefile 的大小可以自行設(shè)定。當網(wǎng)絡(luò)發(fā)生故障后,熱備軟件的數(shù)據(jù)復(fù)制不會停止,而是將復(fù)制的數(shù)據(jù)放入pagefile中,當網(wǎng)絡(luò)恢復(fù)后將自動地將pagefile 中的數(shù)據(jù)發(fā)送到目標機,而不需要重新進行同步,減少網(wǎng)絡(luò)和CPU的負載。
5.增強數(shù)據(jù)安全策略
熱備軟件提供全面的數(shù)據(jù)安全策略,對數(shù)據(jù)的可用狀態(tài)進行監(jiān)控,充分保證切換后的數(shù)據(jù)狀態(tài)是一致有效的。 熱備軟件完整的高可用性保護策略,在主機發(fā)生故障時,可以及時自動的將應(yīng)用服務(wù)切換到備機,確保業(yè)務(wù)迅速恢復(fù)。
6.數(shù)據(jù)冗余保護
熱備軟件監(jiān)控在主機上的應(yīng)用。一旦捕獲到應(yīng)用變動的數(shù)據(jù),便立即把該數(shù)據(jù)鏡像到另外的主機中,從而保證兩臺主機數(shù)據(jù)的一致性,實現(xiàn)冗余保護。
7.消除備份窗口
通過備機寫入暫?;蛑鳈C傳輸暫停,可以在確保主機應(yīng)用在線持續(xù)運行的情況下,通過備機將數(shù)據(jù)備份到帶庫上。即保證了業(yè)務(wù)的持續(xù)運行,性能不受影響,又可以 對數(shù)據(jù)進行更多方式,更加靈活的備份保護。同時備份操作的作業(yè)時間也有了更大的靈活性,不必等到晚上或是周末再進行。
8.降低管理和維護成本
數(shù)據(jù)的實時鏡像和保證業(yè)務(wù)7*24提供服務(wù),是熱備軟件自動完成,不需要人工進行干預(yù)。
9.實時對磁盤空間監(jiān)控
熱備軟件提供磁盤空間監(jiān)控功能,當磁盤的可用空間低于設(shè)定值時,將通過郵件、在線消息進行報警。
10.服務(wù)器錯誤郵件實時信息通知
熱備軟件支持郵件信息通知,當發(fā)生異常情況時,系統(tǒng)將自動地發(fā)送信息給設(shè)定的郵箱,幫助管理員及時了解系統(tǒng)運行狀態(tài)。
11.與Interlib集群管理系統(tǒng)短信平臺無縫對接
熱備軟件除了支持郵件信息通知外,還能與Interlib的短信平臺進行對接,當發(fā)生異常情況時,系統(tǒng)自動根據(jù)異常錯誤級別自動發(fā)送給指定的級別的管理操作人員,幫助用戶實時了解服務(wù)器運行情況。
12.按需復(fù)制性能資源最佳效果
熱備軟件支持復(fù)制數(shù)據(jù)集的定義,用戶可以選擇定制需要復(fù)制的目錄、文件。熱備軟件的數(shù)據(jù)鏡像是基于文件系統(tǒng)之上的,僅僅復(fù)制文件變化的部分。熱備軟件通過 自身的驅(qū)動程序來監(jiān)控用戶指定數(shù)據(jù)集,獲取變化內(nèi)容進行傳輸處理。以這種以字節(jié)為單位的按需復(fù)制,充分保證系統(tǒng)性能和效率的最佳化。
13.自動的應(yīng)用高可用性保護
熱備軟件中每個被保護的應(yīng)用可以建立8個活動IP,客戶端可以通過活動IP訪問應(yīng)用服務(wù),另外熱備軟件中每個被保護的應(yīng)用都可以建立多個主機別名,客戶端可以通過別名訪問應(yīng)用服務(wù)。
14.支持應(yīng)用進程的監(jiān)控
熱備軟件可以監(jiān)控標準的Windows服務(wù)或是Linux平臺的應(yīng)用,同時支持以自定義方式對用戶自己的應(yīng)用進程進行監(jiān)控。
15.實時網(wǎng)卡、活動IP的監(jiān)控
熱備軟件將對主機的網(wǎng)卡、活動IP的狀態(tài)進行監(jiān)控,當發(fā)生故障時通過在線消息等進行通知。
16.支持多條心跳
熱備軟件支持Socket和RS232兩種類型的心跳,并支持心跳冗余,最多允許三條心跳。當配置遠距離的高可用性系統(tǒng)時,使用網(wǎng)卡類型的心跳。
|