|
|
客戶具有系統(tǒng)的備份
可能有兩種 Microsoft Windows Server 2003 的備份:“權(quán)威性系統(tǒng)恢復(fù)”(ASR) 備份包括群集配置(我們稱之為“系統(tǒng)狀態(tài)備份”),以及完全的本地備份(我們稱之為“本地備份”)。請(qǐng)注意,要執(zhí)行“權(quán)威性恢復(fù)”,要求提供“系統(tǒng)狀態(tài)備份”。如果您在一個(gè)節(jié)點(diǎn)上執(zhí)行“權(quán)威性恢復(fù)”,Microsoft 建議您在其他群集節(jié)點(diǎn)上執(zhí)行“非權(quán)威性恢復(fù)”。 群集節(jié)點(diǎn)無(wú)法啟動(dòng)在這種情況下,我們假定仲裁磁盤(pán)功能正常,且所有數(shù)據(jù)未受到破壞。 群集中的一個(gè)節(jié)點(diǎn)無(wú)法啟動(dòng) 群集中的其他節(jié)點(diǎn)則可以正常運(yùn)行。 建議 使用“非權(quán)威性恢復(fù)”。這應(yīng)當(dāng)與“系統(tǒng)狀態(tài)備份”或“本地備份”結(jié)合使用。 這將會(huì)恢復(fù)故障節(jié)點(diǎn)上的群集數(shù)據(jù)庫(kù),然后受影響節(jié)點(diǎn)將可以重新加入群集。在這種情況下,它將會(huì)從群集中的其他節(jié)點(diǎn)下載群集數(shù)據(jù)庫(kù)的最新副本。 群集中的所有節(jié)點(diǎn)都無(wú)法啟動(dòng) 沒(méi)有任何一個(gè)群集節(jié)點(diǎn)可以啟動(dòng)。 建議 在一個(gè)節(jié)點(diǎn)上使用“非權(quán)威性恢復(fù)”。假定仲裁磁盤(pán)完好,該節(jié)點(diǎn)應(yīng)當(dāng)能夠利用仲裁磁盤(pán)的狀態(tài)形成群集。如果上述方法無(wú)效,則可以嘗試對(duì)該節(jié)點(diǎn)進(jìn)行“權(quán)威性恢復(fù)”(這需要“系統(tǒng)狀態(tài)備份”)。 對(duì)所有其他節(jié)點(diǎn)使用“非權(quán)威性恢復(fù)”。 所有節(jié)點(diǎn)都完好,但仲裁磁盤(pán)無(wú)法正常工作群集節(jié)點(diǎn)可以啟動(dòng),但是在所有節(jié)點(diǎn)上都無(wú)法啟動(dòng)群集服務(wù),因?yàn)樗鼰o(wú)法使仲裁資源返回聯(lián)機(jī)狀態(tài)。事件日志中會(huì)有一個(gè)條目指出無(wú)法使仲裁返回聯(lián)機(jī)狀態(tài)。 建議 如果驅(qū)動(dòng)器本身也失敗,則替換仲裁磁盤(pán);如果物理驅(qū)動(dòng)器沒(méi)有失敗,則重新格式化仲裁磁盤(pán)。使用“權(quán)威性恢復(fù)”(如果您有的話)來(lái)啟動(dòng)一個(gè)節(jié)點(diǎn)。 或者 使用 fixquorum 標(biāo)記來(lái)啟動(dòng)群集服務(wù)(請(qǐng)注意 fixquorum 允許您啟動(dòng)因?yàn)橹俨觅Y源被破壞而無(wú)法聯(lián)機(jī)的群集服務(wù),但它并不能真正為您修復(fù)任何數(shù)據(jù)),然后選擇一個(gè)替代仲裁資源(如果您沒(méi)有其他磁盤(pán)的話,可以使用本地仲裁)。通過(guò)設(shè)置新仲裁,可以在仲裁上創(chuàng)建新的仲裁日志文件,但注冊(cè)表檢查點(diǎn)文件并沒(méi)有恢復(fù),因?yàn)榕f的仲裁已不可用。 Reskit 工具 ClusterRecovery 可以幫助解決這個(gè)問(wèn)題。 請(qǐng)按照“檢查點(diǎn)文件已丟失或損壞”一節(jié)中介紹的過(guò)程來(lái)解決檢查點(diǎn)文件的問(wèn)題。 其中一個(gè)群集節(jié)點(diǎn)上的群集數(shù)據(jù)庫(kù)損壞您會(huì)發(fā)現(xiàn),如果節(jié)點(diǎn)沒(méi)有加入群集或是群集日志(默認(rèn)情況下為 %windir%\cluster\cluster.log)中的條目指向損壞的單元,則會(huì)出現(xiàn)這種情況。 建議 對(duì)此節(jié)點(diǎn)進(jìn)行一次“非權(quán)威性恢復(fù)”,然后使其加入群集。 或者 從仲裁磁盤(pán)上復(fù)制最新的檢查點(diǎn)文件 (chkXXX.tmp),并覆蓋受影響節(jié)點(diǎn)上的 %windir%\cluster\clusdb 文件,然后重新啟動(dòng)該服務(wù)。 或者 在某個(gè)工作群集節(jié)點(diǎn)上停止該服務(wù)。使用 RegEdit 卸載群集單元。 從工作節(jié)點(diǎn)上將 %windir%\cluster\clusdb 文件復(fù)制到受影響節(jié)點(diǎn)上的 %windir%\cluster\clusdb,然后重新啟動(dòng)所有節(jié)點(diǎn)上的群集服務(wù)。 所有節(jié)點(diǎn)都運(yùn)行良好,但仲裁數(shù)據(jù)庫(kù)損壞在這種情況下,沒(méi)有節(jié)點(diǎn)可以形成群集,事件日志中的條目會(huì)指出一個(gè)仲裁損壞的日志。 建議 使用 resetquorumlogfile 開(kāi)關(guān)啟動(dòng)群集服務(wù)。如果所有資源都成功啟動(dòng),并且配置看來(lái)也沒(méi)有問(wèn)題,那么就不需要再執(zhí)行什么操作。通過(guò)設(shè)置新仲裁,可以在仲裁磁盤(pán)上創(chuàng)建新的仲裁日志文件,但注冊(cè)表檢查點(diǎn)文件并沒(méi)有恢復(fù),因?yàn)榕f的仲裁已不可用。 請(qǐng)按照“檢查點(diǎn)文件丟失或損壞”一節(jié)中介紹的過(guò)程來(lái)解決檢查點(diǎn)文件的問(wèn)題。 如果這個(gè)方法失敗,請(qǐng)對(duì)一個(gè)節(jié)點(diǎn)進(jìn)行“權(quán)威性恢復(fù)”,然后重新啟動(dòng)群集服務(wù)以形成群集。對(duì)所有其他節(jié)點(diǎn)使用“非權(quán)威性恢復(fù)”。 檢查點(diǎn)文件丟失或損壞如果由于注冊(cè)表檢查點(diǎn)文件損壞而找不到或不能加載該文件,則資源處于聯(lián)機(jī)狀態(tài)時(shí)在注冊(cè)表中可能不具有最新信息。但是這種影響取決于資源,在一些情況下,資源可能無(wú)法返回聯(lián)機(jī)狀態(tài)。在其他情況下,所作的配置更改可能會(huì)丟失。如果檢查點(diǎn)文件丟失,群集服務(wù)并不會(huì)在事件日志中添加一個(gè)事件,因此如果您懷疑存在這個(gè)問(wèn)題的話,就需要查看群集日志。 建議 如果資源無(wú)法返回聯(lián)機(jī)狀態(tài),請(qǐng)使用資源工具包工具 ClusterRecovery 重新創(chuàng)建資源檢查點(diǎn)。 注意:您應(yīng)當(dāng)僅恢復(fù)無(wú)法返回聯(lián)機(jī)狀態(tài)的資源的檢查點(diǎn)文件。 如果這個(gè)方法無(wú)法解決問(wèn)題,請(qǐng)對(duì)一個(gè)群集節(jié)點(diǎn)使用“權(quán)威性恢復(fù)”,然后重新啟動(dòng)群集服務(wù)以形成群集。對(duì)所有其他節(jié)點(diǎn)使用“非權(quán)威性恢復(fù)”。 一個(gè)群集磁盤(pán)損壞或無(wú)法正常工作依賴于此磁盤(pán)的資源可能無(wú)法返回聯(lián)機(jī)狀態(tài)。該磁盤(pán)無(wú)法返回聯(lián)機(jī)狀態(tài)或磁盤(pán)上的數(shù)據(jù)被損壞。有兩種情況,一種是需要替換磁盤(pán),一種是不需要。 磁盤(pán)本身并沒(méi)有損壞,并可以返回聯(lián)機(jī)狀態(tài) 建議 將數(shù)據(jù)恢復(fù)到磁盤(pán) 磁盤(pán)已損壞 建議 替換磁盤(pán),并對(duì)一個(gè)節(jié)點(diǎn)使用“非權(quán)威性恢復(fù)”。將數(shù)據(jù)恢復(fù)到磁盤(pán)。 或者 使用包含 ClusterRecovery 工具的資源工具包,這個(gè)工具允許使用一個(gè)新磁盤(pán)替換現(xiàn)有的物理磁盤(pán)資源,而不用進(jìn)行系統(tǒng)狀態(tài)恢復(fù)。一旦物理磁盤(pán)返回聯(lián)機(jī)狀態(tài)之后,您就可以恢復(fù)任何數(shù)據(jù)。 客戶沒(méi)有系統(tǒng)的備份在這種情況下,我們建議采用解決一些災(zāi)難問(wèn)題的過(guò)程,而不使用備份。很明顯地,這個(gè)解決方案對(duì)于所有情況來(lái)說(shuō)并不完整。 一個(gè)或多個(gè)群集節(jié)點(diǎn)的單一系統(tǒng)損壞在這種情況下,我們假定仲裁磁盤(pán)功能正常,且所有數(shù)據(jù)未受到破壞。 群集中的一個(gè)節(jié)點(diǎn)無(wú)法啟動(dòng) 其他群集節(jié)點(diǎn)則可以正常運(yùn)行。 建議 退出這個(gè)節(jié)點(diǎn)并嘗試找到一個(gè)替代節(jié)點(diǎn)。 向群集中加入新節(jié)點(diǎn)。 群集中的所有節(jié)點(diǎn)都無(wú)法啟動(dòng) 建議 您需要從頭開(kāi)始重新構(gòu)建群集。 所有節(jié)點(diǎn)都完好,但 Quorum 磁盤(pán)無(wú)法正常工作建議 使用 fixquorum 標(biāo)記來(lái)啟動(dòng)群集服務(wù)(請(qǐng)注意 fixquorum 允許您啟動(dòng)因?yàn)橹俨觅Y源被破壞而無(wú)法在線的群集服務(wù),但它并不能真正為您修復(fù)任何數(shù)據(jù)),然后選擇一個(gè)替代仲裁資源(如果您沒(méi)有其他磁盤(pán)的話,可以使用本地仲裁)。通過(guò)設(shè)置新仲裁,可以在仲裁上創(chuàng)建新的仲裁日志文件,但注冊(cè)表檢查點(diǎn)文件并沒(méi)有恢復(fù),因?yàn)榕f的仲裁已不可用。 Reskit 工具 ClusterRecovery 可以幫助解決這個(gè)問(wèn)題。 請(qǐng)按照“檢查點(diǎn)文件已丟失或損壞”一節(jié)中介紹的過(guò)程來(lái)解決檢查點(diǎn)的問(wèn)題。 其中一個(gè)群集節(jié)點(diǎn)上的群集數(shù)據(jù)庫(kù)已損壞建議 從仲裁磁盤(pán)上復(fù)制最新的檢查點(diǎn)文件 (chkXXX.tmp),并覆蓋受影響節(jié)點(diǎn)上的 %windir%\cluster\clusdb 文件,然后重新啟動(dòng)該服務(wù)。 或者 在另一個(gè)節(jié)點(diǎn)上停止該服務(wù)。使用 RegEdit 卸載該群集單元。 從群集中的一個(gè)正在運(yùn)行的節(jié)點(diǎn)上將 %windir%\cluster\clusdb 文件復(fù)制到受影響節(jié)點(diǎn)上的 %windir%\cluster\clusdb,然后重新啟動(dòng)所有節(jié)點(diǎn)上的群集服務(wù)。 所有節(jié)點(diǎn)都運(yùn)行良好,但仲裁數(shù)據(jù)庫(kù)損壞建議 使用 resetquorumlogfile 開(kāi)關(guān)啟動(dòng)群集服務(wù)。如果所有資源都成功啟動(dòng),并且配置看來(lái)也沒(méi)有問(wèn)題,那么就不需要再執(zhí)行什么操作。通過(guò)設(shè)置新仲裁,可以在仲裁磁盤(pán)上創(chuàng)建新的仲裁日志文件,但注冊(cè)表檢查點(diǎn)文件并沒(méi)有恢復(fù),因?yàn)榕f的仲裁已不可用。 請(qǐng)按照“檢查點(diǎn)文件丟失或損壞”一節(jié)中介紹的過(guò)程來(lái)解決檢查點(diǎn)文件的問(wèn)題。 檢查點(diǎn)文件丟失或損壞如果由于注冊(cè)表檢查點(diǎn)文件損壞而找不到或不能加載該文件,則資源處于在線狀態(tài)時(shí)在注冊(cè)表中可能不具有最新信息。但是這種影響取決于資源,在一些情況下,資源可能無(wú)法返回在線狀態(tài)。在其他情況下,所作的配置更改可能會(huì)丟失。如果檢查點(diǎn)文件丟失,群集服務(wù)并不會(huì)在事件日志中添加一個(gè)事件,因此如果您懷疑存在這個(gè)問(wèn)題的話,就需要查看群集日志。 建議 如果資源無(wú)法返回在線狀態(tài),請(qǐng)使用資源工具包工具 ClusterRecovery 重新創(chuàng)建資源檢查點(diǎn)。 注意:您應(yīng)當(dāng)僅恢復(fù)無(wú)法返回在線狀態(tài)的資源的檢查點(diǎn)文件。 一個(gè)群集磁盤(pán)損壞或無(wú)法正常工作建議 如果磁盤(pán)已被強(qiáng)行卸下,可能需要運(yùn)行 chkdsk 以便使該磁盤(pán)返回聯(lián)機(jī)狀態(tài)。當(dāng)磁盤(pán)返回聯(lián)機(jī)狀態(tài)時(shí),群集服務(wù)會(huì)自動(dòng)運(yùn)行 chkdsk。在 Windows Server 2003 中,一條 chkdsk 日志記錄會(huì)被保留,以便您可以了解磁盤(pán)處于什么狀態(tài)以及發(fā)現(xiàn)了什么問(wèn)題。如果磁盤(pán)上的應(yīng)用程序數(shù)據(jù)已被損壞或刪除,而您又沒(méi)有備份,那么就無(wú)法恢復(fù)數(shù)據(jù)。您必須重新生成數(shù)據(jù)或是重新構(gòu)建應(yīng)用程序。服務(wù)器群集不會(huì)向用戶提供數(shù)據(jù)保護(hù)和冗余,您應(yīng)當(dāng)使用冗余硬件(鏡像磁盤(pán)或 RAID 磁盤(pán)),并經(jīng)常備份數(shù)據(jù)。 群集備份的最佳做法建議本節(jié)簡(jiǎn)要介紹了完成一致的群集備份的建議步驟。 我們建議您在對(duì)群集進(jìn)行重大配置更改的前后進(jìn)行一次備份。必須執(zhí)行以下所有步驟。 1. 使用一個(gè) ASR 備份定期備份每個(gè)節(jié)點(diǎn)的系統(tǒng)狀態(tài),必須在節(jié)點(diǎn)上運(yùn)行群集服務(wù),以便正確記錄群集磁盤(pán)的磁盤(pán)信息。 這實(shí)際上是備份節(jié)點(diǎn)的系統(tǒng)狀態(tài)數(shù)據(jù)。您目前尚不能備份所有共享磁盤(pán)上的數(shù)據(jù),只能備份本地承載的磁盤(pán)上的數(shù)據(jù)。 要執(zhí)行恢復(fù)操作,備份文件必須可以從本地獲取或者使用 PXE 啟動(dòng)獲取??梢酝ㄟ^(guò)網(wǎng)絡(luò)進(jìn)行 ASR。如果在 ASR 期間進(jìn)行磁盤(pán)維護(hù),則需要重新啟動(dòng)計(jì)算機(jī),然后重新啟動(dòng) ASR 過(guò)程。重新啟動(dòng)的消息并不會(huì)警告您必須重新啟動(dòng) ASR 操作。備份支持在 ASR 期間加載非原裝驅(qū)動(dòng)程序 (in-the-box driver),但僅限于 HCL 中的驅(qū)動(dòng)程序/設(shè)備。 2. 請(qǐng)單獨(dú)備份節(jié)點(diǎn)承載的所有群集磁盤(pán)(只能備份所有的磁盤(pán))。 將所有群集磁盤(pán)備份保存到網(wǎng)絡(luò)共享中可方便進(jìn)行管理。這些備份不應(yīng)是整個(gè)備份。如果附加到現(xiàn)有備份后面會(huì)導(dǎo)致備份損壞,則通過(guò)單獨(dú)保存每個(gè)節(jié)點(diǎn)的備份就可以降低丟失全部?jī)?nèi)容的風(fēng)險(xiǎn)。應(yīng)將系統(tǒng)狀態(tài)和系統(tǒng)磁盤(pán)包含在這些備份中,這樣才可以完整備份使用備份基礎(chǔ)結(jié)構(gòu)的 WINS、DHCP 以及其他服務(wù)。系統(tǒng)狀態(tài)/系統(tǒng)磁盤(pán)/仲裁設(shè)備的備份集可以使用,但 ASR 軟盤(pán)可能需要人工進(jìn)行更新才能夠使用這些備份集,或者必須執(zhí)行 ASR,然后才可以從群集磁盤(pán)備份集中恢復(fù)系統(tǒng)狀態(tài)/系統(tǒng)磁盤(pán)。 3. 請(qǐng)按照應(yīng)用程序的特定備份說(shuō)明來(lái)備份應(yīng)用程序。 本文出自 51CTO.COM技術(shù)博客 |
|
|
來(lái)自: 農(nóng)夫子oice > 《群集》