簡(jiǎn)介 戰(zhàn)場(chǎng)中精密傳感器網(wǎng)絡(luò)的激增帶來(lái)了海量數(shù)據(jù),如何通過(guò)新的數(shù)據(jù)處理方式快速融合、利用并將大數(shù)據(jù)轉(zhuǎn)化為指導(dǎo)行動(dòng)的情報(bào),進(jìn)而為指揮控制提供支持成為大數(shù)據(jù)軍用領(lǐng)域的一個(gè)研究重點(diǎn)。美國(guó)太空與海戰(zhàn)系統(tǒng)司令部人員發(fā)表的論文《指揮控制系統(tǒng)中的大數(shù)據(jù)決策支持》(Big Data Decision Support in Command and Control Systems )探討了大數(shù)據(jù)環(huán)境下實(shí)現(xiàn)指揮控制決策支持的方法,同時(shí)以V-22 “魚(yú)鷹”傾轉(zhuǎn)旋翼機(jī)為例,探討了通過(guò)監(jiān)視、收集和分析系統(tǒng)裝備的數(shù)據(jù),保證資產(chǎn)準(zhǔn)備就緒程度和最大利用率,從而確保成功執(zhí)行指揮控制任務(wù)。本文編譯了該論文的主要內(nèi)容。 1 應(yīng)用大數(shù)據(jù)的指揮控制決策支持 美國(guó)太空與海戰(zhàn)系統(tǒng)司令部(SPAWAR)Dean Lee等發(fā)表的論文《指揮控制系統(tǒng)中的大數(shù)據(jù)決策支持》一文認(rèn)為,使用大數(shù)據(jù)工具有可能實(shí)現(xiàn)對(duì)快速?zèng)Q策的支持。大數(shù)據(jù)能夠作為計(jì)劃過(guò)程的組成部分,確保資產(chǎn)為執(zhí)行任務(wù)作好準(zhǔn)備;在作戰(zhàn)過(guò)程中,大數(shù)據(jù)工具能夠?yàn)樾袆?dòng)方案的各種選項(xiàng)快速分析信息。論文描述了在大數(shù)據(jù)環(huán)境下,通過(guò)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)檢索和分析算法這種三管齊下的方法實(shí)現(xiàn)指揮控制決策支持。 1.1 數(shù)據(jù)存儲(chǔ) 聚合并存儲(chǔ)不同數(shù)據(jù)來(lái)源的能力對(duì)于任何指揮控制系統(tǒng)都極其重要。特別是,隨著大量數(shù)據(jù)輸入系統(tǒng),必須為每條數(shù)據(jù)確定適當(dāng)?shù)拇鎯?chǔ)機(jī)制。在作戰(zhàn)指揮控制環(huán)境中,結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)往往同時(shí)存在,指揮控制存儲(chǔ)系統(tǒng)必須支持各種數(shù)據(jù)庫(kù)技術(shù)才能有效和高效地存儲(chǔ)數(shù)據(jù)。 為了應(yīng)對(duì)各種各樣不同數(shù)據(jù)庫(kù)技術(shù)的挑戰(zhàn),本文提出了一種系統(tǒng)設(shè)計(jì),可以透明地維護(hù)不同的數(shù)據(jù)庫(kù)技術(shù)。首先,定義一個(gè)統(tǒng)一的數(shù)據(jù)輸入層,無(wú)論實(shí)際的存儲(chǔ)技術(shù)是什么,所有數(shù)據(jù)來(lái)源都可以與系統(tǒng)交互。其次,在系統(tǒng)內(nèi)部(在數(shù)據(jù)輸入層之后),開(kāi)發(fā)一套針對(duì)特定技術(shù)的攝取器,以便在數(shù)據(jù)進(jìn)入系統(tǒng)時(shí)使用適當(dāng)?shù)拇鎯?chǔ)機(jī)制;另外,將其他數(shù)據(jù)清理和轉(zhuǎn)換規(guī)則封裝為攝取器的一部分,用于檢測(cè)和糾正格式錯(cuò)誤的數(shù)據(jù)。最后,將路由層嵌入到數(shù)據(jù)輸入層中,當(dāng)原始數(shù)據(jù)進(jìn)入時(shí),系統(tǒng)可以自動(dòng)將正確的攝取器與數(shù)據(jù)關(guān)聯(lián)起來(lái)。 1.2 高效的數(shù)據(jù)檢索 快速?zèng)Q策的基礎(chǔ)是數(shù)據(jù)的可用性以及快速檢索相關(guān)數(shù)據(jù)位的能力。上節(jié)描述的后端存儲(chǔ)的異構(gòu)性能夠以一種優(yōu)化的方式存儲(chǔ)不同類(lèi)型的數(shù)據(jù)。例如,盡管可以將自由格式的文本數(shù)據(jù)直接存儲(chǔ)在分布式文件系統(tǒng)(HDFS)中并通過(guò)Solr進(jìn)行索引,但是如果需要,高度結(jié)構(gòu)化的傳感器數(shù)據(jù)應(yīng)存儲(chǔ)在Accumulo、HBase或者甚至是SQL等數(shù)據(jù)庫(kù)中。 從數(shù)據(jù)提取的角度來(lái)說(shuō),不應(yīng)要求用戶(hù)關(guān)注實(shí)際的數(shù)據(jù)存儲(chǔ)機(jī)制。因此,必須有一個(gè)數(shù)據(jù)查詢(xún)機(jī)制,通過(guò)該機(jī)制,數(shù)據(jù)請(qǐng)求將自動(dòng)路由到適當(dāng)?shù)暮蠖舜鎯?chǔ),并且以與數(shù)據(jù)存儲(chǔ)無(wú)關(guān)的方式將數(shù)據(jù)檢索出來(lái)。 盡管系統(tǒng)支持異構(gòu)存儲(chǔ),但是為每種存儲(chǔ)技術(shù)開(kāi)發(fā)相應(yīng)的模式以保持最佳性能仍十分重要。對(duì)于大數(shù)據(jù)存儲(chǔ),一個(gè)流行的觀點(diǎn)是在讀取之前假定數(shù)據(jù)模式,這意味著數(shù)據(jù)以blob形式存儲(chǔ),并且僅在查詢(xún)時(shí)才施加結(jié)構(gòu)。對(duì)于任何系統(tǒng),尤其是大數(shù)據(jù)系統(tǒng),為了保持最佳的查詢(xún)性能,數(shù)據(jù)模式是絕對(duì)有必要的。如果系統(tǒng)知道數(shù)據(jù)是如何存儲(chǔ)的,那么系統(tǒng)就可以制定有效且有用的查詢(xún)來(lái)檢索該數(shù)據(jù)片段。為了使指揮控制系統(tǒng)在異構(gòu)存儲(chǔ)環(huán)境中能高效運(yùn)行,必須不斷監(jiān)視和優(yōu)化后端存儲(chǔ),并且能夠以不同的模式存儲(chǔ)重復(fù)數(shù)據(jù),這樣在任何情況下都能夠以最佳效能檢索數(shù)據(jù)。 圖2描述了有關(guān)數(shù)據(jù)請(qǐng)求流的系統(tǒng)視圖。圖中的實(shí)線箭頭表示數(shù)據(jù)請(qǐng)求路徑;請(qǐng)注意,還有一個(gè)路由層可以自動(dòng)將請(qǐng)求重定向到適當(dāng)?shù)臄?shù)據(jù)庫(kù)。虛線箭頭表示數(shù)據(jù)的返回路徑。這張圖描繪了一個(gè)指揮控制系統(tǒng),其中數(shù)據(jù)存儲(chǔ)區(qū)對(duì)最終用戶(hù)完全透明,但同時(shí)仍保留了利用各種數(shù)據(jù)庫(kù)進(jìn)行有效數(shù)據(jù)檢索的好處。 圖2 輸出數(shù)據(jù)流的系統(tǒng)視圖 1.3 分析 大數(shù)據(jù)指揮控制決策支持的最后一部分是分析能力。本節(jié)辨析了在線分析和離線分析,描述了每種方法的優(yōu)缺點(diǎn)。有效的指揮控制決策需要這兩種分析方法的結(jié)合。 在線分析提供了在數(shù)據(jù)流入系統(tǒng)時(shí)提供決策支持的能力。在線分析算法能夠即時(shí)對(duì)數(shù)據(jù)片段進(jìn)行操作,從而為指揮官提供快速?zèng)Q策支持??梢灾С诌@個(gè)用例的技術(shù)包括Apache Storm和Apache Flume。這兩種技術(shù)利用體系結(jié)構(gòu)中的企業(yè)服務(wù)總線(ESB),使數(shù)據(jù)片段以消息的形式流經(jīng)系統(tǒng)。在這些在線分析系統(tǒng)中,對(duì)工作的原子單位進(jìn)行了定義,讓數(shù)據(jù)在通過(guò)ESB時(shí)即刻進(jìn)行轉(zhuǎn)換。但是,由于在線分析平臺(tái)的流式傳輸性質(zhì),可以與決策相關(guān)聯(lián)的歷史信息非常有限,因此這種算法的輸出可以被限制為簡(jiǎn)單的二進(jìn)制決策,幾乎沒(méi)有或完全沒(méi)有任何復(fù)雜性。 另一方面,離線分析功能能夠遍歷大量數(shù)據(jù)(包括過(guò)去的決策)以形成新的決策。Apache Spark是支持這種分析類(lèi)型的平臺(tái)之一。更常見(jiàn)的是,將機(jī)器學(xué)習(xí)和人工智能嵌入到這些類(lèi)型的分析算法之中,以便可以從數(shù)據(jù)中提取潛在模式,并可以進(jìn)行精確分析以提供決策支持。此外,分析算法可以為可能的決策生成依據(jù),從而讓最終指揮控制決策者做出明智的決策。但是,由于這些分析算法需要學(xué)習(xí)的數(shù)據(jù)量可能很大,因此算法生成結(jié)果的時(shí)間不確定,可能需要很長(zhǎng)時(shí)間,這讓實(shí)時(shí)決策支持變得不太可能。 2 應(yīng)用大數(shù)據(jù)的裝備維護(hù) 指揮控制結(jié)構(gòu)通常由設(shè)施、裝備、通信、程序和人員組成,這些對(duì)于指揮官有效地計(jì)劃、指揮和控制作戰(zhàn)行動(dòng)都至關(guān)重要。假設(shè)所需的資產(chǎn)都可用于執(zhí)行任務(wù),那么通過(guò)良好的領(lǐng)導(dǎo)能力、流程和系統(tǒng),就可以成功地完成指揮控制任務(wù)。但是,資產(chǎn)準(zhǔn)備就緒程度的降低可能會(huì)影響整個(gè)任務(wù);而對(duì)于高度依賴(lài)于資產(chǎn)的任務(wù),這個(gè)問(wèn)題會(huì)進(jìn)一步放大。因此,作為指揮控制任務(wù)的組成部分,必須始終考慮指揮控制資產(chǎn)的健康狀況,這一點(diǎn)非常重要。 在確定指揮控制規(guī)劃有效性的指標(biāo)時(shí),可增強(qiáng)指揮控制資產(chǎn)準(zhǔn)備就緒程度的技術(shù)和方法很重要卻常常會(huì)被忽略。從歷史上看,資產(chǎn)準(zhǔn)備就緒程度是通過(guò)定期維護(hù)來(lái)實(shí)現(xiàn)的。但是,過(guò)多的維護(hù)活動(dòng)可能會(huì)導(dǎo)致停機(jī)時(shí)間增加,從而影響整個(gè)任務(wù)。一種現(xiàn)代的維護(hù)計(jì)劃方法稱(chēng)為“基于條件的維護(hù)(CBM)”,是根據(jù)資產(chǎn)健康狀況來(lái)確定維護(hù)活動(dòng)。由于解釋和分析資產(chǎn)健康狀況數(shù)據(jù)所需的額外人力和儀器,“基于條件的維護(hù)”需要高昂的成本。此外,隨著時(shí)間的推移所收集到的資產(chǎn)數(shù)據(jù)提供的信息經(jīng)常是錯(cuò)誤的,從而阻礙了有效解決資產(chǎn)準(zhǔn)備度的問(wèn)題。但是,隨著維護(hù)成本的不斷增加,不必要的維護(hù)活動(dòng)會(huì)對(duì)指揮控制任務(wù)的目標(biāo)產(chǎn)生不利影響。 幸運(yùn)的是,近年來(lái)在使用先進(jìn)的分析技術(shù)和能力過(guò)程中,也產(chǎn)生了許多創(chuàng)新,能夠幫助處理“基于條件的維護(hù)”領(lǐng)域中的大量數(shù)據(jù)集。本文以V-22 “魚(yú)鷹”傾轉(zhuǎn)旋翼機(jī)為研究案例,通過(guò)對(duì)V-22的監(jiān)視、收集和分析數(shù)據(jù),以提高其準(zhǔn)備就緒程度,從而確保成功執(zhí)行指揮控制任務(wù)。 圖3描述了V-22自動(dòng)化后勤環(huán)境(ALE)的決策維護(hù)活動(dòng)分析過(guò)程?;赗ESTful Web服務(wù)的數(shù)據(jù)即服務(wù)(DaaS)將與存儲(chǔ)無(wú)關(guān)的數(shù)據(jù)提供給外部使用者;Apache NiFi實(shí)現(xiàn)了一種數(shù)據(jù)消費(fèi)架構(gòu),因此可以將各種類(lèi)型的數(shù)據(jù)攝取到基于Hadoop的數(shù)據(jù)存儲(chǔ)異構(gòu)集合中,其中包括Accumulo和Solr。在DaaS和數(shù)據(jù)攝取層之間,存在一個(gè)通過(guò)Apache Kafka技術(shù)實(shí)現(xiàn)的企業(yè)服務(wù)總線,Apache Kafka技術(shù)能夠在體系結(jié)構(gòu)內(nèi)的各個(gè)子系統(tǒng)之間進(jìn)行代理請(qǐng)求,從而使整個(gè)系統(tǒng)具有模塊化和可大規(guī)模擴(kuò)展的能力。最后,通過(guò)利用Apache Spark和Apache Solr在該系統(tǒng)中實(shí)現(xiàn)分析即服務(wù)(AaaS)。 圖3中所說(shuō)明的實(shí)施方案對(duì)V-22自動(dòng)化后勤環(huán)境的影響是立竿見(jiàn)影的。數(shù)據(jù)使用者不再依賴(lài)本地的臨時(shí)數(shù)據(jù)轉(zhuǎn)換來(lái)滿(mǎn)足他們的需求;相反,該系統(tǒng)將轉(zhuǎn)換邏輯封裝在DaaS中,可以與所有用戶(hù)共享,從而減少了重復(fù)的開(kāi)發(fā)工作。此外,該系統(tǒng)已成為所有數(shù)據(jù)來(lái)源的存儲(chǔ)庫(kù),因?yàn)樵撓到y(tǒng)可用于存儲(chǔ)所有類(lèi)型的數(shù)據(jù),而無(wú)需考慮實(shí)際數(shù)據(jù)類(lèi)型,還能夠有效地將這些數(shù)據(jù)提供給最終用戶(hù)。更重要的是,數(shù)據(jù)來(lái)源的聚合使得該系統(tǒng)可以通過(guò)利用后端中的大量計(jì)算資源,向其用戶(hù)提供分析即服務(wù)。因此,用戶(hù)可以訪問(wèn)由Hadoop生態(tài)系統(tǒng)提供的全部計(jì)算能力,而不必?fù)?dān)心維護(hù)此類(lèi)系統(tǒng)的復(fù)雜性。 此外,這一參考體系結(jié)構(gòu)還有助于通過(guò)歷史數(shù)據(jù)來(lái)檢測(cè)趨勢(shì),并在發(fā)現(xiàn)異常時(shí)提醒維護(hù)人員;這項(xiàng)關(guān)鍵功能能夠幫助“基于條件的維護(hù)”實(shí)現(xiàn)其指揮控制目標(biāo)。此外,這項(xiàng)技術(shù)能夠讓飛行器維護(hù)人員通過(guò)近乎實(shí)時(shí)地自動(dòng)化成本效益分析流程來(lái)做出更快、更合理的決策。最終,不但可以節(jié)省成本,還能提高維護(hù)活動(dòng)的效率。 李曉文編譯自互聯(lián)網(wǎng) 號(hào)內(nèi)搜索功能:點(diǎn)擊菜單【推薦資源】→【號(hào)內(nèi)搜索】→輸入關(guān)鍵詞 |
|
來(lái)自: txgyxzyxc > 《技術(shù)資料》