小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

知識圖譜應(yīng)用研究

 印度阿三17 2021-02-27

同濟(jì)大學(xué) zhou xiaohan對知識圖譜的應(yīng)用情況進(jìn)行了系統(tǒng)性研究,發(fā)表在CCEAI2020的會議上,這里是個(gè)簡單的翻譯。

?

摘要: 知識圖譜,將信息表示為語義圖,已經(jīng)引起了工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。 它們提供語義結(jié)構(gòu)化信息的特性為許多任務(wù)(包括回答問題,推薦和信息檢索)帶來了重要的可能解決方案,并被認(rèn)為為開發(fā)更多智能機(jī)器提供了廣闊的前景。 自Google自2012年提出該術(shù)語以來,盡管知識圖譜已經(jīng)在各種商業(yè)和科學(xué)領(lǐng)域中支持多種“大數(shù)據(jù)”應(yīng)用程序,但之前沒有進(jìn)行過系統(tǒng)的研究來對知識圖的應(yīng)用進(jìn)行系統(tǒng)地回顧。 因此,與專注于知識圖的構(gòu)建技術(shù)的其他相關(guān)工作不同,本論文旨在對源自不同領(lǐng)域的這些應(yīng)用程序進(jìn)行首次調(diào)查。 本文還指出,盡管近年來在應(yīng)用知識圖的強(qiáng)大功能(將語義結(jié)構(gòu)化信息提供到特定領(lǐng)域)方面取得了重要進(jìn)展,但仍有幾個(gè)方面有待探索。

?

1.引言

近年來,知識圖(KG)已成為許多需要訪問結(jié)構(gòu)化知識的信息系統(tǒng)的基礎(chǔ)。 語義Web的概念可以追溯到2001年Berners Lee的研究[1]。Berners-Lee在他的工作中提出了諸如統(tǒng)一資源標(biāo)識符(URI),資源描述框架(RDF)和Web本體論之類的技術(shù)標(biāo)準(zhǔn)。 語言(OWL)應(yīng)得到促進(jìn)和發(fā)展。
一些研究通過在早期使用RDF標(biāo)準(zhǔn)來促進(jìn)基于圖形的知識表示。 這些圖中的節(jié)點(diǎn)表示實(shí)體,并且它們通過表示關(guān)系的邊連接。 關(guān)系集可以以定義它們之間的相關(guān)性和使用限制的模式或本體進(jìn)行組織。
鏈接數(shù)據(jù)[2]的概念于2009年問世。提出了在語義Web中將不同的數(shù)據(jù)集相互鏈接的概念,以使它們被視為一個(gè)大的全局知識圖。 到2014年,在鏈接開放數(shù)據(jù)云中大約有1000個(gè)數(shù)據(jù)集相互鏈接,它們之間的大多數(shù)鏈接都連接相同的實(shí)體[3]。
Google在2012年提出了一項(xiàng)名為“知識圖”的新技術(shù),可以在網(wǎng)絡(luò)搜索中使用語義知識。 Google的知識圖譜用于識別和消除文本中的實(shí)體,以語義結(jié)構(gòu)化的摘要豐富搜索結(jié)果,并在探索性搜索中提供指向相關(guān)實(shí)體的鏈接,以提高搜索引擎的能力并增強(qiáng)用戶的搜索體驗(yàn)。 用戶。 此后,許多其他公司開始開發(fā)自己的知識圖。 例如,由Microsoft開發(fā)的搜索引擎Bing已與類似的知識圖Satori集成在一起。 如今,“知識圖”還指的是語義Web知識庫,例如DBpedia [4],YAGO [5],Wikidata或Freebase [6]。

知識圖已引起工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。 它們提供了可以由計(jì)算機(jī)解釋的語義結(jié)構(gòu)化信息,并且這種特性被認(rèn)為為許多人構(gòu)建更智能的機(jī)器提供了廣闊的前景。 關(guān)于知識圖的許多評論都集中在構(gòu)造技術(shù)上[7-8],盡管知識圖已經(jīng)支持了各種商業(yè)和科學(xué)領(lǐng)域中的多個(gè)“大數(shù)據(jù)”應(yīng)用程序,但是沒有關(guān)于知識圖的應(yīng)用的評論。 因此,本文的主要貢獻(xiàn)是對知識圖的應(yīng)用進(jìn)行了首次調(diào)查。
本文的結(jié)構(gòu)如下。 第2節(jié)介紹了KG在其中的應(yīng)用。第3節(jié)介紹了我們的結(jié)論。

2.應(yīng)用

知識圖技術(shù)是Google提出的,近年來引起了很多研究關(guān)注。 KG的研究可分為兩類:KG的構(gòu)建技術(shù)研究和KG的應(yīng)用。 關(guān)于構(gòu)建技術(shù)的研究集中在圖形[7]中知識的提取,表示,融合和推理上,例如在從非結(jié)構(gòu)化文本中提取實(shí)體和關(guān)系并從此類KG推理新事實(shí)之后,正確地將實(shí)體和關(guān)系鏈接到KG。 在對應(yīng)用程序的研究中,強(qiáng)調(diào)將KG應(yīng)用于實(shí)際系統(tǒng)和特定領(lǐng)域。 本文對知識圖的應(yīng)用進(jìn)行了系統(tǒng)的調(diào)查。
根據(jù)我們目前的調(diào)查,大多數(shù)致力于將KG應(yīng)用于特定領(lǐng)域的論文都將其興趣放在了問答系統(tǒng),推薦系統(tǒng)和信息檢索系統(tǒng)上,這些將在本文的第2.1節(jié)至第2.3節(jié)中介紹。 第2.4節(jié)介紹了幼稚園在醫(yī)療,金融,網(wǎng)絡(luò)安全,新聞和教育等領(lǐng)域具有廣闊應(yīng)用前景的特定領(lǐng)域。 第2.5節(jié)介紹了適用于KG的其他一些可能性,例如社交網(wǎng)絡(luò)或分類。 圖1給出了KGs應(yīng)用領(lǐng)域的分類。


?

2.1。 問答系統(tǒng)KG的語義信息可用于增強(qiáng)語義意識問答(QA)服務(wù)中的搜索結(jié)果。 Watson是一個(gè)使用YAGO和DBpedia等知識庫作為數(shù)據(jù)源的問題回答系統(tǒng),是IBM開發(fā)的,旨在擊敗Jeopardy程序中的人類專家,該程序可以用來展示KG的這種價(jià)值[9]。 結(jié)構(gòu)化知識也是社交聊天機(jī)器人和數(shù)字助理(例如XiaoIce [10],Cortana和Siri)的重要組成部分。
關(guān)于問答系統(tǒng)的許多研究都使用Freebase作為知識來源并在WebQuestion上測試其系統(tǒng),包括5,810個(gè)問答對[11]或包含超過10萬個(gè)簡單問題的問答系統(tǒng),可以通過提取單個(gè)事實(shí)來回答[12]。
KG上的傳統(tǒng)QA系統(tǒng)可分為三類:基于語義解析,基于信息檢索和基于嵌入。 近年來,深度學(xué)習(xí)方法與傳統(tǒng)方法相結(jié)合,以提高基于KG的QA系統(tǒng)的性能。
2.1.1。 基于語義解析。 基于語義分析的QA系統(tǒng)致力于將自然語言問題轉(zhuǎn)換為可以表達(dá)整個(gè)查詢語義的邏輯形式。 然后,解析結(jié)果用于生成結(jié)構(gòu)化查詢(例如SPARQL)以搜索知識庫并獲得答案。 Bercant等。 [11]使用Freebase在短語和謂語之間構(gòu)建粗略映射。 然后,它們在給定問題中采用所有謂詞,包括相鄰謂詞和通過橋接操作基于它們生成的其他謂詞,以生成準(zhǔn)確的查詢并獲得正確的答案。 Fader等。 [13]將問題分解為一組較小的相關(guān)問題,并將每個(gè)小問題映射到查詢中以找到其相應(yīng)的答案。
然后,他們將所有答案組合在一起,以回答給定的問題。 語義解析方法在處理復(fù)雜問題時(shí)表現(xiàn)出良好的性能。 但是,它依賴于語義解析器的大型手工功能,這限制了應(yīng)用程序域及其方法的可伸縮性。

?

2.1.2。 基于信息檢索。 基于信息檢索的質(zhì)量保證系統(tǒng)嘗試將自然語言問題自動(dòng)轉(zhuǎn)換為結(jié)構(gòu)化查詢。 然后他們從知識庫中檢索出一組候選答案。 最后,分別提出問題和候選者的特征以對這些候選者進(jìn)行排名,并提出從中識別正確答案的提議。 這種方法與自然語言問題的語義無關(guān),僅在處理簡單查詢時(shí)就取得了良好的效果。 例如,在[14]中,從給定問題中提取語言信息,例如疑問詞,問題焦點(diǎn),疑問動(dòng)詞和問題主題,以將該問題轉(zhuǎn)換為問題特征圖。 然后,形成由主題節(jié)點(diǎn)和Freebase中其他相關(guān)節(jié)點(diǎn)組成的主題圖,將主題圖中的每個(gè)節(jié)點(diǎn)視為候選答案。 最后,將從候選答案和主題圖提取的特征進(jìn)行組合,以從候選答案中識別出正確的特征。 此方法依靠規(guī)則和依存關(guān)系解析結(jié)果來提取問題的手工特征。

?

2.1.3。 基于嵌入。 研究工作[15]是基于嵌入的QA系統(tǒng)的示例。 作者從學(xué)習(xí)給定問題和實(shí)體的低維向量嵌入開始。 然后,他們將Freebase的類型關(guān)聯(lián)起來,以計(jì)算問題和候選答案之間的相似性得分。 最后,具有最高相似度分?jǐn)?shù)的候選人將被視為最終答案。 研究工作[16]也以嵌入為核心。 它對不完善的標(biāo)記訓(xùn)練數(shù)據(jù)表現(xiàn)出誘人的適應(yīng)性。 此外,它提出了一種微調(diào)基于嵌入的模型,然后不斷提高性能的方法。 這樣的成就取決于對嵌入空間中采用的相似性進(jìn)行參數(shù)化的矩陣的精心優(yōu)化。 與語義解析方法和信息檢索方法相比,矢量建模方法在沒有任何手工特征或訓(xùn)練過程中用于詞性標(biāo)記,句法或依存關(guān)系解析的附加系統(tǒng)的情況下,具有競爭優(yōu)勢。 但是,它會忽略字序信息,并且無法處理復(fù)雜的問題。

?

2.1.4。 基于深度學(xué)習(xí)。 隨著自然語言處理領(lǐng)域中深度學(xué)習(xí)的飛速發(fā)展,許多研究開始通過使用深度學(xué)習(xí)方法來改善傳統(tǒng)方法的性能,并取得了良好的效果。 董等。 [17]使用多列卷積神經(jīng)網(wǎng)絡(luò)(MCCNN)進(jìn)行信息檢索,而無需依賴手工制作的功能和規(guī)則。 他們使用分?jǐn)?shù)層根據(jù)問題和候選答案的表示對候選答案進(jìn)行排名。 郝等。 [18]提供了一種具有交叉注意機(jī)制的端到端神經(jīng)網(wǎng)絡(luò)模型,該模型考慮了各種候選答案方面來表示問題及其相應(yīng)的分?jǐn)?shù)。 Yih等。 [19]認(rèn)為傳統(tǒng)語義分析的方法在很大程度上與知識庫分離。 受到信息檢索方法和嵌入方法的啟發(fā),他們減少了語義解析來查詢圖的生成,并將其表達(dá)為一個(gè)階段式搜索問題,以充分利用知識庫中的知識。 他們還應(yīng)用深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型在早期階段利用知識庫來修剪搜索空間,從而簡化了語義匹配問題。 張等。 [20]提出了一種基于注意力的雙向長期短期記憶(BiLSTM),以學(xué)習(xí)使用嵌入方法時(shí)問題的表示形式。 實(shí)驗(yàn)結(jié)果表明,他們的方法是有效的,并且具有表達(dá)正確的問題信息的能力。

?

2.1.5。 更復(fù)雜的任務(wù)。 近年來,一些研究還集中在更復(fù)雜的質(zhì)量檢查任務(wù)上。與其他專注于事實(shí)提取QA的工作不同,研究工作[21]專注于多跳生成任務(wù)。 根據(jù)這項(xiàng)工作,使用具有多注意機(jī)制的模型來執(zhí)行多跳推理,并由指針生成器解碼器合成答案。 這項(xiàng)工作還提出了一種方法,該方法通過使用從ConceptNet中選擇的扎根多跳關(guān)系常識信息來填補(bǔ)上下文跳之間的推理空白。 著作[22]專注于包含兩種語言的Code-Mix簡單問題QA。 它提出了Triplet-Siamese-Hybrid CNN(TSHCNN)來對候選答案進(jìn)行重新排序,并使用K-Nearest和雙語嵌入進(jìn)行語言轉(zhuǎn)換。

?

2.2。 推薦系統(tǒng)隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,商品,電影和新聞等在線內(nèi)容的大量涌現(xiàn)成為用戶的嚴(yán)重問題。 在這種環(huán)境下出現(xiàn)的推薦系統(tǒng)減輕了個(gè)人面臨的信息過載。 協(xié)作過濾(CF)是一種傳統(tǒng)的推薦方法,可根據(jù)用戶的共同偏好和歷史互動(dòng)來執(zhí)行推薦。 但是,這種方法通常會遭受用戶數(shù)據(jù)稀疏(例如,用戶與項(xiàng)目之間的互動(dòng))以及冷啟動(dòng)問題的困擾。 因此,解決這些問題以便通過使用輔助信息來改進(jìn)推薦系統(tǒng)。
最近的研究開始考慮將KG作為輔助信息的來源。 KG中與各種類型的關(guān)系有助于提高推薦者的準(zhǔn)確性,并增加推薦項(xiàng)目的多樣性。 KG還為推薦系統(tǒng)帶來了可解釋性。 通常,大多數(shù)基于KG的推薦系統(tǒng)的現(xiàn)有構(gòu)建方法可以分為基于嵌入的方法和基于路徑的方法。

?

2.2.1。 基于嵌入。 在推薦系統(tǒng)中利用KG的一種可行方法是基于嵌入的方法,該方法通過知識圖嵌入(KGE)算法對KG進(jìn)行預(yù)處理,并將學(xué)習(xí)到的實(shí)體嵌入應(yīng)用于推薦框架。 DKN [23]是一種基于CNN的方法,建議將實(shí)體嵌入與單詞嵌入相結(jié)合以進(jìn)行新聞推薦。 張等。 [24]提出了一個(gè)統(tǒng)一的貝葉斯框架,其中CF模塊與項(xiàng)目的文本嵌入,圖像嵌入和知識嵌入相結(jié)合。 著作[25]通過使用深層的自動(dòng)編碼器進(jìn)行推薦,開發(fā)了社交,個(gè)人資料和情感的多個(gè)網(wǎng)絡(luò)。 Wang等。 [26]設(shè)計(jì)了一個(gè)交叉和壓縮單元,以自動(dòng)在KGE任務(wù)和推薦任務(wù)之間共享潛在特征,并學(xué)習(xí)推薦系統(tǒng)中的項(xiàng)目與KG中的實(shí)體之間的高級交互。
盡管基于嵌入的方法在將KG應(yīng)用于推薦系統(tǒng)中表現(xiàn)出很高的靈活性,但它們幾乎不能包含文本期望的輔助信息。 同樣,基于嵌入的方法的常用KGE算法也不適合推薦。
2.2.2。 基于路徑。 稱為基于路徑的方法的另一種更自然,更直觀的方法是直接設(shè)計(jì)圖算法,以探索KG中節(jié)點(diǎn)之間的各種連接模式,以提供有關(guān)建議的其他信息。 在研究工作中,KG被認(rèn)為是基于異構(gòu)信息的網(wǎng)絡(luò)[27]。 在這項(xiàng)工作中,從KG中提取了基于元圖/元路徑的潛在特征,以表示沿著不同類型的關(guān)系圖/路徑的項(xiàng)和用戶之間的鏈接。 Wang等。 [28]采用LSTM網(wǎng)絡(luò)通過組合實(shí)體和關(guān)系的語義來生成路徑表示,并通過利用路徑中的順序依存關(guān)系對路徑進(jìn)行有效的推理。
盡管此方法更自然,直觀地使用了KG,但它嚴(yán)重依賴于手工設(shè)計(jì)的元路徑,這些元路徑在實(shí)踐中難以優(yōu)化,并且在某些實(shí)體及其關(guān)系不在一個(gè)特定范圍內(nèi)的特殊情況下無法進(jìn)行設(shè)計(jì) 域,例如新聞推薦。

?

2.2.3。 其他工作。 RippleNet [29]是一種試圖結(jié)合上述兩種方法的優(yōu)點(diǎn)的方法。 它在KG中傳播用戶的潛在偏好,并發(fā)現(xiàn)他們的層次興趣。 它通過傳播偏好信息自然將KGE方法整合到推薦系統(tǒng)中,不需要任何手工設(shè)計(jì)。 但是,這種方法很少關(guān)注關(guān)系。 另外,隨著KG大小的增加,波動(dòng)集的大小可能變得不可預(yù)測,這將導(dǎo)致大量的計(jì)算和存儲開銷。
曹等。 [30]請注意,KG缺少實(shí)體,關(guān)系和事實(shí)是很常見的。
因此,他們在利用KG中的事實(shí)作為輔助數(shù)據(jù)來增強(qiáng)用戶-項(xiàng)目交互的建模之后,基于增強(qiáng)的用戶-項(xiàng)目建模來完成KG中的缺失事實(shí)。

?

2.3。 信息檢索

由于KG的出現(xiàn),當(dāng)今越來越多的基于Web的商業(yè)搜索引擎正在合并KG的實(shí)體數(shù)據(jù)以改善其搜索結(jié)果。 例如,Google合并了Google Plus和Google Knowledge Graph的數(shù)據(jù),而Facebook通過Graph Search在實(shí)體上執(zhí)行搜索任務(wù)。
KG包含有關(guān)實(shí)詞實(shí)體的人類知識的屬性可幫助搜索系統(tǒng)提高其理解查詢和文檔的能力。 一些研究人員致力于研究幼稚園在信息檢索方面的潛力。 面向?qū)嶓w的搜索隨著大型KG的發(fā)展而發(fā)展。 在不同的組件中有很多利用KG語義的可能方法,例如查詢表示,文檔表示和搜索系統(tǒng)排名。
可以通過引入相關(guān)實(shí)體及其文本來擴(kuò)展查詢來改進(jìn)查詢表示。 例如,工作[31]提供了來自實(shí)體本身的功能,并且實(shí)體之間與知識庫之間的鏈接(例如結(jié)構(gòu)化屬性和文本)用于豐富查詢。
通過將帶注釋的實(shí)體添加到文檔的向量空間模型中,可以豐富文檔的表示形式。 在研究工作中[32],從查詢和文檔的實(shí)體注釋中生成實(shí)體包向量來表示它們。 然后,文檔之間的輸出匹配和實(shí)體空間中的查詢用于對文檔進(jìn)行排名。 著作[33]將查詢和文檔建模為一組語義概念,這些語義概念是通過實(shí)體鏈接系統(tǒng)運(yùn)行它們而獲得的。
另一種方法是通過相關(guān)實(shí)體建立從查詢到文檔的其他連接,以改善排名模型。 劉等。 [34]將查詢和文檔都映射到一個(gè)高維潛在實(shí)體空間,其中每個(gè)維度都對應(yīng)一個(gè)實(shí)體,然后根據(jù)查詢和文檔對潛在空間中每個(gè)維度的投影來估計(jì)查詢和文檔之間的相關(guān)性。 熊等。 [35]有助于捕獲更多的語義相關(guān)性模式。 在他們的工作中,實(shí)體和單詞表示形式之間的交叉匹配通過四向交互而結(jié)合在一起。
雖然結(jié)合了來自幼稚園的人類知識的面向?qū)嶓w的搜索在信息檢索系統(tǒng)中顯示出令人鼓舞的結(jié)果,但深度學(xué)習(xí)技術(shù)使從大規(guī)模訓(xùn)練數(shù)據(jù)中學(xué)習(xí)更復(fù)雜的排名模型成為可能。 研究工作[36]將KG引入了神經(jīng)搜索系統(tǒng)。 它將KG的語義集成到其實(shí)體的分布式表示中,并通過基于交互的神經(jīng)排名網(wǎng)絡(luò)對文檔進(jìn)行排名。

?

2.4。 特定領(lǐng)域的2.4.1。 醫(yī)療的。 在醫(yī)療保健信息爆炸性增長的同時(shí),文本醫(yī)療知識(TMK)在醫(yī)療保健信息系統(tǒng)中占有越來越重要的地位。 因此,一些研究開發(fā)了TMK并將其集成到知識圖中,從而為計(jì)算機(jī)提供了正確,快速地檢索和解釋醫(yī)學(xué)知識的方法。 恩斯特(Ernst)等人。 [37]提出了一種自動(dòng)構(gòu)建大型生物醫(yī)學(xué)知識圖的方法。 他們的數(shù)據(jù)源是來自UMLS的實(shí)體詞庫,以及來自不同健康門戶網(wǎng)站的各種科學(xué)出版物和帖子的輸入源,這些門戶無法與健康數(shù)據(jù)集成。 Shi等。 [38]成功地將健康數(shù)據(jù)整合到不同的文本醫(yī)學(xué)知識中。 他們還提供了一種算法,可以對知識圖進(jìn)行無意義的推理,以提高推理結(jié)果的性能。 古德溫(Goodwin)等人。 [39]專注于使用i2b2挑戰(zhàn)在2010年提出的框架,將醫(yī)師對斷言的信念狀態(tài)納入病歷中。
Rotmensch等。 [40]提出了一種方法來生成圖表,將疾病映射到癥狀,這可能是由電子病歷(EMR)數(shù)據(jù)自動(dòng)引起的。 他們的數(shù)據(jù)源包括急診科的超過270,000例患者就診的醫(yī)療記錄。
這些構(gòu)建醫(yī)療KG的方法依賴于真實(shí)的標(biāo)準(zhǔn)醫(yī)學(xué)術(shù)語,而某些語言(例如中文)則缺乏這些術(shù)語。 因此,嘗試以這種語言構(gòu)建醫(yī)學(xué)KG總是會收到相對較低的準(zhǔn)確性結(jié)果。 在將來的工作中,仍需要改進(jìn)構(gòu)造算法以解決此類問題。

2.4.2。 網(wǎng)絡(luò)安全。 隨著信息技術(shù)的發(fā)展,信息安全越來越受到社會和行業(yè)的關(guān)注。 KG可以與網(wǎng)絡(luò)安全結(jié)合使用,以檢測和預(yù)測動(dòng)態(tài)攻擊并保護(hù)人們的網(wǎng)絡(luò)資產(chǎn)。 賈等。 [41]使用機(jī)器學(xué)習(xí)建立了一個(gè)網(wǎng)絡(luò)安全知識庫,并提出了一個(gè)五元模型來通過路徑排序算法獲得新知識。 Qi等。 [42]演示了網(wǎng)絡(luò)攻擊步驟,并通過在構(gòu)建KG時(shí)添加事件本體來定義攻擊,事件和警報(bào)之間的關(guān)系。
然后,他們基于一些攻擊步驟具有許多組合,但它們與同一警報(bào)相關(guān)的思想,提出了一種關(guān)聯(lián)分析算法。
上述工作更多地集中在網(wǎng)絡(luò)安全KG的建設(shè)上。 但是,如何利用KG的內(nèi)在知識推理能力有效地檢測網(wǎng)絡(luò)安全事件并利用分析人員的新發(fā)現(xiàn)快速更新KG仍然需要進(jìn)一步研究。
2.4.3。 金融的。 劉等。 [43]通過抓取每家公司的新聞,識別命名實(shí)體并提取相關(guān)股票之間的業(yè)務(wù)關(guān)系來構(gòu)建企業(yè)KG。 他們通過門控經(jīng)常性股(GRU)模型結(jié)合相關(guān)股票的新聞情緒,以預(yù)測股票的價(jià)格走勢。 他們的方法利用股票之間的關(guān)系進(jìn)行預(yù)測,因此如何識別大型KG中它們之間具有強(qiáng)相關(guān)性的股票是一個(gè)需要解決的問題。 文獻(xiàn)[44]提出了一個(gè)開放的,細(xì)粒度的,可自由訪問的KG機(jī)構(gòu)中公司標(biāo)識符的方案。
網(wǎng)絡(luò)安全保險(xiǎn)(CI)主要在為金融行業(yè)提供服務(wù),并協(xié)助金融公司降低網(wǎng)絡(luò)安全風(fēng)險(xiǎn),但這種方式也一直在蓬勃發(fā)展。 保險(xiǎn)供應(yīng)商在對由保險(xiǎn)項(xiàng)目之間的復(fù)雜關(guān)系引起的網(wǎng)絡(luò)事件進(jìn)行分類時(shí)遇到的困難是CI中的一個(gè)問題。 Elnagdy等。 [45]建議結(jié)合知識圖和本體是一種有效的方法來識別CI領(lǐng)域中實(shí)體之間的復(fù)雜關(guān)系。
文獻(xiàn)[46]提出了一種針對網(wǎng)絡(luò)事件的分類模型,稱為SCIC,該模型將語義網(wǎng)中的所有本體鏈接在一起以生成知識表示。

2.4.4。 消息。 通常,新聞是動(dòng)態(tài)的,并且會隨著時(shí)間而變化,新聞?wù)Z言高度凝結(jié),并且充滿知識實(shí)體和常識。 因此,一些研究將KG應(yīng)用于新聞?lì)I(lǐng)域來處理此類字符。 DKN [23]在新聞推薦中采用知識圖表示法來充分發(fā)現(xiàn)新聞之間潛在的知識級聯(lián)系,以便合理地為用戶擴(kuò)展推薦的結(jié)果。 文獻(xiàn)[47]開發(fā)了一種工具,可以從新聞報(bào)道中自動(dòng)構(gòu)建以事件為中心的KG,以各種語言(包括英語,意大利語,荷蘭語和西班牙語)描述世界的變化。 著作[48]聚集了描述事件的非結(jié)構(gòu)化新聞文章和結(jié)構(gòu)化Wiki數(shù)據(jù),以檢索描述事件的新聞文章。
另一方面,假新聞的廣泛傳播可能會對社會產(chǎn)生很大的負(fù)面影響。 假新聞檢測問題被研究工作視為KG中的鏈接預(yù)測任務(wù)[49]。 這項(xiàng)工作從事實(shí)陳述網(wǎng)絡(luò)挖掘異構(gòu)連接模式,以檢查斷言的真實(shí)性。
考慮到新聞總是在國家之間迅速傳播,因此提高某些關(guān)鍵任務(wù)(例如實(shí)體解析和語義角色標(biāo)記)的性能非常必要,尤其是在多語言環(huán)境中。

?

2.4.5。 教育。 在教育領(lǐng)域,一些研究已經(jīng)采用KG來學(xué)習(xí)資源推薦和概念可視化。 KnowEDU [50]是一個(gè)自動(dòng)構(gòu)建用于教育的KG的系統(tǒng)。 與普通KG中的節(jié)點(diǎn)代表共同的現(xiàn)實(shí)世界的實(shí)體不同,教育KG中的所需節(jié)點(diǎn)代表學(xué)習(xí)者應(yīng)掌握的教學(xué)概念。 因此,本研究將遞歸神經(jīng)網(wǎng)絡(luò)(RNN)模型應(yīng)用于教學(xué)數(shù)據(jù),以提取教學(xué)概念。 然后,通過概率關(guān)聯(lián)規(guī)則挖掘算法,利用學(xué)生的成績數(shù)據(jù),確定將教學(xué)概念相互聯(lián)系的教育關(guān)系。 Grévisse等[51]提出了一種推薦和整合學(xué)習(xí)材料到流行創(chuàng)作軟件中的工具。 他們通過擴(kuò)展和過濾策略利用開放式幼兒園的其他信息來構(gòu)建語義表示形式,并為教師確定最重要的概念,然后使用這些概念從開放式語料庫中查找和檢索相關(guān)的學(xué)習(xí)資源。
當(dāng)前的研究總是只關(guān)注基本關(guān)系提取。 更深入和準(zhǔn)確的關(guān)系提取可能有助于顯示教育性KG中更多的潛在數(shù)據(jù)信息。

?

2.5。 其他應(yīng)用程序描述社交網(wǎng)絡(luò)去匿名化和隱私推斷過程是應(yīng)用了KG的另一個(gè)應(yīng)用程序。 這樣的應(yīng)用有助于確定和衡量隱私披露[52]。 在這種情況下,節(jié)點(diǎn)代表用戶,而鏈接代表用戶的關(guān)系。 去匿名化的問題被轉(zhuǎn)換為最大加權(quán)二分匹配問題,并且局部敏感哈希(LSH)被用于隱私推斷。
一些研究人員還考慮使用KG進(jìn)行分類。 張等[53]充分利用更接近生物視覺信息處理模型的知識圖來研究圖像中類別之間的關(guān)系,并結(jié)合語義計(jì)算方法來指導(dǎo)圖像分類任務(wù)。 Ma等[54]通過添加與外部知識集成的組件來改進(jìn)經(jīng)典的LSTM單元,這直接有助于情感分析的方面和情感極性的識別。
雖然主要的地球科學(xué)研究工作集中于處理地理參考的定量數(shù)據(jù),但一些研究人員正在嘗試從文本地球科學(xué)數(shù)據(jù)中提取信息和知識發(fā)現(xiàn)。 這項(xiàng)工作[55]處理地質(zhì)文件并通過無監(jiān)督的學(xué)習(xí)方法直接提取知識。 然后,它通過使用文檔處理和字典擴(kuò)展技術(shù)以及鏈接的開放數(shù)據(jù)來構(gòu)建KG。 但是,這些工作并未實(shí)現(xiàn)知識圖和原始文獻(xiàn)之間的信息檢索。
幼稚園還可以幫助打擊人口販運(yùn)。 為了協(xié)助相關(guān)組織找到販運(yùn)者并幫助受害者,Szekely等人[56]為人口販運(yùn)領(lǐng)域建立了一個(gè)大型的幼稚園。 他們使用不斷從網(wǎng)站上抓取的性交易行業(yè)廣告作為數(shù)據(jù)源,并通過語義技術(shù)協(xié)調(diào)來自不同來源的這些數(shù)據(jù)。
這項(xiàng)工作[57]提出KG可以應(yīng)用于機(jī)器翻譯,這一見解得到了研究工作[58]的支持,該工作通過生成多語言知識圖嵌入來幫助跨語言對齊實(shí)體。

?

3.結(jié)論

據(jù)我們所知,本文是第一個(gè)系統(tǒng)地回顧知識圖的不同應(yīng)用的知識,這些知識圖來自于問題解答,推薦,信息檢索和其他領(lǐng)域等不同領(lǐng)域。 總的來說,我們得出的結(jié)論是,盡管知識圖具有提供語義結(jié)構(gòu)化信息的強(qiáng)大能力,并且近年來在將這種能力應(yīng)用于特定領(lǐng)域方面取得了重要進(jìn)展,但仍有幾個(gè)方面有待探索。
在未來的工作中,我們計(jì)劃通過集成應(yīng)用程序以及基于KG的算法的方法擴(kuò)展來擴(kuò)展此調(diào)查。
?

參考文獻(xiàn)

Zou X. A survey on application of knowledge graph[C]//Journal of Physics: Conference Series. IOP Publishing, 2020, 1487(1): 012016.

來源:https://www./content-4-872151.html

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多