小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

李斌等:基于認知屬性庫的原型范疇研究

 藤原丹陽 2023-10-17 發(fā)布于江西

文章導(dǎo)讀
原型范疇是認知科學(xué)研究中的重要理論,使用屬性來區(qū)分范疇中心成員及邊緣成員有著較強的解釋力,但該理論一直缺乏基于頻率信息的屬性數(shù)據(jù)支撐。該文借助認知屬性庫的23萬條數(shù)據(jù),對原型理論研究中經(jīng)常討論的“鳥”、“水果”、“交通工具”等范疇的典型成員和非典型成員進行分析驗證。認知屬性庫的數(shù)據(jù)顯示,在漢語中,“鳥”的典型成員是“麻雀”、“燕子”等,和“鳥”具有較多的共同屬性;而“企鵝”、“鴕鳥”則只共享了“鳥”很少的屬性,且缺少關(guān)鍵的屬性“飛”。大體上驗證了原型理論的觀點。同時,我們也發(fā)現(xiàn)“小鳥”的屬性特別豐富,具有典型成員的特性。在進一步觀察了“水果”和“交通工具”兩個范疇后,我們探討了范疇的跨類現(xiàn)象,進而從數(shù)學(xué)模型上區(qū)分了樹結(jié)構(gòu)的層次分類體系和圖結(jié)構(gòu)的范疇化體系。
1  引言
原型(Prototype)范疇理論是認知科學(xué)的重要理論,是對古希臘的亞里士多德以充分和必要特征為分類依據(jù)的范疇論[1]的揚棄,是吸收家族相似性理論[2],以行為實驗為依據(jù)而形成的,在認知語言學(xué)研究中占有重要地位。在亞里士多德那里,從對萬事萬物分類的角度出發(fā),主要關(guān)心分類的標(biāo)準(zhǔn),并不區(qū)分同一范疇里面成員的典型性和重要性[1]。二十世紀(jì)上半葉,維特根斯坦[2]的家族相似性(Family Resemblance)理論則從詞語如何判斷為某個范疇的分類依據(jù)出發(fā),認為范疇不是因為共同特性而是因為成員之間重疊交叉的相似性結(jié)合在一起的,范疇中的成員因其與原型的相似性而被認為是范疇的成員。而現(xiàn)代的認知科學(xué)則進一步從人類認知能力的角度考慮,認為范疇內(nèi)的成員有典型性的問題。Rosch[3]使用水果、家具、交通工具、武器、蔬菜和衣服6類共120個常用詞語,對400名大學(xué)生進行行為測試,以證明范疇中最典型的成員具有本范疇成員中最多的共同特征,而與其他范疇的成員具有最少的共同特征。
Rosch[4]進一步研究了基本層次范疇(Basic Level Category)問題,認為:基本層次范疇擁有同一個范疇內(nèi)的大量公共屬性,它在范疇化的過程中最為重要,在兒童語言習(xí)得的過程中最早被范疇化和命名。她用行為實驗的方法,對200位美國大學(xué)生進行測試,對英文中的“bird(鳥)”等9個范疇的典型詞語進行判定。如“鳥”范疇下的“老鷹”、“麻雀”等等,通過觀察下位詞語“禿鷹”、“歌雀”的典型性,進而區(qū)分出上位范疇、基本層次范疇和下位范疇(見表1)。
表1  Rosch對基本層次范疇的實驗材料樣例
上位范疇
基本層次
范疇
下位范疇例詞
bird

cardinal北美主紅雀
easter cardinal復(fù)活節(jié)主紅雀、grey tailed cardinal灰尾主紅雀
eagle老鷹
bald eagle禿鷹、golden eagle金鷹
sparrow麻雀
song sparrow歌雀、field sparrow原野春雀
Rosch[4]做了一系列相關(guān)實驗,包括各種類型的詞語和視覺實驗,結(jié)果發(fā)現(xiàn):在范疇化過程中,范疇內(nèi)的典型成員在共有屬性方面有優(yōu)勢,有些典型成員的重要性甚至超過了上位范疇。從而將典型成員劃為基本層次范疇。
總結(jié)起來,原型范疇理論有四個要點:(1)同一個范疇內(nèi)的成員存在梯度差異,有一些成員是典型的原型(prototypical,譯作原典型)成員,其他成員依靠和原典型成員的相似性得以進入該范疇。(2)特征也是具有梯度的,有的特征是重要的,有的是不重要的。(3)同一范疇內(nèi)的所有成員并不一定存在共同特征,而是呈家族相似性逐步擴散,范疇的邊界也并不明顯。(4)在上位范疇、基本層次范疇和下位范疇中,最重要的范疇是基本層次范疇。
盡管Taylor[5]發(fā)展和完善了原型范疇理論,但該理論仍然存在三個基本問題:(1)屬性特征的選取存在主觀性和隨意性[6]。該理論使用的行為實驗在準(zhǔn)確度、可靠性上來說,是經(jīng)得起驗證的,但是在測試用詞的覆蓋面上顯然存在數(shù)量上的局限。而在使用特征進行論證的時候,特征的數(shù)量很少,往往只是舉例性質(zhì)。行為實驗關(guān)注的是驗證典型性的問題,特征并不是研究的重點。如果能夠?qū)⑦@些特征較為客觀地羅列出來,則可以更好地驗證原型范疇理論。(2)到底存在多少基本層次范疇,是不是在所有的分類層級上都存在基本層次范疇,并不清楚。按照這個理論,“蘋果”是“水果”基本層次范疇中的原典型成員,那么“蘋果”有沒有自己的典型成員,“水果”是否是其上位范疇的“植物”或“瓜果”的典型成員,“植物”是否是“生物”的典型成員,這些問題都值得討論。(3)范疇化是自然認知分類而不是有意識的科學(xué)分類。亞里士多德是科學(xué)分類的代表,層層劃分,每層有明確的分類標(biāo)準(zhǔn)。而自然分類的范疇化過程,是把相似的事物按照家族相似性逐步地歸并在一起。這兩種分類到底會引出哪些問題,應(yīng)該在哪些場景下使用哪種分類方法都是值得探討的問題。
因此,如果能為原型范疇理論提供較為客觀的數(shù)據(jù)支持,在特征的數(shù)量和典型度上予以量化,則可以更好地發(fā)現(xiàn)這個理論存在的問題。過去特別缺乏大規(guī)模的特征屬性數(shù)據(jù)庫,而近年來李斌等[7]、Li等[8]構(gòu)建的漢語認知屬性庫正提供了這樣的量化數(shù)據(jù)。該工作將傳統(tǒng)研究中的聯(lián)想意義和文化意義在認知語言學(xué)的視角下重新定義為日常感知知識之下的認知屬性,從互聯(lián)網(wǎng)上獲取了數(shù)百萬條漢語“像+喻體詞語+一樣+喻底屬性”的原始數(shù)據(jù),人工校對后形成了23萬余條帶有頻率信息的“詞語-屬性”對,如“豬”的“懶”、“笨”、“肥”,“鳥”的“飛”、“自由”等。該庫共覆蓋了82 937個詞語和100 271個屬性,其中具有五種以上屬性的詞語達到6 745個。這個數(shù)據(jù)恰好可以用于驗證詞語的屬性以及范疇化問題。認知屬性提供了詞語概念所具有的屬性,而頻率信息則可以模擬這些屬性的重要程度。
我們使用認知屬性庫校對后的23萬條數(shù)據(jù)及其配套的可視化查詢系統(tǒng),來分析“鳥”、“水果”、“交通工具”這三個前人研究和討論較多且范疇差別較大的語義類別。探討測試詞語的認知屬性這種來自于互聯(lián)網(wǎng)的數(shù)據(jù)能不能用于驗證原型理論,能不能更好地討論原型范疇理論的三個問題。使用認知屬性庫的缺陷是沒有聲音和圖像的表示,比如“鳥”的輪廓信息,難以用文字表達,卻在范疇化過程中扮演重要角色。不過,限于全方位的特征屬性數(shù)據(jù)庫尚未出現(xiàn),本文只嘗試用文字表達的認知屬性來測試原型范疇理論。
2  原典型成員的驗證
要驗證“水果”、“鳥”、“交通工具”三個類別的原典型成員,首先需要像Rosch[3-4]一樣,列出十個左右的常見下位詞和干擾詞,通過上位詞和下位詞認知屬性的匹配程度來確定原典型成員。匹配的屬性數(shù)量越多、頻次越高,則認為典型性越高,反之則越低。進而再觀察成員之間的屬性匹配程度,以驗證家族相似性。
2.1 水果
水果的品種很多,我們選取了十種常見水果,包括“香蕉”、“蘋果”、“梨”、“西瓜”、“橘子”、“桔子”、“橙子”、“桃子”、“草莓”和“葡萄”。希望通過認知屬性庫來觀察人們平時常見的“水果”到底有哪些是典型成員,是“蘋果”的典型性更高,還是“葡萄”更高。另外,人們對“黃瓜”、“西紅柿”到底算不算水果的爭議一直存在,我們將其作為干擾詞一并分析。
表2給出了這些詞語和“水果”一詞的屬性共享情況?!八币辉~有59種屬性;“蘋果”有113種屬性,其中12種和“水果”共有;“葡萄”有78種屬性,其中7種與“水果”重合。
表2  水果詞語的屬性
詞語
共同屬性/
自有屬性
前5個屬性(按頻次降序排列)
水果
59/59
晶瑩剔透118、天然的含糖份102、新鮮80、生吃61、鮮甜47
蘋果
12/113
甜40、美麗21、賣19、挑11、鮮嫩8
葡萄
7/78
水靈靈12、漂亮4、水靈2、晶瑩剔透1、甘甜1
草莓
7/41
甜7、新鮮5、甜美2、成熟2、美味1
西瓜
4/50
吃45、甜11、新鮮6、好吃1
桃子
4/20
美麗16、水靈4、漂亮3、甜1

3/7
好吃2、吃2、甜1
橙子
2/9
甜7、新鮮1
芒果
2/10
甜2、新鮮1
桔子
1/8
甘甜5
香蕉
1/21
甜2
西紅柿
0/10
黃瓜
0/21
番茄
0/6
表2中,按照和“水果”相同的屬性數(shù)量多少計算,水果的典型成員依次為“蘋果、葡萄、草莓、西瓜、桃子、梨、橙子、芒果、桔子、香蕉”,這與前人的研究和普通人的直覺基本相似。雖然“西紅柿、黃瓜、番茄”被排除在外,但它們與“水果”沒有共同屬性,則與直覺有些沖突。其實,在“西紅柿”的10個屬性中,有一個是“甜淡可口(頻次2)”,也近似地擁有“甜”的屬性。而“黃瓜”則沒有“甜”的屬性。如果我們進一步利用認知屬性庫的可視化查詢的功能,將這些詞的屬性同時呈現(xiàn)出來(如圖1),則可以看出一定的家族相似性。“西紅柿”與“蘋果”、“桃子”共有“圓”的屬性,與“蘋果”、“草莓”共有“紅”的屬性。“黃瓜”與“葡萄”共有“綠色”的屬性,與“蘋果”、“梨”共有“脆”的屬性。這大致上可以驗證原型理論的成員梯度差異說?!跋憬丁彪m然是水果,然而屬性統(tǒng)計卻顯示它屬于最不典型的水果。從圖1可以看出,其實“香蕉”和“蘋果”、“桔子”、“梨”都有一些共同屬性,可以印證家族相似性理論。

圖1  水果詞的屬性圖
注:橙色結(jié)點表示概念詞語,黃色結(jié)點表示屬性詞語,橙色連線的粗細代表“概念”和“屬性”之間的強度(同現(xiàn)頻率越高則線條越粗),而線條的長短不表示任何意義。
再從屬性上看,“甜”為我們所觀察的水果類詞語共有(在“橘子”和“桔子”合并的前提下),而“黃瓜”沒有,“甜”似乎具備了劃分類別的能力。但是,(1)“甜”這個屬性并不是“水果”頻次最高的屬性,也不是水果類詞語頻次最高的屬性。(2)“甜”也不是人們對于水果劃類的最主要依據(jù),因為“糖果”等食品也很甜。利用認知屬性的屬性擴展查詢功能,自動生成一個詞圖,包含“水果”、水果的屬性以及具備這些屬性的詞(圖2)。圖上可以看出“水果”和“蛋糕”、“糖果”確實擁有不少共同屬性,以至于位置非常接近?!懊利悺薄ⅰ翱蓯邸?、“飽滿”為多種水果的共同屬性。但是這幾個屬性并沒有被“香蕉”、“西紅柿”所共享。所以,原型理論認為的劃類特征不一定存在的說法仍然是成立的。
值得注意的是:(1)每個詞語還有著大量的屬性沒有和其他水果詞共享;(2)“蘋果”的電子產(chǎn)品意義下的諸多屬性都沒有和其他水果詞共享,在很大程度上也有了詞義消歧的作用。

圖2  “水果”的屬性二級擴展圖
從圖2上看,“水果”和“紅蘋果”、“蘋果”、“草莓”最為接近?!八焙推渌悇e的“蛋糕”、“甜點”、“果凍”等甜食接近,與“陽光”、“雨”、“空氣”、“向日葵”也很接近。這說明,我們在調(diào)查原典型的時候,其實已經(jīng)限定了相似詞語的語義類別,把不是水果的詞排除在外??墒?,如果從口感和視覺上考慮,“水果”和“果凍”確實有很多相似之處。因此,我們認為,典型成員含有較多的共同屬性,但是與其他類別的詞語也可能具有很多共同特征。認知上相似的事物,按科學(xué)分類法則會列入不同的類別。
2.2 鳥
下面我們再對鳥類詞語加以分析。和水果詞相似,我們預(yù)期的有:(1)哪些鳥是典型的鳥,它們有哪些典型特征;(2)“企鵝”和“鴕鳥”是否具備“鳥”的典型特征,是否也呈現(xiàn)出家族相似性。
我們考察的詞語有8種比較典型的鳥:“麻雀”、“老鷹”、“燕子”、“鴿子”、“烏鴉”、“喜鵲”、“鴨子”、“天鵝”,它們作為鳥類的原型范疇。同時以“企鵝”、“鴕鳥”兩種不太典型的鳥作為干擾詞。
表3  鳥類詞語的屬性
詞語
共同屬性/
自有屬性
前5個屬性(按頻次降序排列)

200/200
飛翔1290、飛769、飛來飛去139、自由飛翔126、自由112
老鷹
15/58
翱翔74、飛41、飛翔15、展翅飛翔13、撲10
燕子
15/43
飛51、輕快11、飛來11、輕盈10、飛行8
鴿子
12/53
飛60、飛翔59、展翅高飛47、展翅飛翔10、純潔5
麻雀
11/84
嘰嘰喳喳48、跳躍3、飛5、飛來飛去4、撲1
鴨子
9/114
跳22、叫17、飛11、趴3、撲騰2
天鵝
8/57
振翅高飛25、飛18、飛翔12、歌唱6、展翅高飛1
烏鴉
7/39
飛55、飛翔10、盤旋5、展翅高飛4、叫3
喜鵲
4/15
飛12、嘰嘰喳喳8、吱吱喳喳1、靈活1
企鵝
2/52
跳3、快樂1
鴕鳥
1/69
奔跑10
根據(jù)表3的統(tǒng)計,和“鳥”共有屬性最多的是“老鷹”和“燕子”,都有15個共有屬性。其他依次為“鴿子”、“麻雀”、“鴨子”、“天鵝”、“烏鴉”、“喜鵲”?!捌簌Z”、“鴕鳥”這兩種鳥與“鳥”的共同屬性非常少。這與人們的直覺基本相似,不同的鳥的典型性可以根據(jù)屬性的多少和頻次形成梯度關(guān)系。
除了“企鵝”和“鴕鳥”,其他8種鳥都具有“飛”這個屬性。與水果的“甜”不同,“飛”幾乎位居各種鳥的屬性的前3位,是特別重要的屬性??墒恰膀稹?、“蝴蝶”、“蜻蜓”、“飛機”也會飛,“飛”也很難作為劃類的單獨依據(jù)。我們把這些詞按照屬性生成詞圖(圖3),同樣可以看出,“飛”這一屬性為各種鳥所共有,唯有“企鵝”和“鴕鳥”不具備?!傍B”和“老鷹、烏鴉、燕子、麻雀、鴿子”都具有相當(dāng)多的共同屬性,呈現(xiàn)出家族相似性?!捌簌Z”和“鴨子”具有10種相同的屬性,“搖擺”、“呆”、“笨拙”等等;和“鵝”有4種共同的屬性“笨”、“游”、“快樂”、“點頭”;和“天鵝”共有屬性“優(yōu)美”,和“麻雀”共有屬性“蹦蹦跳跳”?!傍r鳥”和“鴨子”、“燕子”共有屬性“跑”。

圖3  “鳥”類詞語的屬性圖
值得注意的是,“企鵝”和“天鵝”同有“鵝”字,屬性方面的差異卻很大,它們只有一個共同屬性“優(yōu)美”。這與認知語言學(xué)的理論判斷基本一致,也與行為實驗的結(jié)果基本一致,即下位范疇概念的屬性差異可能是較大的。認知屬性庫,實際上也可以看作是一種語言行為實驗的材料,是人們在網(wǎng)絡(luò)上的語言表達所凸顯出來的屬性。

圖4  “鳥”的屬性二級擴展圖
如果從屬性二級擴展圖上觀察(圖4),則與我們預(yù)想的差別較大。和“鳥”最相近的詞有“小鳥”、“水鳥”、“鳥兒”、“候鳥”、“大雁”,這些詞居然都沒在我們之前考察的鳥類詞語之列,這說明范疇化研究在缺少數(shù)據(jù)支撐的條件下,純粹依靠內(nèi)省法選擇實驗材料,可能會存在一定的缺陷。只根據(jù)語義類別來選擇詞語,可能會遺漏屬性高度相關(guān)的詞語。另一方面,“貓”、“魚”、“天使”、“箭”、“蚊子”也呈現(xiàn)出和“鳥”的相似性,但這些相同的屬性并不能從家族相似性那里得到解釋,而應(yīng)看作普通的屬性相同。離開語義分類條件下的語義類家族,就不是家族相似性,而只是普通概念之間的相似性了。
“小鳥、大鳥、候鳥、蜂鳥、水鳥、飛鳥、百靈鳥”也具有大量的屬性?!按篪B”和“小鳥”,用原型理論有點難解釋?!傍B”前面加了定語,它們應(yīng)該屬于下位范疇,可它們具有的屬性數(shù)量較多,特別是“小鳥”的屬性數(shù)量為226個,甚至超過了“鳥”的200個?!靶▲B”的屬性數(shù)量和強度已經(jīng)具備了基本層次范疇的能力。該如何對此進行解釋就成了一個問題。
2.3 交通工具
帶著上面的問題,我們接著來看交通工具類詞語。這里同樣選擇了12種交通工具“車”、“船”、“汽車”、“貨車”、“公交車”、“自行車”、“火車”、“地鐵”、“馬車”、“摩托車”、“飛機”、“輪船”。作為上位范疇的“交通工具”,只有“方便”和“擠”兩個屬性,屬性數(shù)量之少有點出乎意料,所以很難像前兩節(jié)那樣用表格展示,只能直接分析這些交通工具詞語的詞圖(見圖5)。

圖5  交通工具類詞語的屬性圖
從圖5可以看到:(1)認知屬性的數(shù)量不均衡。“車”、“飛機”、“汽車”、“火車”、“地鐵”、“公交車”、“船”、“自行車”的認知屬性都較為豐富。而“馬車”、“摩托車”相對較少。(2)沒有一個屬性是全部詞所共有的。覆蓋度比較高的屬性是“快”、“跑”、“行駛”。交通工具的速度不同,所以“快”沒能覆蓋所有的交通工具。交通工具內(nèi)部差異巨大,而海上、陸上、空中的區(qū)別,也使得駕駛和行進的方式不同。所以,交通工具之間有一些共同屬性,但不是全體所共有的屬性,呈現(xiàn)出一定的家族相似性。(3)相比水果和鳥類詞語,成員之間的屬性共享程度并不高,大多數(shù)詞語的屬性都是獨享的。
上述三個語義類的詞語,基本上驗證了原型理論、家族相似性的基本要點。不過,仍然遺留了一些問題:(1)為什么“交通工具”的認知屬性如此少?(2)“小鳥”和“鳥”到底是什么關(guān)系?(3)“小鳥”是否可以進入基本層次范疇?我們在下一節(jié)集中討論。
3   基本層次范疇與層次分類體系的討論
3.1 分類體系的討論
“交通工具”作為上位范疇的認知屬性少,讓我們對于基本層次范疇有了新的認識。基本層次范疇的原意是相對于上位范疇來說的,人們對一個上位范疇的認知,實際上是通過基本層次范疇中典型的原型成員來完成的。然而,“交通工具”是否屬于其上位范疇的基本層次范疇?我們遇到的“水果”、“鳥”的認知屬性眾多,是否也屬于基本層次范疇?交通工具的上位范疇一般來說是“人造物”,而詞語“人造物”或“人工物”卻只有0個屬性。是不是越抽象、越上層的詞語,其認知屬性也越少?
帶著這些問題,我們重新審視這三個類別的詞語?!八钡纳衔环懂牎爸参铩庇?48個屬性,“鳥”的上位范疇“動物”有116個屬性,“動物”的上位范疇“生物”有46個屬性,屬性的種類依然較多。所以,并非越上層、越抽象的詞語的屬性就越少。那么,問題出在哪里呢?我們當(dāng)然可以說,上位范疇本身不一定需要有很多屬性??墒?,如果不需要很多屬性,那么如何判斷其與基本層次范疇之間的關(guān)系呢?
如果換一個思路來看,原型范疇所采用的層級型(樹形結(jié)構(gòu))的分類體系也許是個牢籠?!敖煌üぞ摺彼坪跤袀€“人造物”的上位范疇,“馬、牛、驢”也曾是農(nóng)業(yè)社會的重要交通工具,也可以納入交通工具的范疇,可它們的上位范疇更應(yīng)該是“動物”。所以,人們的分類體系本身可能是交錯的,而不完全是層級的。再以水果詞語來說,水果里面的“草莓”和“蘋果”,其實差異很大,其宿主一個是草本植物,一個是木本植物。而且,人們只是稱呼這些植物的果實為水果,而不是植物本身。所以“交通工具”和“水果”都是比較交叉的分類或范疇。層層分類的體系,也許并不是人們自然的分類方式,而是至少在亞里士多德那里就開始的二值邏輯的硬性層次分類。相反,人們的自然認知模式可能只是從某一個角度對事物進行范疇化,不是層層分類,而是歸類,把事物歸為一類或幾類。范疇化的歸類過程并不一定具有強烈的排他性,不那么涇渭分明。在很多情況下,范疇化可能只歸為一類,即把具有某些相同屬性或功能的對象統(tǒng)一命名而已。所以,如果按照層次分類方法,“馬”既屬于動物范疇,又屬于交通工具范疇??墒牵绻麙仐墝哟畏诸惙椒?,眾多范疇自然歸類的組織方式更值得探討。
層次分類方法的本質(zhì)是建立分類標(biāo)準(zhǔn),利用二值邏輯建立分類樹。而自然的范疇化則是不斷從新的角度建立新類,新類與原有的類別可能界限分明,也可能有交叉。從離散數(shù)學(xué)建模的角度看,范疇化形成的自然歸類體系,不再適宜采用樹(tree)形結(jié)構(gòu),而應(yīng)使用圖(graph)結(jié)構(gòu)來表示。在圖結(jié)構(gòu)上,范疇和范疇之間可以有關(guān)系,同一個范疇內(nèi)部也可以劃分層次,范疇內(nèi)的成員也可以和其他范疇及成員通過屬性發(fā)生關(guān)系。屬性可以有很多種,關(guān)系也可以有很多種。這種討論看起來并不新鮮,現(xiàn)在流行的語義網(wǎng)(semantic web)和語義網(wǎng)絡(luò)(semantic network)[9]都是基于三元組<概念1,概念2,關(guān)系>構(gòu)成的圖結(jié)構(gòu)。我們并不想否認層次分類方法的作用;相反,基于樹結(jié)構(gòu)的層次分類由于結(jié)構(gòu)性好,使用范圍很廣。我們想強調(diào)的是,人們自然的范疇化并不是樹形的分類體系。正是因為人們自然形成的范疇體系不是樹形結(jié)構(gòu),才需要做好層層分類的樹形分類體系,這種體系從亞里士多德一直做到今天。從這個意義上來說,認知屬性庫中詞和屬性所構(gòu)成的圖,正體現(xiàn)了人們自然形成的范疇化體系。詞和詞之間通過屬性進行關(guān)聯(lián),形成多樣的關(guān)系。認知屬性庫做不到的是確定詞語的上下位關(guān)系。
從這個角度回過頭來討論原型理論,也許更為清楚。人們在創(chuàng)立某一范疇的時候,根據(jù)典型成員來歸納范疇;人們在習(xí)得范疇的時候,也是通過典型成員的共同屬性來習(xí)得;在使用范疇的時候,則依據(jù)典型成員的共同屬性。某一新事物能否進入某范疇,就看能不能和典型成員具備一定的共同屬性。共同屬性多或具備了關(guān)鍵屬性,則接近典型成員;共同屬性少且強度低,則成為邊緣成員,形成梯度的成員集合。只要拋掉層層劃分的等級分類體系,原型范疇理論就會更加自然,不存在分類交叉的矛盾。
3.2 帶權(quán)二部圖
進一步來說,與語義網(wǎng)的三元組不同,認知屬性所構(gòu)成的圖,可以抽象為一個帶權(quán)的二部圖。

圖6  二部圖事例
二部圖(Bipartite Graph)的一般定義是,設(shè)G=(V,E)是一個無向圖。如頂點集V可分割為兩個互不相交的子集V1、V2,并且圖中每條邊依附的兩個頂點都分別屬于這兩個不同的子集,則稱圖G為二部圖。如果每條邊上帶有權(quán)重,則稱為帶權(quán)二部圖[10]。
由帶權(quán)二部圖的定義可知,認知屬性庫的結(jié)構(gòu)與語義網(wǎng)絡(luò)的普通圖之間確實有區(qū)別。認知屬性庫正好分為詞語和屬性兩類,“詞語-屬性”有頻次信息,可以作為權(quán)重,所以是典型的帶權(quán)二部圖。在這個圖上可以做三種基本操作:(1)給定一個詞,可以尋找其屬性;給定一個屬性,也可以尋找具有該屬性的詞。(2)給定一批詞,則可以找到它們的屬性的并集或交集;給定一批屬性,也可以找到具有這些屬性的詞語的并集或交集。(3)給定兩個不同的詞,可以依據(jù)各自的屬性集合判定它們的相似程度;給定兩個不同的屬性,也可以依據(jù)具有一種屬性的詞語集合判定這兩種屬性的相似程度。
所以,原型范疇理論的相關(guān)實驗可以看作第三種操作。即給定兩個詞,判定其相似程度。但是原型范疇理論并不僅止于此,而是附加了層次類的樹形結(jié)構(gòu)。在詞語集合V1中約定了詞語的樹形層次關(guān)系,如“交通工具”的下位詞有“汽車”,“汽車”的下位詞有“小轎車”等各種汽車。然后每個詞語再根據(jù)屬性進行原典型的判定。我們把這種附加了樹形結(jié)構(gòu)的二部圖呈現(xiàn)為圖7。詞語集合的樹形層次關(guān)系,并不是完整的分類體系,而是只有三層:“上位范疇-基本層次范疇-下位范疇”。

圖7  原型范疇的附加樹形結(jié)構(gòu)的二部圖
4   結(jié)論與未來工作
本文就認知科學(xué)和認知語言學(xué)中的原型理論進行了考察,使用認知屬性庫的數(shù)據(jù),對“水果”、“鳥”、“交通工具”三個類別的詞語進行典型性分析。根據(jù)屬性的種類和頻率信息,基本驗證了原型范疇理論。然而,我們也發(fā)現(xiàn)“小鳥”這樣認知屬性豐富的詞語,它也具有典型成員的特性;而“水果”和“交通工具”中存在范疇的跨類現(xiàn)象,進而從數(shù)學(xué)模型上區(qū)分了樹結(jié)構(gòu)的層次分類體系和圖結(jié)構(gòu)的范疇化體系,利用二部圖探討了認知屬性庫和原型理論的模型差異。最后總結(jié)了認知屬性庫對于原型理論和心理學(xué)研究的價值。
我們得到的主要結(jié)論是:(1)認知屬性庫可以用于驗證原型理論關(guān)于原典型成員的界定;(2)原型范疇理論可以用帶樹結(jié)構(gòu)的二部圖來描述;(3)原型理論可以解釋為何構(gòu)建完整的層次分類體系是困難的。依然存在的問題是:(1)在原型理論中,“小鳥”這樣的詞語該如何定位;(2)如何構(gòu)建更好的結(jié)構(gòu)來描寫詞語關(guān)系。
在未來的工作中,我們將繼續(xù)關(guān)注詞義組織方式的研究進展,繼續(xù)構(gòu)建符合人類認知特點且便于計算的詞義知識庫。在認知科學(xué)和語言計算的雙重視野下,進一步研究詞義理論存在的問題,以提出更符合行為實驗和語言材料的數(shù)學(xué)模型。
5   注釋
①中文認知屬性庫的部分數(shù)據(jù)及可視化查詢請訪問http://www./
參考文獻
[1] 亞里士多德 著. 方書春 譯. 范疇篇[M]. 北京:商務(wù)印書館, 1959.
[2] 維特根斯坦 著. 李步樓 譯. 哲學(xué)研究[M]. 北京:商務(wù)印書館, 2000.
[3] Rosch E,Carolyn B. Mervis. Family Resemblances:Studies in the Internal Structure of Categories[J]. Cognitive Psychology. 1975,7:573-605.
[4] Rosch E,Mervis C B,Gray W,et al. Basic Objects in Natural Categories[J]. Cognitive Psychology.1976, 8(3):382-439.
[5] Taylor J. Linguistic Categorization:Prototypes in Linguistic Theory[M], Oxford: Clarendon Press, 1989.
[6] 汪桂英. 原型范疇理論缺陷再議[J]. 廈門大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2011(6):42-48.
[7] 李斌,陳家駿,陳小荷. 基于互聯(lián)網(wǎng)的漢語認知屬性獲取及分析[J]. 語言文字應(yīng)用,2012(3):134-143.
[8] Li Bin,Bai Xiaopeng,Yin Siqi,et al. Chinese CogBank:Where to See the Cognitive Features of Chinese Words[C]//Proceedings of the Third Workshop on Metaphor in NLP,Denver,Colorado,2015:77-86.
[9] Berners-Lee T,Hendler J,Lassila O. The Semantic Web[J]. Scientific American. 2001, May:34-43.
[10] Reinhard Diestel 著. 于青林,王濤,王光輝 譯. 圖論(第4版)[M]. 北京:高等教育出版社,2013.
作者簡介

李斌
南京師范大學(xué)文學(xué)院語言科技系副教授,主要研究領(lǐng)域為詞法分析、認知語義計算、語料庫技術(shù)和語法理論等。主持完成國家社會科學(xué)基金青年項目1項,國家博士后基金1項,參與完成國家自然科學(xué)基金、國家社會科學(xué)基金、211工程項目等多個研究項目。在國際刊物、國際會議、國內(nèi)核心刊物上共發(fā)表論文40余篇,其中被SCI、EI、CSSCI、CSCD索引20多篇。
E-mail:libin.njnu@gmail.com

宋麗
南京師范大學(xué)文學(xué)院碩士研究生,主要研究領(lǐng)域為計算語言學(xué)。
E-mail:songli1105@sina.com

銀思琪
南京師范大學(xué)文學(xué)院碩士研究生,主要研究領(lǐng)域為計算語言學(xué)。
E-mail:nnuyinsiqi@126.com

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多