自然語言:原型-圖示理論

自然語言

前言

簡介

歷史

理論篇

知識表達

語法理論

語意理論

語用理論

方法篇

規則比對

機率統計

神經網路

應用篇

語料建構

全文檢索

自動分類

自動摘要

機器翻譯

問答系統

中文處理

程式篇

交談程式

英漢翻譯

維基語料

搜尋引擎

相關資源

語料辭典

程式工具

相關網站

相關文獻

網頁列表

統計資訊

最新修改

訊息

相關網站

參考文獻

最新修改

簡體版

English

人類語言是相當複雜與多變的,由於目前的機器並非『生活』在現實的世界中,因此、有許多觀念是無法由機器本身去去體會得到的,即使我們對所有現實的概念都以文字加以定義之後,電腦能仍然相當難以理解為何『憤怒』與『火』的關係為何,然而、在人類語言之中,這樣的類比卻是相當常見的,例如:

他發怒了 = 他火了

他心中的怒氣始終無法消除 = 他心中這把火總是熄滅不了

認知語言學

  • 認知語言學派是新近興起的一個心理語言學派,其關注的焦點有兩大部分:
    • 人類語言中的各種類比與借用情形,解釋這些類比與借用的成因。
    • 人身經驗中重要的基本圖像感覺,探討人們如何利用這些圖像感覺來建立理解的機制。

George Lakeoff 在其著作 『女人、火、與危險事物』當中,對這些類比與借用有理論性的解釋,其解釋相當具有啟發性,在本論文中,我們將利用這些類比與借用法則,進行逆向的推理,以便找出許多語句的原意。

該書中所提到的理想認知模型 (ICM - Idealized-Cognition-Model) 對自然語言處理相當有啟發性,我們將介紹這個模型的組成元素與整體觀念。

轉喻與隱喻

  • 定義:轉喻
    • 1. 在現實世界中若有A=>B 的情形,則在語言中經常會以 A 代表 B
    • 2. 在現實世界中若有C=>A 的情形,則在語言中經常會以 A 代表 C
  • 轉喻原則
    • 1. 情感轉喻原則:一種情感的身體反應可用來代表這種情感
  • 因果式: 情感 => 情感造成的身體反應
    • 範例:I almost burst a blood vessel. (我差點氣爆血管).
  • 定義:隱喻
    • 若 A+R+B 且 C+R+D,則在語言中經常會以 A 代表 C,B 代表 D — 註:符號 + 代表概念的合成
  • 隱喻原則
    • 1. 情感隱喻原則:身體是裝納各種情感的容器
      • 組合式:容器 + 裝納 + 液體 且 身體 + 裝納 + 情感
    • 情感隱喻次原則:
      • a. 憤怒隱喻原則:憤怒是容器中液體的熱度
      • 組合式: 容器 + 裝納 + 熱液 且 身體 + 裝納 + 憤怒
      • 範例:他充滿憤怒 (He was filled with anger.)
      • 憤怒使身體變熱
        • 組合式:火 + 物體 + 熱 且 憤怒 + 人 + 熱
        • 範例: 你不真誠的道歉只是火上加油而已。 (Your insincere apology just adds fuel to the fire.)

形象圖式 (Image schemata)

  • 定義:形象圖式- 經由人的身體感官經驗所學習到的基本組合關係
Schema.jpg

命題與符號 (Proposition and Symbol)

  • 定義:命題-不經由想像手段的本體 (包含實體、行為、狀態、特性) 與本體建構出結構
  • 定義:符號-命題被落實時所用的文字或圖形表示法
  • 說明(1):此處的命題與邏輯中所謂的命題是一致的,但是單指該命題的語意 (semantic of logic) 而言,符號則指將這些命題經由語法 (syntax of logic) 的指定而形成的文字或圖形表示法。
  • 說明(2):命題可分為簡單命題與複雜命題,複雜命題是經由簡單命題所組合出來的。
  • 說明(3):常見的複雜命題的結構類型有:劇本、特徵群、分類體系、放射性結構等。

理想化的認知模型 (ICM - Idealized Cognition Model)

以上各節所介紹的形象圖式、命題、符號、隱喻與轉喻,稱為ICM 的五個基本類型 ICM 之所以稱之為『理想化』的認知模型,並不是因為這個模型很理想,而是因為ICM 認為每個範疇都有一個稱為『原型』的理想概念,可以用來代表該範疇,所謂的範疇與原型定義如下:

  • 定義:範疇 - 一個統合多個概念的上位概念。
  • 定義:原型 - 最能代表一個範疇的下位概念 — [Rosch 1975]
  • 範疇可以根據與原型的的關係分為下列幾類:
  • 1. 轉喻範疇:原型可以轉喻的代表該範疇
  • 2. 放射範疇:原型是該範疇結構的中心
  • 3. 生成範疇:原型可以經由規則生成該範疇
  • 4. 等級範疇:原型是該範疇的第一等級
  • 5. 傳統範疇:原型具有該範疇的所有特徵

一個新詞的理解是由原先的範疇原型所觸發出來的。

語言結構是二維的複雜認知模型:一維是形式參數,一維是語意參數。

  • 形式結構
    • 句法成分 (分句、名詞短語、動詞…)
    • 詞彙成分 (here, there, come, go, be, …)
    • 句法條件 (線性、主語和賓語、成分的可選擇性…)
    • 語音條件 (有無重音、母音的長度…)
  • 意義結構
    • 語意成分 (實體、位置、謂項…)
    • 總體語意學 (ICM:範疇、隱喻、轉喻、形象圖式…)

形式與意義的配對 <X, X'> = <形式, 意義>

  • 範例:『指示』的語言結構 (The Point-Out ICM)

範例:『指示』的語言結構 (The Point-Out ICM)

指示』的意義結構 指示』的形式結構
語意成分成分:說者-聽者、實體-謂項,位置-位置謂項-移動謂項 句法成分:分句、指示性位置副詞、動詞、
名詞短語、動詞短語/動詞
命題一:位置謂項(實體, 位置)
(這個實體在此位置上) 詞法成分1:here, there
命題二:移動謂項(實體)
(這個實體正移動中) 詞法成分2:若有移動謂項,則 be 代表移動動詞,
否則 be 代表位置動詞
命題三:謂項(實體)
(謂項控制此一實體) 句法條件1:指示性位置副詞位於詞首
總體語意 背景1:命題三存在 句法條件2:動詞用一般現在式
背景2:命題一確定 句法條件3:動詞在名詞短語之前,
除非名詞短語改用代詞
背景3:實體在說者的是視野中 句法條件4:動詞短語/動詞 中的動詞
是可以任意選擇的
背景4:說者將其注意力集中於實體 句法條件5:動詞短語/動詞 位於最後
背景5:說者假定聽者未將注意力集中於實體 句法條件6:名詞短語是分句的主語
言語行為:說者將聽者的注意力引向實體 句法條件7:名詞短語是
<分句; 名詞短語, 動詞短語/動詞>的主語
功能條件:將聽者的注意力集中於實體 句法條件8:名詞短語不是分句的補足語
手勢:說者指示位置 (用轉頭或手勢) 音位條件:here, there 帶有重音

抽象概念結構:

  • 投射圖式 (源頭-路徑-目標圖式):抽象領域 => 自然領域
  • 範疇圖式 (容器圖式) 原型與範疇 (Prototype, Category)

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License