Apache Jena偷吃步

本體論淺談

網際網路之父Tim Berners-Lee曾經在TED上發表過演講「網路的未來」──其中他所提到的關聯資料(Linked Data),也就是語意網(Semantic Web),其目的在於將我們現實世界中的每件事物連結起來。但我們所生活的世界中有太多相似的東西了,光是動物就可以分成不一樣的好幾個品種,而同樣發音的單字,在不同國家可能也會有不一樣的意思,本體論(Ontology)便可以被用來解決這類的問題。

什麼是本體論?

Gruber(1993)將本體論定義為「概念化的明確規範(An explicit specification of a conceptualization)」。這句話用簡單的方式來說就是:

  • 概念化

    概念化是將我們日常生活中的事物、又或更廣泛的來說,對世界上的所有事物轉換為概念的一個過程。如「蘋果」是一個「紅紅的物體」、「吃起來酸酸甜甜的」......等等。

  • 明確規範

    明確規範則是將相似的概念進行更進一步的定義,以劃分概念之間的差異。例如蘋果和辣椒的差異就在於辣椒是「吃起來辣辣的」、「形狀是長長型的而不是圓圓的」......等等。

為什麼我們需要本體論?

  • 資訊交換的簡易性

    現在在在我們日常生活當中已經非常仰賴資訊系統(information systems)的服務,如Facebook、Line這類的社群平台與通訊軟體;而資訊系統當中最重要的元素就是「資訊」,使用本體論可以方便人類與電腦進行資訊的溝通。以下是本體論的一個範例:

    <person>
      <name>Adam</name>
      <age>16</age>
    </person>
    

    經由使用本體論,除了人類能夠讀懂資料要傳達的訊息,同時電腦也可以進行解讀,並進行相關的運用。

  • 解釋與歸類資訊

    本體論中分別定義了概念的類別與概念的階層,可以用來對一個模糊的概念進行明確的歸類,以了解概念在現實世界中最真實的樣貌。