Hierarchical clustering

針對特定領域知識分類架構進行導引式分群演算法之研究

序號 6
刊名 大學圖書館
年份 2008
出版月份 3月
卷期 Vol.12 No.1
作者 葉建華
作者任職單位 真理大學資訊工程學系助理教授
摘要

本文所探討的焦點是設計出一套自動化的運作模型,讓各種機構能夠快速藉由資訊系統學習網路上的相關本體認知架構資訊,並且依照自身的需求與分類,建立適用於自身發展的概念性架構(concept hierarchy,或稱知識分類架構)。這樣的運作模型,能夠將多個既存的分類架構,如美國政府入口網站(US Government Portal)、LookSmart、開放目錄專案ODP(Open Directory Project)和Yahoo等等,以自動化的網頁擷取程式(Web spider),收集各個本體認知架構下相關的網頁以及附加資訊。然後依照網頁所存在的階層架構以及網頁內容,進行特徵學習。然而,本文提出的方法將採用不同於傳統的分類學習方式,希望可以藉由使用者表達的預設需求,進行使用者所提供內容的導引式分群。這樣的運作方式,是將大量已經分類過的資訊,藉由特徵資訊的萃取,作為特定領域的專業註解,使得分類結果更能夠貼近使用者的期望。

關鍵字 樹狀結構相似度知識分類架構階層式分群
頁碼 96-110
全文 全文下載
DOI
Review
Title The Design of Guided Concept Clustering Algorithm for Specific Knowledge Domain
Author Jian-hua Yeh
Author's title Assistant Professor, Department of Computer Science and Information Engineering, Aletheia University
Abstract

This paper discusses the automatic concept hierarchy generation process for specific knowledge network. Traditional concept hierarchy generation uses hierarchical clustering to group similar terms, but the result hierarchy is usually not satisfactory for human recognition. Human-provided knowledge network presents strong semantic features, but the generation process is both labor-intensive and inconsistent in a large scale hierarchy. The method proposed in this paper combines the results of specific knowledge network generation and automatic concept hierarchy generation to produce a human-readable, semantic-oriented hierarchy. This generation process can efficiently reduce the efforts of manual classification, an exhausting task for human beings. An evaluation method is also proposed in this paper to verify the quality of the result hierarchy.

Keywords Concept hierarchyHierarchical clusteringTree similarity
fulltext 全文下載
DOI
訂閱文章