免费论文查重: 大雅 万方 维普 turnitin paperpass

浅议从中医药学语言系统到简单知识组织系统本体转换

最后更新时间:2024-02-17 作者:用户投稿原创标记本站原创 点赞:7908 浏览:24736
论文导读:KOS在内容和应用领域上各异,但大都具有相似的结构。SKOS将各种KOS的共性提炼出来并给予明确规定,以支持KOS系统的规范化表达及其在系统之间的共享。SKOS提供了一种基于资源描述框架(ResourceDescriptionFramework,RDF)的KOS规范化表达策略,将KOS表达为机器可理解且能在万维网上发表和交换的领域本体,即SKOS本体。SKOS本体可
摘要:目的 将中医药领域的知识组织系统(KOS)转换为规范化本体,以实现其在万维网上的发布、共享与融合,进一步优化中医药学知识的组织与管理。策略 采用万维网联盟推荐的“简单知识组织系统(SKOS)”技术规范,将中医药KOS转换为可在万维网上发布的本体。结果 将中医药学语言系统转换为SKOS本体并存入知识库中,可支持SPARQL(语义网的标准查询语言)查询访问,并通过万维网服务接口为语义维基、语义搜索等各种语义网应用程序提供概念、术语和知识服务。结论 初步验证了SKOS技术在中医药领域的适用性,对于将其他中医药KOS转换为SKOS本体具有借鉴作用。
关键词:中医药学语言系统;本体;语义网;简单知识组织系统
DOI:10.3969/j.issn.1005-530

4.20112.011

1005-5304(2014)12-0038-04
知识组织系统(knowledge organization system, KOS)包括各种用于对知识资源进行有效组织并推动知识管理的方案。KOS决定了知识组织的机制,因此它是所有图书馆、博物馆和档案库的核心。在中医药领域已出现了一系列实用的KOS。例如,中国中医科学院中医药信息研究所采用本体技术研制的“中医药学语言系统(Traditional Chinese Medicine Language System,TCMLS)”,它以“概念”为核心对中医药学的
名词术语进行了系统梳理,建立了中医药概念的层次结构,并描述了概念之间复杂的语义关系[1-2]。TCMLS已收录约12万个概念、30万个术语及127万条语义关系,在文献检索和文本挖掘等方面取得了实际应用。此外,“中医药临床术语集(TCMCT)”[3]、“传统针灸知识体系语义网络”[4]、“中医古籍语言系统”[5]等KOS也已初具规模并得到了成功应用。但这些系统皆自成体系、相对封闭、互不兼容,导致各系统间难以关联、协调与融合。
“简单知识组织系统(SKOS)”是万维网联盟(World Wide Web Consortium,W3C)于2005年提出的一项推荐标准,它是语义网(Semantic Web)技术体系的一个重要组成部分。SKOS为各种KOS的规范化表达提供了统一的本体模型,支持KOS在万维网上的发布与共享,对于万维网环境中的知识组织与管理具有重要作用。在中医药领域推广使用SKOS技术,将中医药KOS转换为SKOS本体,可推动这些系统在万维网之上的发布、共享与融合,以及它们与相关领域(如生物医学)KOS的关联与协调,从而进一步优化中医药学知识的组织与管理。鉴于此,本文以TCMLS这一典型的KOS为例,阐述将TCMLS转换为SKOS本体的技术方案和初步结果,以期为SKOS在中医药领域的推广应用提供参考。
1 简单知识组织系统技术概述
各种KOS在内容和应用领域上各异,但大都具有相似的结构。SKOS将各种KOS的共性提炼出来并给予明确规定,以支持KOS系统的规范化表达及其在系统之间的共享。SKOS提供了一种基于资源描述框架(Resource Description Framework,RDF)的KOS规范化表达策略,将KOS表达为机器可理解且能在万维网上发表和交换的领域本体,即SKOS本体。SKOS本体可被形象地表示成一张图——RDF图,是由一系列“RDF陈述”构成的,示意图见图1。
图1中给出“肾虚证”这一概念的英文标签和定义,并描述它与其他概念之间的关系。图中出现的skos:Concept(概念)、skos:prefLabel(正名)、skos:related(相关)、skos:broader(上位概念)及skos:definition(定义)是SKOS的核心词汇,用来描述概念的语义信息和相互关系。图中的“ex:肾虚证”是“http:///肾虚证”的简写(“ex:”代表“http:///”),后者是“肾虚证”的统一资源标识符(unified resource identifier,URI);“ex:虚证”、“ex:肾”也是对应概念的URI。图中“ex:肾虚证”和 “ex:肾”两点间有一条标为“skos:related”的弧,它对应于RDF陈述{ex:肾虚证 skos:related ex:肾},表示“肾虚证”与“肾”相关的意思。“ex:肾虚证”和“‘kidney deficiency pattern’@en”之间的弧对应于RDF陈述{ex:肾虚证skos:prefLabel“kidney deficiency pattern”@en },它为“肾虚证”添加了英文标签。可见,SKOS本体用一种基于图的知识模型,来表示领域概念的标签、定义、注释、上下位关系和相关关系等信息,从而构建领域的概念体系,它适用于表达主题词表、分类法、语义网络等多种类型的KOS。
2 中医药学语言系统的内容
TCMLS主要包括语义网络(Semantic Network, SN)和基础词库两部分。
SN构成了TCMLS的顶层框架,它包括语义类型、语义关系两部分。
语义类型(Semantic Type):TCMLS列举了中医药领域中最基本的96种语义类型,并对它们进行了定义和限定。该语义类型体系为TCMLS提供了一个分类架构,可对TCMLS中的每个概念赋予明确的语义类型。
语义关系(Semantic Relation):TCMLS定义了58种基本的语义关系,用于将中医药领域概念关联起来,构成一张大型的复杂语义网络,对中医药领域的概念体系进行全面刻画。
在SN中,语义类型对应网络节点,语义关系对应节点之间的弧。SN通过语义关系将语义类型连接起来,为建立具体概念之间的语义关系提供参考和约束。 全文地址:www.7ctime.com/zgetwxlw/lw43665.html上一论文:试谈小说《大鱼》中童话语境中的诗意语言