论文部分内容阅读
异构是网络信息的基本特征,多源是异构的重要成因:持有不同世界观的认知主体在信息采集、处理与表达思想和方法的差异形成了系统异构、结构异构、语法异构、语义异构等不同层次和类型的异构现象。随着多源性异构研究的不断深入,学者们的关注点逐渐从基本解决的技术层次异构向语义异构等认知层次转移,语义异构逐渐成为网络信息自动化处理的焦点与难点。农产品价格信息是网络涉农信息中的重要部分,也是多源异构特征最为典型的信息类型之一。农业部与各类批发市场自主采集、处理与发布的各类农产品价格信息目前还只能依靠用户手工处理以消弭不同来源数据的差异。有效的克服多源网络农产品价格信息的异构,以实现信息的自动化处理,已经成为目前农业信息高效利用的关键问题。采用网络调研的方法搜集了网络价格信息发布方式、所属类型、更新频率、价格信息属性值等多个指标。通过分析得出了多源网络农产品价格信息的共性特点,并用网络农产品价格信息九元组来描述。提取了典型的11个农产品价格信息源,借鉴了信息生命周期理论,对信息源之间从异构表象回溯至信息采集方案的设计思想,以探索不同异构的生成原因与外在特征,形成了不同语义异构现象的特征集合。依据信息处理的层次理论,具体分析并提出了模式语义异构、上下文数据语义异构、个体异常数据语义异构等3个具备层次递进关系的类型,同时形成更为详细的11种小类的多源网络农产品价格信息语义异构类型框架。基于语义异构类型的层次递进关系,以模式语义异构为例提出了以本体映射为主要内容的语义异构消除方法,同时提出了消除网络农产品价格信息语义异构的整体框架,并设计了原型系统框图。从认知角度考察了网络农产品价格信息语义异构现象的形成,运用信息生命周期理论和信息处理层次理论分析了语义异构现象的类型与特征,提出了相应的分类框架和异构消除框架,在方法上做出了一定的创新。