综合集成研讨厅中的专家兴趣建模及应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:gmn10021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“从定性到定量的综合集成法”是我国科学家提出的用于解决开放的复杂巨系统及其相关问题的方法论。综合集成研讨厅作为这一方法论的发展,将专家的智慧、计算机的高性能及已有的知识体系融为一个整体,通过专家间的在线研讨与论证,结合前人总结的领域知识及计算机在逻辑运算方面的辅助,激发专家的创造性思维,深化专家知识,并形成最终的解决方案。在研讨过程中,Internet中的丰富资源对启发、激活专家群体的思维具有重大帮助。有效的将这些资源引入综合集成研讨厅体系,对解决重大决策问题有着重要的意义。   现存的面向综合集成研讨环境的主动信息获取系统主要存在的问题是:向专家推荐的网页中存在无用信息,推荐过程没有考虑专家的兴趣及领域偏好。针对上述两个问题,本文开展了结合网页分类的网页正文抽取算法研究、面向综合集成研讨环境的专家兴趣建模方法研究等工作。具体包括以下三部分内容:   1.提出主题网页正文抽取算法。Internet的网页中,不同类型网页的表现形式不同,其中携带的信息量也不相同。通常主题类网页通过大段文字描述了相关主题,其文本内容对专家具有较大的帮助作用。直接向专家推荐主题类网页的正文文本,能够减轻专家的阅读负担。本文提出的主题网页正文抽取算法,基于HTML网页的特点,通过分析网页中锚文本文字和所有文字之间的字数比例关系及锚文本项数,实现对网页类型的判断;采用基于字数统计及标签判别的方法,对判定为“有用的”(主题类)网页的正文部分内容进行提取。实验结果表明,本文提出的网页类别判定方法优于简单的阈值判别法;网页正文抽取方法具有较高的成功率,并且在锚文本判别和抽取方面效果更佳。   2.提出面向综合集成研讨环境的专家兴趣模型构建方法。已有的面向综合集成研讨环境的主动信息获取系统中,对于引入研讨环境的待推荐网页,通过专家之间的协同过滤,实现重要信息的筛选。该方法在一定程度上减轻了专家人工进行信息检索的负担,但忽略了专家的领域背景及兴趣偏好,不能针对专家个体提供个性化的信息。根据研讨流程特点及专家发言的特殊性,本文提出了一种基于专家历史发言记录分析的兴趣建模方法。该方法采用非负矩阵分解技术,自动生成兴趣话题,通过分析专家发言特征词与兴趣话题的关系逐步生成专家兴趣信息,最终整合专家兴趣信息得到层次化组织的专家兴趣模型。实验结果表明:利用该模型能够很好的实现研讨领域预测,能够用来作为信息筛选的依据,为专家提供兴趣相关的、个性化的信息。   3.提出面向综合集成研讨环境的主动信息获取雏形系统的重设计方案并实现。针对原雏形系统在信息推荐过程中出现的不足,本文重新设计了面向综合集成研讨环境的主动信息获取系统,通过向系统架构中添加利用专家兴趣模型进行信息筛选的个性化信息过滤模块,实现研讨支持信息的个性化推荐。实验结果表明,该系统能够良好的运行,能够向具体专家推荐更有质量的信息,大大减轻了专家的工作压力。
其他文献
滚动轴承是旋转机械中应用最为广泛的机械零件,也是最易损坏的元件之一。目前大部分企业对轴承进行质量检测时都是凭借检验员的感觉判断,个人主观因素难以消除,检测结果不是很理
冗余自由度机械臂具有动作灵活、避障能力强、动力性能好等优点,但是其结构特点也决定了对它的分析和控制比一般机械臂更加困难。其中,冗余自由度机械臂的正逆运动学以及自主规
活性污泥法是目前使用的最广泛的污水生物处理方法。由于采用微生物的生理特性对污水中的有机物进行净化,在处理过程中生化反应极其复杂,系统呈现出高度非线性、时变、不确定性
随着互联网进入Web2.O时代,人们可以通过互联网平台发布、获取和传播具有观点性评论信息。面对迅速增长的评论数据,有效区分有用、无用的评论信息,有效组织、分析和挖掘蕴含着大
作为一种远程精确制导的高技术武器,巡航导弹在近代的高技术局部战争与军事冲突中发挥了重要的杀伤和威慑作用。随着高新技术在武器装备中的应用,现代化战争形势对巡航导弹武
雾天拍摄的户外图像,由于大气粒子的散射作用,图像对比度低,颜色失真,场景内容模糊,能见度变差。雾天降质图像复原技术已经成为计算机视觉和图像处理领域的研究热点,并应用于
无线传感器网络的研究涉及无线通讯技术、嵌入式计算机技术、微电子技术、智能控制技术、现代传感器技术等多个学科,在环境监测、智能家居、现代农业等许多领域都有广泛的虑
当今汽车安全和辅助驾驶系统越来越引起人们的重视。其中自适应巡航控制(ACC:Adaptive Cruise Control)作为一种辅助驾驶系统,得到了广泛研究。ACC能根据传感器检测到的驾驶
移动机器人同时定位和地图构建(Simultaneous Localization and Map-Building,SLAM)问题是移动机器人研究领域的基本问题与研究热点。SLAM问题中,地图如何表示是一个重要问题。
自1999年5月Napster的引入开始,P2P联网的新技术大量增长,今天,P2P流量已成为Internet流量的主流。有数据显示,仅在2002年年初由P2P应用所引发的信令流量就达到了总流量规模