上海光源产品管理系统及其全文检索子系统的改进

来源 :中国科学院上海应用物理研究所 | 被引量 : 0次 | 上传用户:NC330201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上海光源工程(Shanghai Synchrotron Radiation Facility,SSRF)是十五期间的国家重大科学工程,为提高工程管理水平,进一步完善信息化体系,PDM(Product Data Management)产品数据管理十分必要。   上海光源产品管理系统(SSRF-PDM)采用的是UGS公司的Teamcenter平台,但其检索功能不完善,检索结果是无序排列的。本文将通过在Teamcenter平台上嵌入Lucene,来完善系统的检索排序问题,并从以下3个方面阐述:   首先,本文就课题的背景、意义以及应用进行了简要介绍,包括上海光源,SSRF-PDM网络结构,系统配置以及组织结构创建,并重点研究了SSRF-PDM系统结构,本文的研究工作都是基于该系统进行。   第二大部分为理论部分,阐述了信息检索模型分类一布尔模型,VSM模型等;Lucene与原系统的检索算法与实现机制的比较,并着重阐述了中文分词技术:基于理解,基于统计,和字符串匹配等分词方法以及目前分词技术仍存在的问题。   最后为系统实现部分,主要包括两个大方面:改进的检索系统开发与测试。开发部分,包括建立索引(Indexing),针对不同格式文件(ppt,doc,.pdf,.xls)进行的文本转化与文本抽取,Lucene搜索(Searching)的开发,以及socket多线程通信-Client端与Server端;而测试部分,对改进前后的检索系统分别进行了英文,中文,数字以及复合型关键字检索测试,重点考察改进后系统对输出结果的排序功能验证,总结其检索效果以及展望。
其他文献
无人机着陆引导系统是无人机导航系统中不可或缺的一部分,承担着将飞机安全引导到指定着陆点的任务,而其中测距技术的性能将直接决定引导的成败和精度,因此研制适合无人机着
学位
随着电子计算机的运算速度和存储能力的迅猛发展,语音合成技术已由早期的知识驱动发展到数据驱动阶段,大规模语料库的支持使得合成语音的质量有了明显的改善。与此同时,用户对语
学位
研究背景 沙眼衣原体(Chlamydia trachomatis)是性传播疾病的主要病原体之一,其感染在世界范围传播,每年以10%的速度递增。由于约70—80%的女性和50%的男性为无症状感染,不及时
网络编码(Network Coding,NC)是新一代的网络交换/路由技术,它允许通信网络的中间节点在转发信息的同时对信息进行处理,以使网络的吞吐量、健壮性、可维护性和安全性等方面都得
射频识别技术不仅覆盖了微波技术和电磁学理论,而且还涉及半导体集成电路和通信原理的相关知识。由于RFID技术的众多优点,它已被广泛用于各种领域,如工业、商业、交通运输、
数字水印技术是解决多媒体作品版权保护与信息安全的有效手段。由于小波变换具有良好的时频局部化特性以及与人类视觉系统相符的变换机制,且新的图像压缩标准JPEG2000也以小波
论文研究了以OFDM为核心技术的新一代无线通信系统在高速移动和宽带传输下的优化问题,并对OFDM系统中的功率和直流估计、冲激噪声检测与去除、TCM编码调制技术以及多用户资源
3G长期演进计划(LTE)是近几年来3GPP启动的最大的新技术研发项目,这种以OFDM/FDMA为核心的技术,是通信技术的一个革命。LTE旨在提高数据传输速率,降低系统时延,增大系统容量和覆盖
多源遥感图像融合技术是指将不同类型传感器获取的同一地区的图像融合成一幅新的图像,其融合处理过程就是采用一定的算法将各图像中包含的冗余信息、互补信息有机结合起来,得到
本文以条斑紫菜(Porphyrayezoensis)为原料,提取不同溶解性蛋白质后进行酶解并对酶解条件进行优化,获得对金黄色葡萄球菌(Staphylococcus aureus)具有显著抗菌作用的酶解物备后续