基于学术社区的学术搜索引擎设计

来源 :计算机科学 | 被引量 : 0次 | 上传用户:luckychuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,将分散在不同位置、提供不同内容的学术信息组合为一个整体,有效地解决了文献提取问题。针对普通中文分词组件在对姓名进行分词时准确率较低的问题,设计了一个专门针对姓名进行分词的高效的算法。在开源框架Nutch和HBase的基础上,实现了一个学术搜索引擎,并在实验中验证了设计的有效性。
其他文献
为满足非接触化、小型化、集成化、数字化、智能化等现代检测技术的发展要求,从成本、工作原理、灵敏度等方面综合考虑,现采用以光电定位模块为核心的光电定位技术,以无线传感器网络作为数据传输与管理的技术手段,构建了无线光电定位网络,并进行了实验分析。可实现多点实时监测、异地显示测量数据、数据网络化管理等特殊需求;涵盖了多学科领域的相关技术,具有性价比高、易于实现及可移植性强等特点。在无线光通信、机械、建筑
BML模型是用于研究城市路网结构中交通流特征的细胞自动机模型。基于软件的模拟及演化优化方式存在着运算效率低、优化速度慢等缺陷,极大地限制了交通流模型的实时应用能力。
基于机器视觉的智能车辆跟踪防撞系统,信息量大,计算速度、存储容量要求较高,不便在嵌入式系统中实现。通过对机器视觉图像信息的等间距抽取,压缩了图像采集量,保留了最小特征,减小了存储的压力;通过对传统图像边缘提取算子的研究,提出了简化的基于阈值的边缘提取算子,提高了计算速度。仿真研究表明:该方法简单有效,并在智能模型车平台上得到验证。
根据大气偏振光分布特点和偏振光导航原理搭建三通道测量平台对偏振光信息进行采集,通过视觉图像特征的空间梯度瞬时变化率计算飞行器周围环境的稀疏光流场。结合大气偏振光
在本体概念相似度计算过程中,关于本体概念间非ISA关系的处理方法较少。针对本体中存在非ISA概念关系的情况,总结了一些传统的概念相似度计算方法,提出了一种新的适应于非ISA
磁传感器作为传感器的重要组成部分,在航空航天、生物医学、材料科学等领域得到了广泛应用,但目前却缺乏对其特性进行全面测试的手段,特别是传感器的频率特性。针对这个难题,
分析了提升小波变换的分解原理,提出了基于提升小波变换的冲击性负荷电能计量新方法,并进行了冲击性负荷电能表的硬件设计。与传统电能表相比,该电能表能适应冲击性负荷情况
提出一种改进Harris特征点的机器人精确定位方法,通过改进特征点提取、匹配、跟踪策略,为运动估计提供更加可靠的输入,提高运动估计结果的准确性。具体实现策略是在图像高斯
提出了一种在通用视频序列中联合时空信息分割运动对象的算法。首先,提出匹配加权的全局运动估计补偿算法,以消除动态场景中背景运动对运动对象分割的影响。其次,时域信息提取中,使用基于直方图拟合的显著性检测及对称差分法获得运动对象模板,以克服依据经验设定阈值的缺点并且提高运动对象模板的准确性;空域信息提取中,提出基于粘性形态学梯度修正和相邻区域边缘强度合并的改进分水岭分割算法,以较好地解决分水岭算法的过分