一种文本文档相似性计算的方法

来源 :吉林师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:llw88636108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先对当前文本文档相似度计算方法的优缺点及适用范围进行了分析。由于越长的词语表达的意思一般越完整,基于这一思想,对不同长度的词语赋予不同的权值,把长度为 n 的公共序列引入到相似度的计算中,构造了一文本相似度计算公式,对其中相似度计算公式的合理性给予了理论证明。最后,通过实验证明该方法是有效的。
其他文献
例1男,40岁.因左下颌骨缺损3个月,于1996-01-12入院.入院前3个月,因车祸致头、颌面部外伤,在当地医院救治,在清创过程中,医生将其左侧骨折的下颌骨体部摘除.出院后,患者不能
GeoVRML技术支持多种坐标系统和参考椭球体,数据表达精度高,三维建模功能强大,可有效构建三维地形模型.运用GeoVRML技术对吉林省东部山区进行了三维地形可视化研究,实现了大规模地形数据到GeoVRML数据文件格式的转换、海量数据的快速、准确、实时显示,取得了较好的效果,为利用虚拟现实建模语言进行地理信息的三维可视化表达及相关研究提供了研究案例.
脑深部病变术后感染是神经外科术后的一种严重并发症,一般采用静脉及鞘内注射抗生素控制感染;但对脑深部病变术后发生的严重感染,用常规方法难以奏效,尚须结合脑室持续灌洗及
目的探讨血浆同型半胱氨酸(Hcy)水平与血管内皮功能的相关性.方法选择经冠状动脉(A)造影、心电图证实的陈旧心肌梗死患者30例为实验组;健康查体者32例为对照组,年龄、性别与
鼻腔内翻性乳头状瘤过去较为罕见,近几年来有关报道较多[1~3].其发病机理及其恶性程度仍有争论.现将我院1994-07~2001-10所见的9例内翻性乳头状瘤报道如下.
患者,女,18岁.因间歇性咳嗽、痰中带血3年,加重1个月于1998-01来院就诊.经胸部平片及CT检查,诊断为右下肺中央型肺癌伴远端阻塞性肺不张.于同年2月在胸外科行右肺中下叶切除
2000~2001年,某部新兵集训,发生以"爪形手"为突出表现的腕尺管综合征4例.4例均为年龄19~20岁的男性战士.高中文化,均诉俯卧撑强化训练(每晚200~400次)10~40d后出现一过性手腕酸痛
发展非公有制林业是中国林业实现跨越发展的正确选择,发展非公有制林业必须使林业投资者财产权人得到尊重和保护.从法学角度诠释森林征用制度的合理性,阐述森林征用补偿的理
研究了一类具有自由边界的不可压粘性流体的Navier-Stokes方程.我们假设流体的运动在柱体的轴向是均匀的,因此如果考虑柱体的横截面则问题就转化为一个二维的Navier-Stokes方程