基于混合策略的英汉双语新闻自动聚类研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:liusheng123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,本文对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的聚类结果。
其他文献
:由於功能強大且精緻的行動網路裝置(Mobile Internet Devices,MID)愈趨普及,加上電信服務公司 的手機資費貼補政策,使得各式各樣的行動數據服務(Mobile Data Service,MDS)更受大眾歡迎。為提供消 費者更完善的MDS 服務,充份瞭解MDS 服務的關鍵影響因素便為一重要議題。本研究使用資訊品質、系 統品質以及服務品質三個構面,來評估消費者對MDS 使用滿意度
良好的網路空間服務是吸引使用者的重要因素,本研究以TRIZ 理論基礎,建立一組網路空間服務的創新 設計參數,以輔助網路空間服務之創新設計。本研究以為外拍網的使用者為研究對象。以TRIZ 原則建立網路空間服 務設計的參數,做為網路空間服務之創新設計參考。
离岸IT 外包项目中客户和供应商之间的社会性边界问题(即文化差距、语言障碍、领域知识差 距等)带来的协调沟通障碍,是造成外包项目失败的重要原因。如何消除这些社会性边界,降低其对外包项 目绩效的影响,成功的管理离岸IT 外包项目已经成为一个重要的理论现实问题。文化智力和边界对象这两 种处于发展中的理论为本文研究提供了重要的理论视角。本文通过对离岸IT 外包中社会性边界问题对外包 项目绩效的影响,以及
本研究以個案研究法探討一國際知名運動休閒產業公司在台灣的品牌經營創新模型。根據市 場行銷研究報告,個案品牌的品牌偏好與市場佔有率之間本應為正向關連,但結果不符預期。另一方面, 我們發現台灣的人口結構因子,對主要競爭者影響輕微,卻對個案公司有重大負面影響。但根據實際銷售 資料回報結果,發現該影響與預期也不相符。為釐清上述不合理現象,本研究採個案研究法輔以深度訪談 法與觀察法蒐集資料進行分析,深入探討
利用自编软件与科学知识图谱绘制软件,对CSSCI 中收录的2009 年管理科学与工程学科文献进行分析, 绘制出管理科学与工程学科可视化热点研究图谱,发现该学科2009 年的研究热点集中于知识管理、人力资源管理、 组织管理、供应链、社会网络分析与绩效评估等6 个方面。
图书馆2.0运动五周年,留下丰硕的理论遗产。图书馆历史上资源、服务和技术的关系一直是变化的,“资源为王”是一个重要的命题,但图书馆2.0运动改变了图书馆的资源、服务和技术的关系。图书馆2.0使技术与服务融为一体,并通过技术支持用户创造资源、组织资源和定制资源。在网络时代,图书馆人需要在坚守核心价值的同时,根据资源、服务和技术的变化调整自己的战略。
Web2.0作为新的技术与服务模式,其核心理念是交互、参与和共享,这对传统档案信息管理和服务机制带来了冲击。本研究通过网络访问、邮件咨询、应用体验等方法对89家国外综合性档案馆网站及世界排名前50位大学的档案馆网站的18项Web2.0技术进行了调研。调研显示,综合性档案馆与大学档案馆在Web2.0技术应用上未体现出明显差异,在自建Web2.0内容上大学档案馆表现出了更强烈Web2.0的意愿,更注重
基于文献老化负指数模型与生命周期曲线并借助函数推导与曲线分析方法,揭示出文献老化率在负指数模型中为常量,而在生命周期曲线下则为时间函数且具有复杂的数学特征。在此基础上,深入探讨了文献生命周期数学模型的理论特征、模型构建与数学验证问题。结合1960-2009年数学期刊引文数据构建了文献生命周期的对数正态函数模型,并对该数学模型进行数据拟合检验与理论数学验证,结果表明对数正态模型能够较好地拟合学科引文
将本体技术应用到语义检索领域是信息检索发展的新方向。本文主要从语义检索系统的基础理论、模型构 建、及系统实现研究三个方面对国内外基于Ontology 的语义检索研究进行了综述,并预测其发展趋势。
近年来,随着电子商务及调查研究的广泛应用,网络调查得到了迅速发展。本文基于中国电子商务高速发 展的现实背景,运用文献计量法,对2005 年1 月-2010 年10 月间中国网络调查的相关文献进行检索,按照文献的年 代分布、频次情况、研究内容及研究方法来进行统计分析,揭示了网络调查近年来研究的新趋势与新变化。通过与 国外研究情况进行比较,总结了我国近6 年来网络调查的研究现状。结果表明:我国网络调查