【摘 要】
:
电商领域的文本通常不遵循通用领域文本的表达方式,导致传统短语挖掘方法在电商领域文本中的挖掘精度较低.为此,提出一种基于协同训练的电商领域短语挖掘方法.通过基于语义特
【机 构】
:
复旦大学计算机科学技术学院,阿里巴巴网络技术有限公司
【基金项目】
:
国家自然科学基金面上项目“面向大规模知识图谱的查询处理关键技术研究”(61472085)
论文部分内容阅读
电商领域的文本通常不遵循通用领域文本的表达方式,导致传统短语挖掘方法在电商领域文本中的挖掘精度较低.为此,提出一种基于协同训练的电商领域短语挖掘方法.通过基于语义特征的短语分类模型来有效检测电商领域文本中的反序表达,构建协同训练的短语挖掘框架,以降低领域语料中标注训练数据的成本,在此基础上,利用Stacking方法集成统计模型和语义模型的优点,提升模型整体挖掘性能.在淘宝网查询语料上的实验结果表明,相比于ClassPhrase、AutoPhrase方法,该方法具有更高的精度和召回率.
其他文献
写作能力是衡量英语语言技能的一个重要标准。本研究运用对比分析法和错误分析理论,对非英语专业本科生写作中的错误进行统计和分析,试图找出学生在写作过程中出现的错误特点,分
通信技术不断革新,下载速度快马加鞭,从3G时代的120~600k/s,到4G时代的1.5~10m/s,再到5G时代比4G快10~100倍,并不只是单纯的传输指数大爆炸,而是深刻影响到每一个领域,为生活
就拿鱼窝子的招牌菜“焖锅鱼”来说,一个不锈钢锅盖把锅儿遮得严丝严缝,开火,只煮30秒的独特方式一定可以激起满桌人的好奇心。锅盖一揭开,澎湃的香味弥漫开来,仔细地辨别其中滋味
随着无线网络的快速发展,物联网中频谱资源的高效分配问题亟需解决,为此,提出一种基于信任的频谱资源分配机制TSRA。借鉴拍卖理论建立频谱资源拍卖系统模型,根据信任理论确定用户间的信任关系以缩小客户网络范围,利用属性加密理论保护交易数据。在此基础上,采用改进的蚁群算法为用户合理规划资源分配路径,从而实现频谱资源的多目标分配。实验结果表明,该机制可以为用户的交易数据提供细粒度的保护,且具有较高的社会效益
2005年12月,日喀则古城万里无云,阳光明媚,第十一世班禅额尔德尼·确吉杰布在西藏扎什伦布寺举行10年来规模最大的一次为信教群众摸顶赐福活动。在不足百米的道路上几百名信
本文通过实例进行具体的分析,提高轨道交通的管理实用性。
为有效解决特色小镇规划建设工作不规范、走偏路的问题,近日,浙江省特色小镇规划建设工作联席会议办公室印发《浙江省特色小镇创建规划指南(试行)》,以下简称《指南》,这是在国
在北美和欧洲,两部宪法的通过标志着自由主义占据了核心地位。第一部是美国的《人权法案》,在杰斐逊的推动下,1789年“出版自由”(the Freedomofthe Press)一词第一次见诸成文法,这
针对物流系统对环境资源可能产生的消极影响,结合物流系统绿色度的概念,分析了影响物流系统绿色度的相关因素,建立了物流系统绿色度评价指标体系,并简单介绍了指标权重的确定
即使你平时一贯百毒不侵,遇上妇科小毛病的概率还是相当高的。要是有一天,医生告诉你查出了宫颈“糜烂”或是“子宫肌瘤”.大可不必担惊受怕——一般情况下,这并非笼罩生活的一片