伪文档相关论文
自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征.通常,深度神经网络的特征抽取会利用文档中所有词语,这种......
自然语言中普遍存在着同义词和多义词现象,致使人们很难通过以词形匹配的关键词检索寻找到真正需要的网络资源。潜在语义索引通过......
近年来,短文本已成为互联网信息的普遍形式,尤其是随着在线社交媒体的发展,其数百万的用户每天都会生成大量的短消息。从大量的短......
传统的伪相关反馈(Pseudo Relevance Feedback,PRF)方法通常是以文档作为扩展源单元提取扩展词,提取粒度过大造成扩展源质量下降,......
自2007年以来,微博这种通讯形式风靡全球。微博具有上手门槛低、交流及时、发布便捷等优势,在全球得以普及和发展。近年来微博的发展......