【摘 要】
:
针对中文短文本词汇数量相对较少、特征稀疏、噪声多等特点,笔者提出一种基于TextRank和隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)的文本扩展方法。该方法首先通过
论文部分内容阅读
针对中文短文本词汇数量相对较少、特征稀疏、噪声多等特点,笔者提出一种基于TextRank和隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)的文本扩展方法。该方法首先通过TextRank算法从给定文本中获得各个候选的关键特征,然后利用LDA从给定文本中获取各个隐藏的主题特征,将概率超过或等于给定阈值的各个隐藏主题所对应的各个候选关键特征扩充到文本中进行文本扩展。
其他文献
摘 要:根据对厦门第二东通道施工工程水上作业中无动力船舶“一航津泰”轮的特点及在特定锚泊状态下抗风能力计算,为无动力船舶制定防抗台应急措施提供理论依据,对施工单位的安全作业有着积极意义。 关键词:施工船;抗风;抗台;锚地 0 引 言 厦门第二东通道工程是在建的厦门第二西通道工程的东延伸段,路线全长约12.371 km,是厦门市进出岛交通网络规划中重要的跨海通道之一,其中A2和A3标段工程水上
北外滩因港而兴 有“万国建筑群”之美誉的上海外滩和璀璨亮丽的陆家嘴是国内外来访者向往之地。而今,既不老也不新的北外滩抢了它们的风头,成了上海的热点。很多人并不了解,这个热点的内核其实是滚烫的航运! 可不是吗?这里有3.53 km长的岸线,这里有实力雄厚的航运一条街。这里已经形成三个中心:一是航运要素集聚中心,二是国际邮轮客运中心,三是口岸服务中心。浦西第一高楼白玉兰广场与对岸上海中心隔江相望。
摘 要:北斗遥测终端是目前航标管理中监控航标状态的重要手段,但在日常管理中发现有些北斗遥测终端不能按时上传数据,造成了一定程度的数据丢包。为了改善数据丢包现象,我们研究分析了产生问题的原因,提出了改善终端天线的设想,试制了新终端样品并完成了测试。本文简要介绍了全向型天线的工作原理和在北斗遥测终端上实际的应用情况,通过测试与实际使用总结了新型天线的优势与存在的问题,并且提出相关建议以及对未来的展望。
临床检验系统借助计算机设备将实验检验仪器整合成局域网,进而直接从临床信息系统中收集医嘱,依托样本数据库对信息进行检索,并以电子报告的形式将检验结果发送给临床医生,方
软件需求分析是软件生命周期中的重要阶段,传统开发方式使用自然语言或UML图描述模型,需求中容易出现不一致性、二义性和不完整性。使用形式化的方法对需求进行分析,有助于开
Android环境下的程序开发使用的架构模式主要有MVC(Model View Controller)、MVP(Model View Presenter)和MVVM(Model-View-View Mode),最经典的框架是MVC模式,最常用的框架
针对多声音事件检测中可能出现多种相互重叠的声音事件,并且每种事件持续时间长度不一致的问题,笔者提出一种基于DenseNet全卷积神经网络的多声音事件检测模型。首先,将Mel能
智慧园区作为城市空间体系的重要组成部分,在进行规划时应从全局出发。笔者针对如何满足园区日益增长的功能需求、如何将5G等先进技术成果应用在园区规划设计中、如何对传统
针对机器人模仿学习示教样本数据量小、学习得到的动作策略泛化能力弱等问题,笔者以双臂机器人为研究对象,提出一种基于Transformer网络的模仿学习方法。该方法首先通过多次
机架式设备线卡软件的存储一般使用单盘自身的FLASH介质。这种传统软件管理部署方式虽然简单,但是随着线卡软件的尺寸不断增加,会影响用户的满意度,当超过FLASH存储空间时会