SparkCRF:一种基于Spark的并行CRFs算法实现

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:PIPI16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
条件随机场(condition random fields,CRFs)可用于解决各种文本分析问题,如自然语言处理(natural language processing,NLP)中的序列标记、中文分词、命名实体识别、实体间关系抽取等.传统的运行在单节点上的条件随机场在处理大规模文本时,面临一系列挑战.一方面,个人计算机遇到处理的瓶颈从而难以胜任;另一方面,服务器执行效率较低.而通过升级服务器的硬件配置来提高其计算能力的方法,在处理大规模的文本分析任务时,终究不能从根本上解决问题.为此,采用"分而治之"的思
其他文献
据美国物理学家组织网报道,美国一个研究小组正在研究改良植物的技术,以期在未来几十年中,将植物光合作用捕获碳的能力提高一倍。当前植物光合作用每年从大气中捕获的碳只有30亿
随着当今社会地不断发展和进步,人们对于生活的要求也在不断地提高当中,而作为当今社会中非常重要的工商管理行业来说也是如此。在如今的社会中,我国的经济已经处于飞速的发
国有企业的政工工作有效开展对于国有企业的良好发展具有重要意义,而作为政工工作主要影响者的政工干部队伍,其自身的能力素质对于国有企业政工工作效果、工作方向的影响较大
相似自连接是一个在很多应用领域中很重要的问题.对于海量数据集,MapReduce可以提供一个有效的分布式计算框架,相似自连接操作也同样可以应用在MapReduce框架下.但已有研究工作
为解决旱辣椒品种的问题,1988年我们从湖南省园艺所引入湘研一、二、三号三个早熟辣椒品种,用本地栽培面较广的菜辣椒品种作对照,进行对比试验,结果如下:
新兴企业RocTool公司已经在Cage系统?工艺上赢得了声誉。现在RocTool正推出其最新补充的3iTech?技术,一种将感应器集成在模具中的新型感应加热工艺。Cage系统因快速加热模具
期刊
复合材料供应商Gurit公司在加利福尼亚州举办的2011年国际风能展览会上展示其最新风能产品。该展览会于5月22-25日在阿纳海姆举行,由美国风能协会(AWEA)主办。Gurit公司重点
期刊
8台风力发电机已安装在南极洲,为国际极地基金会的伊丽莎白公主站供电。这些风力发电机能抗-60℃低温,可承受53mph平均风速和超过200mph的狂风。据称伊丽莎白公主
期刊
“我国有机污染物(VOC)控制面临着排放标准不健全;没有污染排放收费制度,企业没有减排压力等问题。不过目前在涂料等行业VOC控制新技术较为成熟,我国将通过组织新技术推广,实现VOC