【摘 要】
:
航运在全球大宗商品贸易中占据着最重要的地位,80%以上的大宗商品贸易都要通过航运来进行运输。船舶自动识别系统(Automatic Identification System,简称AIS系统),每天都能产生数以亿计的航行数据。通过对于航行数据的分析,可以实时掌握各种货物的流量和流向,以及各港口泊位的变化情况。将这类信息运用于实际的商品贸易中,无疑会为用户带来巨大的经济利益。本文的内容是设计并实现基于
论文部分内容阅读
航运在全球大宗商品贸易中占据着最重要的地位,80%以上的大宗商品贸易都要通过航运来进行运输。船舶自动识别系统(Automatic Identification System,简称AIS系统),每天都能产生数以亿计的航行数据。通过对于航行数据的分析,可以实时掌握各种货物的流量和流向,以及各港口泊位的变化情况。将这类信息运用于实际的商品贸易中,无疑会为用户带来巨大的经济利益。本文的内容是设计并实现基于大数据的船舶行为分析系统,并解决系统出现的研究型问题。该系统的目的是将铁矿石、煤炭、LNG等货物的航运信息进行一系列的分析,以直观,智能,便捷的方式呈现给用户,使得用户能掌握及时,客观,有效的贸易和航运信息。本文主要使用下述方式进行船舶行为的分析:1.设计并使用AIS数据预处理的算法。本文使用的船舶位置的数据量十分庞大,涉及到的船舶有几十万条,总体的AIS数据历时五年以上,条目超过了千亿。本文通过查询航运相关的资料,针对AIS原始的数据,分析其数据项是否缺失以及其合法性,设计基于Spark的分布式数据预处理算法。通过给船舶设计唯一的字段编码,综合考虑了船舶MMSI的历史变化,设计分区Partition算法,按船舶分区用Spark进行并行计算,大大提升了数据预处理的效率和精度。2.设计并优化泊位的聚类算法及确认算法。由于AIS数据量过于庞大,即使单独抽取铁矿石、煤炭、液化天然气(LNG)的船舶进行分析,也有超过10亿条的数据量;再加上聚类算法本身就比较吃计算资源,因此,如果单进程进行泊位的聚类,运算时长会是一个让人难以接受的数字(以年计)。针对这个问题,本文设计了基于Spark的分布式带权重的DBSCAN算法,用于进行不同期货货物泊位的聚类。人所共知,DBSCAN是一个基于密度的聚类算法,而AIS数据的分布在来源和地理位置分布上并不是均匀的。例如,基站数据的信号密度远远大于卫星数据;中国沿海的信号强度远远强于印度。为了解决这一问题,本文对不同地理位置分布的AIS信号采取不同的DBSCAN聚类参数阈值。同时由于在海上避风等也会产生静态数据的情况,以及考虑到世界上的港口分布情况,本文设计并优化了对泊位进行确认的算法,来对可靠性高的泊位进行确认。3.设计并完善获取船舶航次的算法。航次,是指船舶在营运中完成一次运输生产任务的周期。在实际工作中,一般从船舶在出发港装(卸)货完完毕时起,驶至目的港卸(装)货完毕时止作为一个航次,称为满(空)载航次。对于期货商品贸易的分析,依赖于船舶的运力,而运力的统计则与航次的划分息息相关。本文利用进行过预处理的AIS数据,设计并完善船舶航次抽取算法,先进行船舶航行过程中的停泊点抽取,进而合并停泊点信息获得停泊流水,再获取航次。4.设计并优化船舶航次预测及检验的算法。目前已有的船舶航行轨迹预测算法,大多都是针对近港的航次,无法做到对海上航行航次的准确预测。本文基于上述的航次抽取算法,利用道格拉斯-普克算法抽取航段,综合利用当前AIS数据信息和历史航行轨迹,设计船舶航次的预测算法;同时设计了预测航次的检验算法,来不断对预测航次的算法准确度进行优化,来实现各期货贸易商品船舶航次的准确预测。以上述四部分的算法为中心,设计并实现了下述船舶行为分析系统的功能点:1.数据存储设计:按数据量级及使用场景,区分了存储AIS原始数据的HBase数据库的设计,以及存储爬虫数据及分析结果数据的MySQL数据库的设计。2.数据研发架构设计:基于航运业务的需求,设计并实现了 AIS数据预处理、泊位聚类及确认、船舶航次抽取、船舶实时航次预测等功能模块。
其他文献
本文以纳米磁性材料固定化纤维素酶的制备以及在水解过程中的性能优化为研究的主要内容。以壳聚糖作为修饰纳米Fe3O4的材料,采用响应曲面法设计了Box-Behnken试验方法,探究纤
本文主要研究了两个问题:首先,我们对最低阶Nédélec元的Crank-Nicolson离散格式的磁热耦合模型的二重网格算法进行超收敛性分析.我们的主要贡献将包括两部分.一方面,为了克服经典的二重网格算法对于最低阶Nedelec元不收敛的困难,我们把粗网格上非线性项在超收敛解处进行牛顿型泰勒展开,这是不同于经典的二重网格在粗网格上的处理数值解的方法.另一方面,我们利用插值后处理技术提高了二重网格解
“皇帝的新装”真实并广泛的存在于现代组织中,2001年美国安然的破产事件,2017年中国长生生物集团的“疫苗案”,这些现实中真实存在的沉默案例均表明员工沉默在大多数时候是非常有害的,不仅会降低组织的工作绩效和管理者的决策质量,也会降低员工的积极性,产生倦怠等不好的情绪,还会间接对他人造成伤害。当代的公司管理者都希望可以高效地解决组织内员工沉默这一消极的现象。员工沉默与领导者密切相关,学术界新出现的
目标跟踪算法作为计算机视觉中的经典问题,过去几十年来激发了许多国内外研究学者的兴趣,目标跟踪算法也随之得到了突破性进展,广泛引用到了生活和工作当中。该技术历时几十年的发展,相继不断改进发展出了Kalman滤波、粒子滤波、Mean Shift算法等经典跟踪算法,其中Mean Shift跟踪算法作为单目标跟踪算法里最经典的算法,以其计算量小,且对目标发生边缘遮挡、旋转、变形等不敏感的优点广泛受到学者关
纤维素是世界存在最广泛的可再生资源,利用微生物生产的纤维素酶可以将其降解转化成可直接利用的小分子物质。对解决环境污染、农作物资源浪费等问题具有重大意义。本文主要针对高温降解纤维素菌株的筛选、产酶条件的优化、单一组分纤维素酶的分离纯化及蛋白酶酶学性质的研究等方面进行探索。结果如下:(1)于三种堆肥中分离出12株纤维素降解菌株,经过初筛和复筛结合对比,获得一株能够高效降解纤维素的嗜热菌株A7。对菌株进
目的1.观察温阳祛邪针灸法治疗轻中度抑郁症的临床有效性,并比较其与认知行为疗法的疗效差异。探讨温阳祛邪针灸法是否为轻中度抑郁症的临床治疗提供一种有效、可行的方案。2.观察温阳祛邪针灸组和认知行为疗法组的轻中度抑郁症患者血浆中促肾上腺皮质激素(ACTH)及皮质醇(CORT)的变化,从HPA轴的角度分析温阳祛邪针灸法对轻中度抑郁症患者产生疗效的作用机制。方法将符合诊断及纳入标准的60例轻中度抑郁症患者
目的本研究调查本科护生考试焦虑、元认知能力、学业自我效能感和应对方式的现状及影响因素,探讨考试焦虑、元认知能力、学业自我效能感和应对方式之间的相关性,为在本科护理学生中开展有效的心理健康教育提供科学依据。方法本研究采用便利抽样法,于2018年5~8月,将辽宁省5所普通高等教育医学院校(沈阳医学院、辽宁中医药大学、锦州医科大学、大连医科大学、中国医科大学)的本科护理学生作为研究对象。应用一般情况调查
专利作为发明创造的法定市场独占权,不仅是当今世界普遍认可的民事权利,而且因其对技术市场的合法垄断而构成重要的市场资源。随着知识经济的发展,技术的日趋复杂,专利数量的
高光谱图像的光谱波段数目一般达到上百个,可以提供较为丰富的光谱信息,图像中的每个像素都可以看成是一个高维度的向量。虽然数百个维度的光谱信息可以允许更精细的地物分类,但过高维度和样本数量之间的不平衡问题也制约了高光谱影像分类方法的发展。如何解决高维小样本遥感影像分类问题、如何实现同物异谱的地物精细分类问题等仍然是高光谱图像处理的难点。本论文深入分析了高光谱遥感图像空间上下文信息与邻域像素的联系,提出
深度卷积神经网络(DCNN)的基本运算单元为卷积计算,这种计算具有局部连接与平移不变等特性,可以有效提取图像数据的特征,但是卷积计算不具有尺度不变性,这导致DCNN存在对目标尺度变化不适应的问题,无法同时提取到对多个尺度目标均有效的特征。目前,解决DCNN对目标尺度变化不适应的一种有效方法是多尺度特征融合。本文研究现有的多尺度特征融合方法,在人头检测与计数任务中进行应用与改进,提升卷积神经网络的性