论文部分内容阅读
热带云团(Tropical Cloud Cluster, TCC)如何发展成热带气旋(Tropical Cyclone, TC)及其气候特征的研究对TC生成预报至关重要,但与其生成后的研究相比,TCC发展规律的研究较少。数据挖掘是一种新的数据分析技术,过去预测TC生成的统计方法普遍缺乏捕获规律的能力,而数据挖掘能够揭示数据中隐藏的规律,利用其对数据的分析能力建立分类预测模型并结合TC生成的动力学理论从中提取有用的信息,为TC生成研究提供新思路。本文利用决策树算法对TCC是否发展成TC进行分类预测,并从算法中提取影响TCC发展的关键因子,得到以下结论:(1)将TCC能否发展成为TC抽象为二元分类问题,使用CART和C4.5算法根据TC生成前24小时TCC数据对西北太平洋TC生成情况进行预测,并与判别分析的预测结果进行对比。结果表明C4.5算法比CART算法、判别分析的预测准确率高,其训练集准确率为85.69%,测试集为85.03%,能够较好地区分发展类与不发展类TCC的环境场特征。(2)决策树算法发现925hPa散度和700hPa相对涡度是区分发展与不发展TCC非常重要的环境场因子。进一步分析环境场发现,两类TCC的中低层相对涡度、低层与高层散度有显著差异,TCC发展十分依赖相对涡度和散度的配合。此外,算法还发现西北太平洋不同区域的TCC发展有很大的差异,西北太平洋不同区域热带云团生成率(Genesis Productivity, GP)的统计结果表明,NW (Northwestern)区域的GP最高,SE (Southeastern)区域GP域最低。(3)决策树算法中,海温是TCC发展的重要判断条件。夏秋季发展与不发展类TCC所处海温环境差异不显著,大气环境因子是影响其发展的主要因素,海温异常造成的大气环流场异常变化会对TCC发展产生重要影响。将GP分别与Ninno3和EMI指数进行相关分析,结果表明夏秋两季GP与Ninno3指数在SE区均显著正相关,在SW (Southwestern)区仅夏季显著正相关。夏季GP与EMI指数在SE区具有显著正相关关系,而在秋季关系并不显著,并且SCS (South China Sea)区GP与EMI指数在秋季负相关。上述结果表明两类El Nino事件对西北太平洋不同区域TCC发展产生了不同影响。