利用决策树算法对机场气象数据进行分析和分类,以实现对能见度的有效预测代码

时间: 2025-02-15 08:17:58 浏览: 31
以下是利用决策树算法对机场气象数据进行分析和分类,以实现对能见度的有效预测的代码: ```python import pandas as pd import os from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.tree import DecisionTreeClassifier, export_graphviz from sklearn.metrics import classification_report from sklearn.preprocessing import StandardScaler from sklearn import tree import matplotlib.pyplot as plt # 读取文件,替换为你的Excel文件路径 excel_file = pd.ExcelFile(r'C:\Users\a1589\Desktop\大作业题目和数据/总表.xlsx') # 获取指定工作表中的数据 df = excel_file.parse('Sheet1') # 定义函数,将RVR DATA的值按照给定规则进行分类 def classify_rvr(rvr_value): if rvr_value > 1000: return '好' elif 200 <= rvr_value <= 1000: return '一般' else: return '较差' # 对RVR DATA进行分类 df['RVR_CLASS'] = df['RVR DATA'].apply(classify_rvr) # 提取特征变量和目标变量 X = df[['WS2A (MPS)', 'PAINS (HPA)', 'TEMP (掳C)', 'RH (%)', 'LIGHTS']] y = df['RVR_CLASS'] # 使用StandardScaler对X进行标准化 scaler = StandardScaler() X_scaled = pd.DataFrame(scaler.fit_transform(X), columns=X.columns) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42) # 创建决策树分类器并训练模型 dtc = DecisionTreeClassifier(random_state=42) # 定义参数范围 param_grid = { 'max_depth': [3, 5, 7, 9], 'min_samples_split': [2, 4, 6, 8], 'min_samples_leaf': [1, 2, 3, 4] } # 创建GridSearchCV对象,设置cv=5进行5折交叉验证以找到最佳超参数 grid_search = GridSearchCV(estimator=dtc, param_grid=param_grid, cv=5) # 在训练集上进行模型训练和超参数搜索 grid_search.fit(X_train, y_train) # 输出最佳模型及其对应的超参数 best_classifier = grid_search.best_estimator_ print("最佳超参数模型超参数:", grid_search.best_params_) # 在测试集上进行预测 y_pred = best_classifier.predict(X_test) # 输出分类报告 report = classification_report(y_test, y_pred) print("分类报告:", report) # 定义DataFrame存储分类预测结果,新建y_pred列表示预测值 predicted_data = X_test[['WS2A (MPS)', 'PAINS (HPA)', 'TEMP (掳C)', 'RH (%)', 'LIGHTS']] predicted_data['y_pred'] = y_pred # 创建存储模型文件的目标路径 target_directory = '/mnt/classification_result' # 如果目标文件夹不存在,创建它 if not os.path.exists(target_directory): os.makedirs(target_directory) # 将classification_result DataFrame保存为新文件 new_file_path = '/mnt/classification_result/new_file.xlsx' predicted_data.to_excel(new_file_path, index=False) # 设置图片清晰度 plt.rcParams['figure.dpi'] = 300 # 设置中文字体 plt.rcParams['font.sans-serif'] = ['WenQuanYi Zen Hei'] # 设置负号正确显示 plt.rcParams['axes.unicode_minus'] = False # 绘制决策树 plt.figure(figsize=(10, 6)) tree.plot_tree(best_classifier, filled=True, feature_names=['WS2A', 'PAINS', 'TEMP', 'RH', 'LIGHTS'], rounded=True, class_names=['好', '一般', '较差']) # 添加轴标签和图标题 plt.xlabel('决策树图') # 显示网格线 plt.grid(True) plt.show() ``` ### 代码说明: 1. **数据读取**:从Excel文件中读取气象数据。 2. **数据预处理**:定义一个函数 `classify_rvr` 将RVR DATA的值分类为“好”、“一般”和“较差”,并将分类结果添加到数据框中。 3. **特征提取**:提取特征变量和目标变量。 4. **数据标准化**:使用 `StandardScaler` 对特征变量进行标准化。 5. **数据分割**:将数据划分为训练集和测试集。 6. **模型训练**:使用 `DecisionTreeClassifier` 创建决策树分类器,并通过 `GridSearchCV` 进行超参数搜索。 7. **模型评估**:在测试集上进行预测,并输出分类报告。 8. **结果保存**:将分类预测结果保存为新的Excel文件。 9. **决策树可视化**:绘制决策树并显示。 希望这段代码对你有所帮助!如果有任何问题或需要进一步的帮助,请随时告诉我。
阅读全文

最新推荐

recommend-type

Python中利用LSTM模型进行时间序列预测分析的实现

时间序列预测是基于历史数据对未来事件的特征进行预测。在时间序列模型中,每个观测值不仅依赖于其自身的特征,还依赖于之前的时间点。与传统的回归分析不同,时间序列分析不考虑特征之间的因果关系,而是关注数据随...
recommend-type

应用GWR模型和克里金法对空气质量指数进行预测

在本篇论文中,作者探讨了如何利用地理加权回归(Geographically Weighted Regression, GWR)模型和克里金(Kriging)插值法对空气质量指数进行预测。这两种方法都是地理信息系统(Geographic Information System, ...
recommend-type

蒸散发数据的处理及空间分析建模的学习

数据集基于多种遥感和气象观测数据,如CMFD辐射、GLASS地表特性、ERA5-land气象数据等,确保了数据的准确性和完整性。 在数据处理过程中,首先需要将原始的NetCDF格式数据转换成更易于地理信息系统(GIS)处理的...
recommend-type

气象监测系统分析和设计

在构造阶段,需要引入概念类和实现类,并对领域模型进行迭代,得到设计模型。在交付阶段,需要将设计类映射为代码,实现系统的功能。 本资源摘要信息还详细讲解了气象监测系统的建模过程,包括初始阶段、细化阶段、...
recommend-type

简单函数绘图语言解释器的设计与实现

资源下载链接为: https://pan.quark.cn/s/2dd7a62c6319 开发一个用于简单绘图语言的解释器,该解释器能够接收以该绘图语言编写的源代码。经过词法、语法和语义分析后,解释器将根据源代码中定义的图形内容,在显示器(或窗口)上绘制出相应的图形。在实现过程中,利用编译工具LEX/YACC来定义绘图语言的词法规则和语法规则,而解释器的语义部分则使用C/C++语言进行编写。实验所使用的操作系统为Windows 10,开发环境为Microsoft Visual Studio Community 2017版本。整个项目任务分为三个主要模块:词法分析模块、语法分析模块和语义分析模块。
recommend-type

JSON.js库全集解析:数据交换的轻量级格式

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它基于JavaScript的一个子集。由于其语言无关性,JSON已经被广泛地用于Web开发中,作为客户端与服务器之间交换数据的格式。在IT行业,熟练掌握JSON的使用对于前端开发者和后端开发者都是十分重要的基础技能。 JSON可以表示如下数据类型: 1. 对象(Object):由零个或多个键值对组成的无序集合。键是字符串,值可以是字符串、数字、布尔值、null、数组或对象。 2. 数组(Array):一个值的有序列表,可以包含不同类型的数据。 3. 值(Value):可以是字符串、数字、布尔值、null、对象或数组。 4. 字符串(String):由双引号包围的文本序列。 5. 数字(Number):不带引号的数字,可以是整数也可以是浮点数。 6. 布尔值(Boolean):两个值:true 或 false。 7. null:表示空值或不存在的值。 JSON在JavaScript中的使用通常通过全局对象`JSON`来处理。`JSON`对象提供了如下方法: 1. `JSON.stringify(value[, replacer[, space]])`:将JavaScript值转换成JSON字符串。可以接受两个可选参数,`replacer`用于过滤和转换结果,`space`用于美化输出。 2. `JSON.parse(text[, reviver])`:将JSON字符串解析成JavaScript值。可以接受一个可选参数,`reviver`用于在返回之前对值进行转换。 除了这些方法,JSON本身并不是一种编程语言的方言,而是一种数据格式。它之所以和JavaScript紧密相关,是因为它的语法与JavaScript对象字面量的语法几乎相同,不过它是一个独立的标准,并且可以在多种编程语言之间使用。 文件`douglascrockford-JSON-js-8e0b15c`似乎是指向JSON的创造者Douglas Crockford所编写的JavaScript版本的实现。Douglas Crockford是位著名的软件开发人员和作家,因其对JavaScript的贡献而闻名,特别是推动JSON成为互联网上数据交换的标准。在他的著作和演讲中,他详细介绍了JSON的原理和它在Web开发中的应用。由此,我们可以推断此压缩包包含JSON在JavaScript中的完整实现。 对于开发者而言,理解JSON是至关重要的,因为它是前后端通信的桥梁。前端开发者需要将JSON格式的响应解析为JavaScript对象,以便在网页中使用。后端开发者则需要处理客户端发送的JSON数据,并将其转换为数据库可以理解的格式。同时,服务器也常常将数据以JSON格式返回给前端,因此了解如何正确使用JSON是每个开发者的必备技能。 JSON数据交换格式的优势在于它的简单性、可读性和互操作性。JSON字符串通常比相同信息的XML字符串要短小,且易于阅读和编写。由于其广泛的应用和兼容性,JSON已经成为Web服务API的首选数据格式。 此外,JSON还被扩展为JSON5和JSON-LD等格式。JSON5提供了一些扩展,比如支持单引号字符串、注释以及更灵活的数字格式。JSON-LD(Linked Data)则是一种基于JSON格式的、用于数据的标记语言,它旨在通过添加语义信息来改善数据的互操作性。 总结来说,JSON是一种简单但功能强大的数据交换格式,它简洁、灵活并且跨平台,已被广泛应用于Web开发中。了解并掌握JSON的使用方法是任何IT从业者的一项基本技能,无论是在前端开发、后端开发还是数据交换和处理中,都会经常用到JSON。而Douglas Crockford贡献的JSON.js库提供了在JavaScript环境中的标准实现,是学习和使用JSON不可或缺的一部分。
recommend-type

性能优化秘籍:千兆交换机ZXR10 5200E系列的性能解析

# 摘要 本文对千兆交换机ZXR10 5200E系列进行了全面的概述和分析。首先介绍了该系列交换机的基本性能指标,包括吞吐量、延迟和背板带宽等,并对这些指标进行了理论上的解析。随后,文章深入探讨了性能优化的实践策略,涵盖了硬件升级、流量管理和QoS配置,以及软件固件更新和日常维护等方面。在实战应用部分,文中分析了交换机
recommend-type

python pyqt6多行文本输入框

<think>我们正在处理用户关于PyQt6多行文本输入框的查询。根据引用[3],QTextEdit控件支持多行文本输入,并提供了格式化功能。虽然引用中展示的是PyQt5的示例,但PyQt6中的用法类似,我们可以提供相应的PyQt6代码示例。用户需求:在PyQt6中实现多行文本输入框的方法和示例代码。解决方案:1.使用QTextEdit控件,它支持多行文本输入。2.创建QTextEdit对象,并设置其父对象为窗口。3.可以通过setPlaceholderText设置提示文本,通过setPlainText设置初始文本等。示例代码:```pythonimportsysfromPyQt6.QtWid
recommend-type

Thinkpad T410i笔记本SATA驱动程序安装指南

在计算机硬件中,SATA(Serial Advanced Technology Attachment)是一种数据传输接口,它被广泛用于连接主板与存储设备,如硬盘驱动器、固态硬盘等。SATA接口通过串行信号的方式传输数据,相较于早期的并行接口,SATA在传输速度上有显著提升,并且具有更强的纠错能力。随着计算机技术的不断发展,SATA接口标准也经历了几个版本的迭代,比如SATA 1.0、SATA 2.0、SATA 3.0等,每个版本的传输速率都有所提高。 ThinkPad T410i是联想公司推出的一款商用笔记本电脑,属于ThinkPad系列。它搭载了英特尔酷睿二代处理器,并且支持多种配置选项。ThinkPad T410i作为一款老旧型号的笔记本,其内部组件的驱动程序随着硬件的更新换代而发生改变,因此,对于使用旧款笔记本电脑的用户而言,获取正确的SATA驱动程序至关重要,以保证系统稳定运行和设备性能的最大化。 在本例中,我们需要关注的是ThinkPad T410i的SATA驱动程序。SATA驱动程序是操作系统和SATA设备之间进行通信的软件接口。正确的SATA驱动程序可以确保操作系统正确识别并高效地管理连接的存储设备。如果没有合适的SATA驱动程序,可能会导致设备无法启动、设备性能下降或者存储设备的某些功能无法使用等故障。 对于ThinkPad T410i来说,SATA驱动程序通常包含在联想官方提供的驱动安装包中。用户可以通过以下几种方式来获取和安装: 1. 访问联想官方网站的支持页面,根据提供的产品型号和服务标签搜索,下载对应的驱动程序安装包。 2. 使用联想提供的ThinkVantage系统更新工具,这个工具可以自动检测并更新系统所需的驱动程序。 3. 如果上述方法都无法获取到驱动程序,可以尝试直接从其他网站下载SATA驱动程序。但是出于安全和兼容性的考虑,从非官方渠道下载驱动程序存在一定的风险,用户需要确保下载来源的可靠性,并验证文件的完整性。 下载到的SATA驱动程序通常是一个或多个文件组成的压缩包。压缩包的文件名称列表可能包括以下几个方面: - 安装程序(例如:setup.exe或install.exe),用于执行驱动安装过程。 - 驱动程序文件(例如:*.inf、*.sys等),这些文件是驱动程序的核心部分,包含了操作硬件所需的指令和数据。 - 更新日志文件,记录了驱动程序的版本信息、变更内容以及更新的历史记录。 - 说明书或安装指南文件,提供有关驱动程序安装和配置的详细指导。 在安装SATA驱动程序时,用户需要按照以下步骤操作: 1. 备份重要数据,防止在安装过程中出现数据丢失的情况。 2. 关闭电脑并断开电源,移除所有非必要的外设,以避免安装过程中的意外。 3. 根据操作系统的要求,以管理员权限运行驱动程序安装文件。 4. 遵循安装向导的指示完成驱动安装。 5. 重启电脑,检查新的SATA驱动程序是否工作正常。 对于ThinkPad T410i,不同版本的Windows操作系统可能需要不同版本的SATA驱动程序。因此用户需要根据当前的操作系统版本来选择合适的驱动程序进行安装。在安装新的驱动程序之前,用户还应该确认是否有必要进行更新,因为某些情况下,使用出厂预装的驱动程序能够保持系统的最佳兼容性。 总而言之,SATA驱动程序的安装和更新是笔记本电脑维护中的一项基础工作。它对于确保计算机的存储设备能够被操作系统正确识别和高效利用至关重要。对于ThinkPad T410i的用户而言,获取并安装正确的SATA驱动程序可以帮助提升整体的电脑性能,并保证数据的安全性。
recommend-type

网络交换机的全面指南:揭秘核心基础知识(必备技能全解析)

# 摘要 网络交换机作为构建现代网络结构的核心设备,其概念、分类、硬件组成、工作机制、配置管理以及实践应用是网络工程师必须掌握的知识。本文首先介绍了网络交换机的核心概念与分类,然后深入分析了交换机的硬件组成与工作机制,包括其物理接口、模块化特点、数据转发原理及VLAN技术。接着,本文详细阐述了交换机的基本与高级配置方法,网络安全设置以及网络管理监控工具的应用。此外,文章探讨了交换机在网络设计、数据中心应用及故