西储大学数据集预处理代码

### 西储大学轴承数据集预处理代码 Python 实现以下是针对西储大学轴承数据集的预处理代码实现，主要涉及读取 `.mat` 文件、提取信号数据并将其转换为适合后续分析的形式。 #### 1. 导入必要的库为了完成数据预处理任务，需要引入一些常用的科学计算库： ```python import numpy as np import matplotlib.pyplot as plt from scipy.io import loadmat ``` 上述代码片段展示了如何加载必需的第三方库来支持 MATLAB 文件解析和数值运算[^4]。 --- #### 2. 加载原始 MAT 数据文件通过 `scipy.io.loadmat()` 函数可以方便地加载存储在 `.mat` 格式的实验数据。以下是一个简单的例子展示如何访问特定路径下的数据文件： ```python path = '0hp_load_48_KHz/7_OR3.mat' data_dict = loadmat(path) # 查看字典中的键值对结构 print(data_dict.keys()) ``` 此部分用于确认目标变量名以便于下一步操作。 --- #### 3. 提取振动信号时间序列通常情况下，在这些 .mat 文件内部会有一个数组保存实际测量得到的时间域波形样本点数列。下面演示怎样获取这样的核心信息并向量形式返回出来供后续使用: ```python def extract_signal(mat_data, key='DE_time'): """ Extract the vibration signal from a loaded .mat file. Args: mat_data (dict): Loaded data dictionary using scipy.io.loadmat(). key (str): Key name of the desired signal within the dict. Returns: ndarray: Vibration time-series array extracted from the given dataset. """ try: raw_signal = mat_data[key].flatten() return raw_signal.astype(np.float32) except KeyError: raise ValueError(f"The specified key '{key}' does not exist in this .mat file.") signal_array = extract_signal(data_dict, key='X097_DE_time') # Example key may vary based on actual datasets plt.plot(signal_array[:1000]) # Plot first thousand samples to visualize waveform characteristics plt.title('Vibration Signal Waveform') plt.xlabel('Sample Index') plt.ylabel('Amplitude') plt.show() ``` 这里定义了一个函数用来标准化不同命名约定之间的差异，并且提供了错误检测机制当指定字段不存在时抛出异常提示用户修正输入参数设置^。 --- #### 4. 分割窗口化处理对于机器学习模型训练而言，往往需要将连续采集来的长条状记录切分成固定长度的小片断作为独立实例送入网络当中去学习特征表达能力。因此我们还需要设计一段逻辑来进行滑动窗分割动作： ```python def sliding_window_splitter(time_series, window_size=1024, stride=512): """ Split long time series into overlapping windows with defined size and step length. Args: time_series (ndarray): Original continuous-time domain sequence obtained earlier. window_size (int): Number of consecutive points included per segment after splitting. stride (int): Distance moved forward between two adjacent segments during iteration process. Yields: Generator yielding successive chunks sliced out according to rules set above until end reached or no more valid slices remain available anymore. """ start_idx = 0 while True: end_idx = start_idx + window_size if end_idx >= len(time_series): break yield time_series[start_idx:end_idx] start_idx += stride windowed_segments = list(sliding_window_splitter(signal_array)) num_windows = len(windowed_segments) print(f"Total number of generated windows: {num_windows}") for i, seg in enumerate(windowed_segments[:5]): plt.subplot(5, 1, i+1) plt.plot(seg) plt.title(f'Segment #{i}') plt.tight_layout() plt.show() ``` 以上脚本实现了动态调整大小步幅组合策略从而灵活适应各种应用场景需求的同时还兼顾到了效率考量因素. --- #### 5. 归一化与标签分配最后一步就是把所有的分块都做一次线性变换使得它们落在某个预先设定好的范围内比如[-1,+1], 同时也要记得给每一个对应的类别打上正确的标记好让监督算法能够区分正负样例区别对待之。 ```python labels_mapping = { 'Normal': 0, 'InnerRaceFault': 1, 'OuterRaceFault': 2, 'BallElementFault': 3 } def normalize_and_label(segments_list, label_name): normalized_segs = [(seg - seg.mean()) / seg.std() for seg in segments_list] labels = [labels_mapping[label_name]] * len(normalized_segs) return np.array(normalized_segs), np.array(labels) norm_seg, lbls = normalize_and_label(windowed_segments, 'Normal') print(norm_seg.shape, lbls.shape) ``` 至此为止整个流程已经完整呈现完毕可供读者复制粘贴直接跑起来验证效果啦! --- ###

阅读全文

西储大学数据集预处理代码

相关推荐

西储大学数据（官方版）.rar

基于深度学习的故障诊断分析[西储大学数据集+Python源码第1期]

西储大学轴承数据及EMD代码

凯斯西储大学数据数据预处理方法

西储大学轴承数据集预处理python

处理凯斯西储大学数据集的代码

西储大学轴承数据集怎么预处理

基于西储大学数据集的轴承动力学建模与Matlab故障诊断实现

基于多尺度卷积神经网络的轴承故障诊断：西储大学数据集的PyTorch实现及优化技巧

西储大学数据集scv

凯斯西储大学数据集处理

凯斯西储大学数据集制作

西储大学数据集分几类

介绍一下凯斯西储大学数据集

凯斯西储大学轴承数据集处理代码

用西储大学数据集写一段基于tensorflow轴承故障lenet代码

用凯斯西储大学轴承数据集，对数据进行预处理的具体步骤和相关matlab代码以及对处理好的数据进行svm故障诊断的详细过程以及matlab代码

编写故障诊断技术Matlab代码 条件1利用西储大学数据集2利用栈式稀疏自编码器3绘制混淆矩阵

编写故障诊断技术Matlab代码有以下条件1利用西储大学数据集2利用栈式稀疏自编码器3绘制混淆矩阵

西储大学轴承数据集

大家在看

0132、单片机-485-PC串口通信proteus仿真+程序资料.zip

VBA加密工具,将DVB文件错位加密

WebServerApp

Cluster Load Balance Algorithm Simulation Based on Repast

Tibco Document

最新推荐

中软国际Java基础课件Chapter.ppt

Evc Sql CE 程序开发实践与样例代码分享

【浪潮FS6700交换机配置实战】：生产环境快速部署策略与技巧

YOLO11训练批次参考

数据库考试复习必备五套习题精讲

【浪潮FS6700交换机故障诊断与排除】：掌握这些方法，让你的网络稳定如初

JVM内存整体结构图

GEF应用实例：掌握界面设计的六步走

掌握Python FloodRouting：构建洪水预测模型的终极指南

Python批量修改文件后缀

编写故障诊断技术Matlab代码条件1利用西储大学数据集2利用栈式稀疏自编码器3绘制混淆矩阵