for DRB_ID, lot_group in grouped: # 遍历每个参数 for param in lot_group['PARAMETER_MAPPING'].unique(): param_data = lot_group[lot_group['PARAMETER_MAPPING'] == param] # 新增计算部分 overall_mean = param_data['VALUE'].mean() overall_std = param_data['VALUE'].std() upper_bound = overall_mean + 3 * overall_std lower_bound = overall_mean - 3 * overall_std # 生成坐标标签和颜色 # x_labels = [] conditions = [ param_data['WAFER_TYPE'] == 'DRB_WAFER', param_data['WAFER_TYPE'] == 'NONE_DRB_WAFER' ] choices = [ param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str), param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str) ] tick_labels = np.select(conditions, choices, default=param_data['WAFER_TYPE'].astype(str) + '-' + param_data['WAFER_NO'].astype(str)) # 将标签添加到数据中并按标签分组 param_data['x_label'] = tick_labels sorted_data = param_data.sort_values('MEASURE_TIME').copy() grouped_by_label = sorted_data.groupby('x_label', sort=False) labels = list(grouped_by_label.groups.keys()) data = [group['VALUE'].values for name, group in grouped_by_label if not group['VALUE'].empty] 报错：C:\Users\Q06412\PycharmProjects\DRBAutoReport\watbox_v1.py:98: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy param_data['x_label'] = tick_labels

for DRB_ID, lot_group in grouped: # 遍历每个参数 for param in lot_group['PARAMETER_MAPPING'].unique(): param_data = lot_group[lot_group['PARAMETER_MAPPING'] == param].copy() # 新增计算部分 overall_mean = param_data['VALUE'].mean() overall_std = param_data['VALUE'].std() upper_bound = overall_mean + 3 * overall_std lower_bound = overall_mean - 3 * overall_std # 生成坐标标签和颜色 # x_labels = [] conditions = [ param_data['WAFER_TYPE'] == 'DRB_WAFER', param_data['WAFER_TYPE'] == 'NONE_DRB_WAFER' ] choices = [ param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str), param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str) ] tick_labels = np.select(conditions, choices, default=param_data['WAFER_TYPE'].astype(str) + '-' + param_data['WAFER_NO'].astype(str)) # 将标签添加到数据中并按标签分组 param_data['x_label'] = tick_labels sorted_data = param_data.sort_values('MEASURE_TIME').copy() grouped_by_label = sorted_data.groupby('x_label', sort=False) labels = list(grouped_by_label.groups.keys()) data = [group['VALUE'].values for name, group in grouped_by_label if not group['VALUE'].empty] # 创建绘图 plt.figure(figsize=(20, 10)) boxplot = plt.boxplot( data, tick_labels=labels, patch_artist=True ) # 设置颜色 COLOR_MAP = { 'DRB_WAFER': '#66CDAA', 'NONE_DRB_WAFER': '#FFDEAD', 'default': '#B0C4DE' } for i, (name, group) in enumerate(grouped_by_label): wafer_type = group['WAFER_TYPE'].iloc[0] color = COLOR_MAP.get(wafer_type, COLOR_MAP['default']) boxplot['boxes'][i].set_facecolor(color) #mean+-3sigma plt.axhline(y=overall_mean, color='r', linestyle='-', linewidth=1,label='Mean') plt.axhline(y=upper_bound, color='r', linestyle='-', linewidth=1,label='mean+3σ') plt.axhline(y=lower_bound, color='r', linestyle='-', linewidth=1,label='mean-3σ') # 设置图表属性 plt.title(f"DRB_ID: {DRB_ID} - Parameter: {param}") plt.xticks(rotation=90) plt.grid(True) plt.ylim(auto=True) # 确保y轴自适应将每个组的data中的所有点标识在图上，并且按照wafertype颜色添加图例

首先，用户的代码结构大概是这样的：他们按DRB_ID和lot_group分组，然后对每个参数进行处理。计算整体的均值和标准差，生成上下限。接着根据WAFER_TYPE生成标签，排序数据，然后分组画箱线图，设置颜色，添加均值线...

数据库连接信息 dsn = ( “(DESCRIPTION=” “(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=10.10.164.60)(PORT=1521)))” “(CONNECT_DATA=(SERVICE_NAME=YMSDB01)))” ) username = ‘acme’ password = ‘acme’ oracledb.init_oracle_client(lib_dir=r"C:\Users\Q06412\Downloads\instantclient-basic-windows.x64-21.17.0.0.0dbru\instantclient_21_17") connection = oracledb.connect(user=username, password=password, dsn=dsn) try: cursor = connection.cursor() sql_query = “”" select * FROM ACME.DRB_DATA “”" cursor.execute(sql_query) results = cursor.fetchall() drbdata = pd.DataFrame(results, columns=columns) site_columns = [f’SITE{i}_VAL’ for i in range(1, 26)] melted_data = drbdata.melt( id_vars=[‘DRB_ID’,‘PARAMETER_MAPPING’, ‘LOTNO’, ‘WAFER_NO’, ‘MEASURE_TIME’, ‘WAFER_TYPE’], value_vars=site_columns, var_name=‘SITE’, value_name=‘VALUE’) melted_data[‘VALUE’] = melted_data[‘VALUE’].astype(float) melted_data = melted_data.dropna(subset=[‘VALUE’]) grouped = melted_data.groupby(‘DRB_ID’) #drbid和lotno应该是一一对应的关系 for DRB_ID, lot_group in grouped: for param in lot_group[‘PARAMETER_MAPPING’].unique(): param_data = lot_group[lot_group[‘PARAMETER_MAPPING’] == param].copy() conditions = [ param_data[‘WAFER_TYPE’] == ‘DRB_WAFER’, param_data[‘WAFER_TYPE’] == ‘NONE_DRB_WAFER’ ] choices = [ param_data[‘LOTNO’].astype(str) + ‘-’ + param_data[‘WAFER_NO’].astype(str), param_data[‘LOTNO’].astype(str) + ‘-’ + param_data[‘WAFER_NO’].astype(str) ] tick_labels = np.select(conditions, choices, default=param_data[‘WAFER_TYPE’].astype(str) + ‘-’ + param_data[‘WAFER_NO’].astype(str)) 将标签添加到数据中并按标签分组 param_data[‘x_label’] = tick_labels sorted_data = param_data.sort_values(‘MEASURE_TIME’).copy() grouped_by_label = sorted_data.groupby(‘x_label’, sort=False) 同时过滤空分组 filtered_groups = [(name, group) for name, group in grouped_by_label if not group[‘VALUE’].empty] labels = [name for name, _ in filtered_groups] data = [group[‘VALUE’].values for _, group in filtered_groups] 创建绘图 plt.figure(figsize=(20, 10)) boxplot = plt.boxplot( data, tick_labels=labels, patch_artist=True, # 必须开启才能填充颜色 ) 设置图表属性 plt.title(f"DRB_ID: {DRB_ID} - Parameter: {param}") plt.xticks(rotation=90) plt.grid(True) #保存结果 datasave = f"H:/DRB/{DRB_ID}" if not os.path.exists(datasave): os.makedirs(datasave) box_save_dir = f"H:/DRB/{DRB_ID}/{param}.png" plt.savefig(box_save_dir, bbox_inches=‘tight’,dpi=300) plt.close() box_dir = f"H:/DRB/{DRB_ID}" prs = Presentation() slide_layout = prs.slide_layouts[6] # 空白版式 try: box_images = sorted( [os.path.join(box_dir, f) for f in os.listdir(box_dir) if f.endswith((‘.png’, ‘.jpg’, ‘.jpeg’))]) except FileExistsError: raise Exception(f"目录不存在：{box_dir}") total_pages = len(box_images) // 4 + 1 for page in range(total_pages): slide = prs.slides.add_slide(slide_layout) _add_images_to_slide( slide, box_images[page * 4: (page + 1) * 4], left_start=Inches(1.0), top_start=Inches(0.6), ） output_path = “H:/DRB” os.makedirs(os.path.dirname(output_path), exist_ok=True) if not os.path.exists(output_path): os.makedirs(output_path) prs.save(f"{output_path}/{DRB_ID}.pptx") #确认路径中是否包含{DRB_ID}.pptx,如果包含则update status=1 if contains_file(output_path, f"{DRB_ID}.pptx"): try: dsn = ( “(DESCRIPTION=” “(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=10.10.164.60)(PORT=1521)))” “(CONNECT_DATA=(SERVICE_NAME=YMSDB01)))” ) username = ‘acme’ password = ‘acme’ oracledb.init_oracle_client( lib_dir=r"C:\Users\Q06412\Downloads\instantclient-basic-windows.x64-21.17.0.0.0dbru\instantclient_21_17") connection2 = oracledb.connect(user=username, password=password, dsn=dsn) cursor = connection2.cursor() sql_query = """ update DRB_INFO_CONFIG set status = :1 where DRB_ID = :2 """ cursor.execute(sql_query, (1, f"{DRB_ID}")) connection2.commit() finally: if ‘connection2’ in locals(): connection2.close() except Exception as e: print(e) finally: cursor.close() connection.close() oracledb.exceptions.InterfaceError: DPY-1001: not connected to database

用户可能不太清楚这些参数的具体含义，需要解释每个部分的作用。比如HOST是数据库服务器的IP地址，PORT是监听端口，SERVICE_NAME是数据库服务名。接下来是oracledb.init_oracle_client，这里指定了Oracle客户端的...

# 遍历每个参数 for param in melted_data['PARAMETER_MAPPING'].unique(): param_data = melted_data[melted_data['PARAMETER_MAPPING'] == param].copy() # 新增计算部分在box图上的所有数据查出的所有数据 overall_mean = param_data['VALUE'].mean() overall_std = param_data['VALUE'].std() upper_bound = overall_mean + 3 * overall_std lower_bound = overall_mean - 3 * overall_std # 生成坐标标签和颜色 conditions = [ param_data['WAFER_TYPE'] == 'DRB_WAFER', param_data['WAFER_TYPE'] == 'NONE_DRB_WAFER' ] choices = [ param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str), param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str) ] tick_labels = np.select(conditions, choices, default=param_data['WAFER_TYPE'].astype(str) + '-' + param_data['WAFER_NO'].astype(str)) # 将标签添加到数据中并按标签分组 param_data['x_label'] = tick_labels sorted_data = param_data.sort_values( by=['MEASURE_TIME', 'x_label', 'WAFER_NO'], # 多列排序列表 ascending=[True, True, True] # 对应列的排序方式（默认True可省略） ).copy() grouped_by_label = sorted_data.groupby('x_label', sort=False) # 同时过滤空分组 filtered_groups = [(name, group) for name, group in grouped_by_label if not group['VALUE'].empty ]过滤掉default组的8倍sigma以外的值

- **功能**：提取数据中所有唯一的参数名称（PARAMETER_MAPPING），逐个遍历每个参数。 - **关键操作**：通过unique()获取唯一参数列表，筛选当前参数对应的数据存入param_data。 --- ### 二、统计量计算 ...

遍历每个参数 for param in melted_data['PARAMETER_MAPPING'].unique(): param_data = melted_data[melted_data['PARAMETER_MAPPING'] == param].copy() # 新增计算部分在box图上的所有数据查出的所有数据 overall_mean = param_data['VALUE'].mean() overall_std = param_data['VALUE'].std() upper_bound = overall_mean + 3 * overall_std lower_bound = overall_mean - 3 * overall_std # 生成坐标标签和颜色 conditions = [ param_data['WAFER_TYPE'] == 'DRB_WAFER', param_data['WAFER_TYPE'] == 'NONE_DRB_WAFER' ] choices = [ param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str), param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str) ] tick_labels = np.select(conditions, choices, default=param_data['WAFER_TYPE'].astype(str) + '-' + param_data['WAFER_NO'].astype(str)) # 将标签添加到数据中并按标签分组 param_data['x_label'] = tick_labels sorted_data = param_data.sort_values( by=['MEASURE_TIME', 'x_label', 'WAFER_NO'], # 多列排序列表 ascending=[True, True, True] # 对应列的排序方式（默认True可省略） ).copy() grouped_by_label = sorted_data.groupby('x_label', sort=False) # 同时过滤空分组 filtered_groups = [(name, group) for name, group in grouped_by_label if not group['VALUE'].empty ]过滤掉default组的8倍sigma以外的值，若需过滤 8 � 8σ外的数据，需补充对应计算与条件判断。

好的，我现在需要帮助用户理解他们提供的代码段，特别是遍历每个参数并进行数据处理的流程。首先，我要仔细阅读用户给出的代码和注释，确保自己完全理解每一部分的功能。用户的问题是关于遍历参数并处理数据，可能...

遍历每个参数 for param in melted_data['PARAMETER_MAPPING'].unique(): param_data = melted_data[melted_data['PARAMETER_MAPPING'] == param].copy() # 生成坐标标签和颜色 conditions = [ param_data['WAFER_TYPE'] == 'DRB_WAFER', param_data['WAFER_TYPE'] == 'NONE_DRB_WAFER' ] choices = [ param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str), param_data['LOTNO'].astype(str) + '-' + param_data['WAFER_NO'].astype(str) ] tick_labels = np.select(conditions, choices, default=param_data['WAFER_TYPE'].astype(str) + '-' + param_data['WAFER_NO'].astype(str)) # 将标签添加到数据中并按标签分组 param_data['x_label'] = tick_labels sorted_data = param_data.sort_values( by=['MEASURE_TIME', 'x_label', 'WAFER_NO'], # 多列排序列表 ascending=[True, True, True] # 对应列的排序方式（默认True可省略） ).copy() grouped_by_label = sorted_data.groupby('x_label', sort=False) # 同时过滤空分组 filtered_groups = [(name, group) for name, group in grouped_by_label if not group['VALUE'].empty] labels = [name for name, _ in filtered_groups] data = [group['VALUE'].values for _, group in filtered_groups] # 创建绘图 plt.figure(figsize=(20, 10)) boxplot = plt.boxplot( data, labels=labels, patch_artist=True # 必须开启才能填充颜色 ) # 绘制散点（保持颜色同步） x = np.random.normal(i + 1, 0.04, size=len(group['VALUE'])) plt.scatter(x, group['VALUE'], alpha=0.5, edgecolor=scatter_color, # 散点边缘色 facecolor=scatter_color, # 散点填充色 linewidths=0.8, zorder=3) #设置高于箱线图的层级) 只过滤掉default=param_data['WAFER_TYPE'].astype(str) + '-' + param_data['WAFER_NO'].astype(str)该label 8倍sigma以外的点

\text{for param in melted_data['PARAMETER_MAPPING'].unique()} $$ 1. 通过unique()获取所有独立参数名 2. 对每个参数生成子数据集： $$param\_data = melted\_data[melted\_data['PARAMETER\_MAPPING'] == ...

移动软件开发试验参考指导书.doc

操作系统专业课程设计范本.doc

Linux系统初级培训PPT学习课件.ppt

Qt可视化界面开发资源

Ubuntu-命令技巧.doc

网络供应链管理战略模式案例.doc

公司IDC网络方案项目建议书模板.doc

RigiScan中文说明指导书.doc

银行外联网络安全解决方案全攻略样本.doc

Java多线程开发实战：这几点你肯定忽略了.doc

javaweb上机实验报告学生基础管理系统.docx

前端面试被问烂的手写题怎么回答才加分？.doc

相关推荐

mcbsp2.rar_MCBSP_Mcbsp SPI_mcbsp spi_mcbsp as spi_spi

DrB_libraries-源码.rar

Python库 | drb_impl_xml-1.0a1-py3-none-any.whl

移动软件开发试验参考指导书.doc

操作系统专业课程设计范本.doc

Linux系统初级培训PPT学习课件.ppt

Qt可视化界面开发资源

Ubuntu-命令技巧.doc

网络供应链管理战略模式案例.doc

公司IDC网络方案项目建议书模板.doc

RigiScan中文说明指导书.doc

银行外联网络安全解决方案全攻略样本.doc

Java多线程开发实战：这几点你肯定忽略了.doc

javaweb上机实验报告学生基础管理系统.docx

前端面试被问烂的手写题怎么回答才加分？.doc

大家在看

华为OLT MA5680T工具.zip

STP-RSTP-MSTP配置实验指导书 ISSUE 1.3

基于FPGA的AD9910控制设计

Android全景视频播放器 源代码

pytorch-book:《神经网络和PyTorch的应用》一书的源代码

最新推荐

移动软件开发试验参考指导书.doc

操作系统专业课程设计范本.doc

Linux系统初级培训PPT学习课件.ppt

Qt可视化界面开发资源

Ubuntu-命令技巧.doc

ASP.NET新闻管理系统：用户管理与内容发布功能

【实战派量化投资秘籍】：Pair Trading策略全方位解析

fpga中保持时间建立时间时序约束

Notepad2: 高效替代XP系统记事本的多功能文本编辑器

【mPower1203驱动故障全攻略】：排除新手疑难杂症，提升部署效率

Android全景视频播放器源代码