import pandas as pd from collections import defaultdict def read_input(file_path): """读取指定路径的 Excel 输入数据""" try: df = pd.read_excel(file_path) print("读取的列名:", df.columns) # 打印列名以便调试 df.columns = df.columns.str.strip() # 去掉列名的前后空格 return df.to_dict('records') except Exception as e: print(f"读取文件失败: {e}") return [] def arrange_components(components, plate_width=1500): """核心排版算法: 按板材宽度优化构件排布""" remaining = {comp['构件编号']: comp['数量'] for comp in components} layouts = defaultdict(int) # 转换宽度为数值类型，确保可以进行排序 for comp in components: comp['构件宽度（mm）'] = pd.to_numeric(comp['构件宽度（mm）'], errors='coerce') comp['构件长度（mm）'] = pd.to_numeric(comp['构件长度（mm）'], errors='coerce') while sum(remaining.values()) > 0: rows = [] total_length = 0 while True: row = [] row_width = 0 max_length = 0 # 按照宽度降序排序构件，确保宽度较大的构件优先排布 for comp in sorted(components, key=lambda x: (-x['构件宽度（mm）'], x['构件编号'])): cid = comp['构件编号'] width = comp['构件宽度（mm）'] length = comp['构件长度（mm）'] if remaining[cid] <= 0: continue available_width = plate_width - row_width if width > available_width: continue max_qty = min(remaining[cid], available_width // width) row.append({'id': cid, 'qty': max_qty, 'length': length}) remaining[cid] -= max_qty row_width += max_qty * width max_length = max(max_length, length) if not row: break rows.append({'length': max_length, 'components': row}) total_length += max_length # 生成唯一排版标识 layout_key = [] for row in rows: sorted_comps = sorted(row['components'], key=lambda x: x['id']) key_part = ','.join(f"{c['id']}:{c['qty']}" for c in sorted_comps) layout_key.append(f"{row['length']}|{key_part}") layout_key = ';'.join(layout_key) layouts[layout_key] += 1 return layouts def process_data(input_data): """按厚度分组并进行排版计算""" grouped = defaultdict(list) for comp in input_data: # 使用实际的列名 '构件厚度（mm）' grouped[comp['构件厚度（mm）']].append(comp) results = {} for thickness, comps in grouped.items(): results[thickness] = arrange_components(comps) return results def main(): """主程序入口""" # 直接指定文件路径 file_path = r"C:\Users\Administrator\Desktop\ai\构件.xlsx" input_data = read_input(file_path) if not input_data: print("没有可处理的数据，程序结束。") return results = process_data(input_data) # 输出结果 for thickness, layout in results.items(): print(f"\n厚度 {thickness}mm 的排版方案:") for plan, count in layout.items(): print(f" 方案: {plan} -> 数量: {count}") if __name__ == "__main__": main()

import pandas as pd from collections import defaultdict def read_input(file_path): """增强版数据读取""" required_columns = {'构件编号', '构件宽度（mm）', '构件长度（mm）', '构件厚度（mm）', '数量'} # 修正列名空格 try: df = pd.read_excel(file_path, engine='openpyxl') df.columns = df.columns.str.strip().str.replace(' ', '') # 去除所有空格 missing_cols = required_columns - set(df.columns) if missing_cols: raise ValueError(f"缺少必要列: {', '.join(missing_cols)}") # 增强数据校验 df = df.dropna(subset=['构件宽度（mm）', '构件长度（mm）']) df = df[(df['构件宽度（mm）'] > 0) & (df['构件长度（mm）'] > 0)] # 过滤无效值 return df.to_dict('records') except Exception as e: print(f"文件读取失败: {str(e)}") return [] def arrange_components(components, plate_width=1500): """优化后的排版算法""" # 初始化剩余数量字典 remaining = defaultdict(int) for comp in components: remaining[comp['构件编号']] = comp.get('数量', 1) # 默认数量为1 results = [] # 预排序（宽度降序 -> 长度升序） sorted_comps = sorted(components, key=lambda x: (-x['构件宽度（mm）'], x['构件长度（mm）'])) while sum(remaining.values()) > 0: current_row = [] used_width = 0 max_length = 0 # 单行排版 for comp in sorted_comps: cid = comp['构件编号'] width = comp['构件宽度（mm）'] length = comp['构件长度（mm）'] if remaining[cid] <= 0 or width > plate_width: continue # 计算可放置数量 available = (plate_width - used_width) // width place_qty = min(remaining[cid], available) if place_qty > 0: current_row.append(f"{cid}x{place_qty}") used_width += place_qty * width max_length = max(max_length, length) remaining[cid] -= place_qty if current_row: results.append({ "板材长度": max_length, "构件组合": "+".join(current_row), "使用宽度": used_width }) return results def process_data(input_data): """新增处理函数""" thickness_groups = defaultdict(list) for comp in input_data: thickness_groups[comp['构件厚度（mm）']].append(comp) results = defaultdict(dict) for thickness, comps in thickness_groups.items(): layouts = arrange_components(comps) for idx, layout in enumerate(layouts, 1): results[thickness][f"方案{idx}"] = layout return results import pandas as pd def add_data_to_excel(thickness, width, length, layout, quantity, file_path="output.xlsx"): """ 将数据写入Excel文件参数： thickness (float): 厚度(mm) width (float): 宽度(mm) length (float): 长度(mm) layout (str): 排版方式（如"横向排列"） quantity (int): 数量 file_path (str): Excel文件路径 """ # 创建新数据行 new_row = { "厚度(mm)": thickness, "宽度(mm)": width, "长度(mm)": length, "排版方式": layout, "数量": quantity } # 读取现有数据或创建新DataFrame try: df = pd.read_excel(file_path, sheet_name="DataOutput") except FileNotFoundError: df = pd.DataFrame(columns=["厚度(mm)", "宽度(mm)", "长度(mm)", "排版方式", "数量"]) # 追加新数据 df = pd.concat([df, pd.DataFrame([new_row])], ignore_index=True) # 保存文件 df.to_excel(file_path, sheet_name="DataOutput", index=False) def main(): """主函数升级""" input_path = r"C:\Users\Administrator\Desktop\ai\构件.xlsx" output_path = r"C:\Users\Administrator\Desktop\ai\排版方案.xlsx" input_data = read_input(input_path) if not input_data: return results = process_data(input_data) save_to_excel(results, output_path) print(f"排版方案已保存至: {output_path}")

首先，代码开头导入了pandas和collections.defaultdict，这两个库在数据处理中很常见。pandas主要用于处理Excel文件，defaultdict用于管理数据结构。接下来是read_input函数。它的作用是读取输入的Excel文件，并...

import pandas as pd from collections import defaultdict def read_input(file_path): """增强版数据读取""" required_columns = {'构件编号', '构件宽度（mm）', '构件长度（mm）', '构件厚度（mm）', '数量'} try: df = pd.read_excel(file_path, engine='openpyxl') df.columns = df.columns.str.strip() # 验证必要列存在 missing_cols = required_columns - set(df.columns) if missing_cols: raise ValueError(f"缺少必要列: {', '.join(missing_cols)}") # 数据清洗 df = df.dropna(subset=['构件宽度（mm）', '构件长度（mm）']) return df.to_dict('records') except Exception as e: print(f"文件读取失败: {str(e)}") return [] def save_to_excel(results, output_path): """将排版结果保存为Excel""" output_data = [] for thickness, layouts in results.items(): for layout, count in layouts.items(): rows = layout.split(';') for row in rows: length, comps = row.split('|') output_data.append({ '厚度(mm)': thickness, '单板长度(mm)': length, '构件组成': comps, '方案复用次数': count }) pd.DataFrame(output_data).to_excel(output_path, index=False) def arrange_components(components, plate_width=1500): # 预处理：预先排序并过滤无效数据 valid_components = [ comp for comp in components if pd.notnull(comp['构件宽度（mm）']) and comp['构件宽度（mm）'] > 0 ] sorted_components = sorted(valid_components, key=lambda x: (-x['构件宽度（mm）'], x['构件编号'])) # 修改循环逻辑，使用预处理后的排序列表 while sum(remaining.values()) > 0: rows = [] total_length = 0 while True: row = [] row_width = 0 max_length = 0 # 按照宽度降序排序构件，确保宽度较大的构件优先排布 for comp in sorted(components, key=lambda x: (-x['构件宽度（mm）'], x['构件编号'])): cid = comp['构件编号'] width = comp['构件宽度（mm）'] length = comp['构件长度（mm）'] if remaining[cid] <= 0: continue available_width = plate_width - row_width if width > available_width: continue max_qty = min(remaining[cid], available_width // width) row.append({'id': cid, 'qty': max_qty, 'length': length}) remaining[cid] -= max_qty row_width += max_qty * width max_length = max(max_length, length) if not row: break rows.append({'length': max_length, 'components': row}) total_length += max_length def main(): """主函数升级""" input_path = r"C:\Users\Administrator\Desktop\ai\构件.xlsx" output_path = r"C:\Users\Administrator\Desktop\ai\排版方案.xlsx" input_data = read_input(input_path) if not input_data: return results = process_data(input_data) save_to_excel(results, output_path) print(f"排版方案已保存至: {output_path}")

df = pd.read_excel(file_path, engine='openpyxl') df.columns = df.columns.str.strip().str.replace(' ', '') # 去除所有空格 missing_cols = required_columns - set(df.columns) if missing_cols: raise...

import os import pandas as pd from collections import defaultdict # 设置目录路径 input_dir = r'E:\hulin' # 输入文件夹路径 output_dir = r'E:\hulin\processed_csvs' # 处理后的CSV文件存放路径 output_file = r'E:\hulin\merged_filtered.csv' # 最终合并后的输出文件路径 # 定义需要排除的文件名（如许可证、README等） excluded_files = { 'LICENSE.txt', 'README.txt', 'API_CHANGES.txt', 'umath-validation-set-README.txt', 'entry_points.txt', 'vendor.txt', 'AUTHORS.txt', 'top_level.txt' } # 定义必要的列名（统一转换为小写并去除空格，以便进行匹配） required_columns = { '用户id', '对手方id', '交易金额(分)', '交易用途类型', '用户银行卡号', '对手方银行卡号', '对手侧账户名称', '用户侧账号名称', '借贷类型' } # 初始化一个列表，用于存储每个文件处理后的DataFrame df_list = [] # 创建输出目录（如果不存在） os.makedirs(output_dir, exist_ok=True) # 遍历目录中的所有TXT文件 for root, dirs, files in os.walk(input_dir): for filename in files: if filename.lower().endswith('.txt') and filename not in excluded_files: file_path = os.path.join(root, filename) try: # 尝试读取TXT文件，假设使用制表符分隔 df = pd.read_csv( file_path, sep='\t', encoding='utf-8', low_memory=False ) except: # 如果读取失败，尝试其他编码 try: df = pd.read_csv( file_path, sep=',', encoding='gbk', low_memory=False ) except Exception as e: print(f"无法读取文件 {file_path}: {e}") continue # 标准化列名：去除前后空格并转换为小写 df.columns = df.columns.str.strip().str.lower() # 打印列名以供调试 print(f"文件 {filename} 的列名: {df.columns.tolist()}") # 确保必要的列存在 missing_cols = required_columns - set(df.columns) if missing_cols: print(f"文件 {filename} 缺少必要的列: {missing_cols}，跳过处理。") continue # 数据清洗：移除“对手方id”为空的行 initia

根据引用[1]和[2]，pandas的read_csv函数可以读取CSV，而引用[3]提到Pandas支持多种格式，包括CSV和Excel，但用户需要处理的是TXT和CSV。可能需要使用glob模块来批量获取文件列表，然后循环读取每个文件。对于TXT...

import pandas as pd from rectpack import newPacker import math from collections import defaultdict def process_data(input_path): # 读取并处理原始数据 df = pd.read_excel(input_path) # 添加计算列 df['构件长度'] = df['原始长度'] + 20 df['构件宽度'] = df['原始宽度'] df['构件名称'] = df['构建编号'] + '-' + df['件号'].astype(str) # 有效性验证 if (df['构件宽度'] > 1500).any(): raise ValueError("存在宽度超过1500mm的构件，无法排版！") return df def generate_packing_plan(df): # 按厚度材质分组 grouped = df.groupby(['厚度', '材质']) all_results = [] for (thickness, material), group in grouped: # 生成矩形列表 rect_list = [] for _, row in group.iterrows(): rect_list += [(row['构件长度'], row['构件宽度'], row['构件名称'])] * row['数量'] # 创建排样器 packer = newPacker( pack_algo = guillotine.GuillotineBafSas, rotation=False, # 禁用旋转 bin_algo=guillotine.GuillotineBssfSas ) # 添加矩形并排样 for r in rect_list: packer.add_rect(r) # 动态生成板材 while True: # 计算当前最大长度 max_len = max(r[0] for r in rect_list) if rect_list else 0 bin_width = 1500 bin_height = max_len + 20 packer.add_bin(bin_width, bin_height) if packer.pack(): break # 解析结果 for bid, bin in enumerate(packer): usage = bin.usage() # 计算利用率 parts = defaultdict(int) for rect in bin: parts[rect.rid] += 1 arrangement = '+'.join([f"{v}{k}" for k, v in parts.items()]) all_results.append({ '厚度': thickness, '板宽(mm)': 1500, '板长(mm)': bin.height, '板材数量': 1, '排版方案': arrangement, '利用率': usage }) return pd.DataFrame(all_results) def optimize_output(df): # 合并相同规格板材 grouped = df.groupby(['厚度', '板宽(mm)', '板长(mm)', '排版方案']) # 生成最终结果 result = [] for (thickness, width, length, plan), group in grouped: result.append({ '厚度(mm)': thickness, '板宽(mm)': width, '板长(mm)': length, '板材数量': len(group), '排版方案': plan, '平均利用率': group['利用率'].mean() }) # 排序处理 return pd.DataFrame(result).sort_values(['厚度(mm)', '板长(mm)'], ascending=[True, False]) # 主流程 if name == "main": # 输入输出文件路径 input_file = "input.xlsx" output_file = "output.xlsx" # 数据处理 raw_data = process_data(input_file) # 生成排版方案 packing_result = generate_packing_plan(raw_data) # 优化输出 final_result = optimize_output(packing_result) # 输出结果 final_result.to_excel(output_file, index=False) 完善改代码

主流程部分，输入输出文件路径正确，但可能需要处理文件是否存在的情况，比如添加异常处理，如果input.xlsx不存在，程序会崩溃。用户可能需要添加try-except块来捕获文件未找到的错误，并提供友好提示。另外，代码...

import pandas as pd from collections import defaultdict def parse_width(width_str): """解析宽度数据，返回可旋转的宽度列表""" if '' in str(width_str): return sorted([int(x) for x in str(width_str).split('')], reverse=True) return [int(width_str)] def calculate_utilization(widths, plate_width): """计算板材利用率""" return sum(widths) / plate_width def group_components(df): """按厚度和长度分组""" grouped = defaultdict(list) for _, row in df.iterrows(): key = (row['厚度'], row['长度']) grouped[key].append({ '编号': row['构件编号'], '宽度': parse_width(row['宽度']), '数量': row['数量'], '原始宽度': row['宽度'] }) return grouped def optimize_layout(components, plate_options=[1500, 1800]): """贪心算法进行排版优化""" results = [] for comp in components.copy(): while comp['数量'] > 0: best_plate = None max_utilization = 0 # 尝试所有板材规格 for plate_width in plate_options: current_width = 0 used = [] # 尝试组合当前构件 if any(w <= (plate_width - current_width) for w in comp['宽度']): selected_w = max([w for w in comp['宽度'] if w <= (plate_width - current_width)]) current_width += selected_w used.append((comp['编号'], selected_w)) comp['数量'] -= 1 # 尝试组合其他构件 for other in components: if other['数量'] <= 0 or other['编号'] == comp['编号']: continue if any(w <= (plate_width - current_width) for w in other['宽度']): selected_w = max([w for w in other['宽度'] if w <= (plate_width - current_width)]) current_width += selected_w used.append((other['编号'], selected_w)) other['数量'] -= 1 # 计算利用率 utilization = current_width / plate_width if utilization > max_utilization: max_utilization = utilization best_plate = (plate_width, used.copy()) if best_plate: results.append({ '板宽': best_plate[0], '组合': best_plate[1], '利用率': max_utilization }) return results def process_file(input_path, output_path): # 读取数据 df = pd.read_excel(input_path) # 数据预处理 grouped = group_components(df) final_results = [] # 处理每个分组 for (thickness, length), components in grouped.items(): plate_length = length + 20 # 优化排版 optimized = optimize_layout(components) # 生成结果 for plate in optimized: cutting_desc = " + ".join([f"{id}({w}mm)" for id, w in plate['组合']]) final_results.append({ '厚度': thickness, '板宽': plate['板宽'], '板长': plate_length, '板材数量': 1, # 实际需要根据数量计算 '切割方式': cutting_desc }) # 输出结果 result_df = pd.DataFrame(final_results) result_df.to_excel(output_path, index=False) # 使用示例 process_file('input.xlsx', 'output.xlsx')

1. **导入库**：用户使用了pandas和collections.defaultdict，这很常见，pandas用于数据处理，defaultdict用于分组。 2. **parse_width函数**：这个函数的作用是解析宽度字符串，如果包含星号（比如"100*200"），则...

批量文件格式转换：txt转csv时的数据类型和格式问题

在现代数据处理和分析工作中，文件格式的转换是一个不可或缺的环节。批量文件格式转换，顾名思义，是将大量的数据文件从一种格式批量地转换为另一种格式。这通常涉及数据清洗、格式标准化、错误处理等复杂的步骤。...

【ABAQUS数据处理】：Python脚本在模拟数据处理中的应用技巧

![【ABAQUS数据处理】：Python脚本在模拟数据处理中的应用技巧]...本文详细介绍了模拟数据的读取、解析、处理和分析方法，并阐述了结果的展示

【大型数据集管理术】：高效管理大型YOLO数据集的7大技巧

在当今这个数据驱动的时代，数据集的规模日益膨胀，大型数据集的处理已成为IT行业的关键挑战之一。处理大型数据集不仅需要足够的存储空间，还需要高效的管理方法来应对数据的复杂性和动态变化。本章将深入探讨处理...

Python文件操作与数据处理精讲：读写文件与数据序列化的高招

在当今的数据驱动的世界中，数据处理和文件操作是每个IT专业人员和数据科学家必备的技能。Python凭借其简洁的语法和强大的库生态系统，成为处理数据和文件操作的首选语言之一。本章将提供一个全景式的介绍，

计算机科学导论：大数据处理与分析技术

大数据指的是规模庞大、复杂多样的数据集合，传统数据处理工具和方法已经无法满足对这些数据进行存储、管理、处理和分析的需求。在定义上，大数据通常具有“3V”特征：数据量大（Volume）、数据类型多样（Variety...

Python批量文件内容替换：动态修改数据的高效方法

![Python批量文件内容替换：动态修改数据的高效方法]...文件读写是文件操作中最为常见的一环，主要涉及打开文件、读取数据、修改数据和关闭文件等基本步骤。Python 中

【数据处理必备】：Python readline在文本分析中的应用

![readline]...readline的核心是允许用户逐行输入并逐行读取，非常适合于处理文本数据和执行命令行界面操作。 python impor

【数据转换最佳实践】：从理论到实战的全面解析

![【数据转换最佳实践】：从理论到实战的全面解析]...本文从数据转换的重要性与基本原则出发，探讨了数据类型与结构、数据不一致性问题、数据清洗、预处理以及转换方法与

Python CSV特殊字符处理：避免常见错误的策略

CSV（Comma-Separated Values，逗号分隔值）文件是一种常见且简单的数据交换格式。在Python中，可以使用内置的csv模块来读取和写入CSV文件。以下是一个简单的示例，展示如何使用Python来处理CSV文件。 pyt

文本文件处理高效术：Python读写技巧大揭秘

!...# 1. Python文本文件处理入门 Python是一种广泛应用于数据处理和文本分析的编程语言。...文本文件处理涉及对存储在文件中的文本数据进行读取、分析、转换和写入。在Python中，文件被视为“一切皆文件”，无论是文

Python common库常见问题全解析：快速定位与解决之道

这些组件是Python语言不可或缺的一部分，它们支持各种常见编程任务，从文本处理到网络编程，从加密算法到数据持久化，无所不包。掌握Python common库，对于提高开发效率和保证代码质量至关重要。

Python在生物信息学的应用：分析流程与案例全解析

随后，文章深入分析了生物信息学数据处理流程，从数据读取与预处理、序列比对与相似性分析到功能注释和变异分析，强调了Python在实现这些环节中的效率和灵活性。文章还探讨了高级应用案例，如基因表达数据分析、基于...

相关推荐

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

Read data from the Excel spreadsheet.zip_Spreadsheet::Read_excel

python数据分析与可视化 import pandas as pd import numpy as np import m

批量文件格式转换：txt转csv时的数据类型和格式问题

【ABAQUS数据处理】：Python脚本在模拟数据处理中的应用技巧

【大型数据集管理术】：高效管理大型YOLO数据集的7大技巧

Python文件操作与数据处理精讲：读写文件与数据序列化的高招

计算机科学导论：大数据处理与分析技术

Python批量文件内容替换：动态修改数据的高效方法

【数据处理必备】：Python readline在文本分析中的应用

【数据转换最佳实践】：从理论到实战的全面解析

Python CSV特殊字符处理：避免常见错误的策略

文本文件处理高效术：Python读写技巧大揭秘

Python common库常见问题全解析：快速定位与解决之道

Python在生物信息学的应用：分析流程与案例全解析

大家在看

vpro图像拼接资料超详细.zip

Pdf Downloader-crx插件

frdm-k64f原理图

Ghost3211.0 桌面ghost启动工具

上海GBQ4.0-2349.rar

最新推荐

python基础教程：Python 中pandas.read_excel详细介绍

Java算法：二叉树的前中后序遍历实现

【性能测试基准】：为RK3588选择合适的NVMe性能测试工具指南

grant usage on ** to bcc@*%

Nokia手机通用密码计算器：解锁神器

【固态硬盘寿命延长】：RK3588平台NVMe维护技巧大公开

缺省参数是什么

jxl API实现Excel文件的读写操作

【故障恢复策略】：RK3588与NVMe固态硬盘的容灾方案指南

python 设置webview的浏览器版本