SELECT eqc.equipment_number, SUBSTRING(eqc.source FROM 1 FOR LENGTH(eqc.source) - 4) AS equipment_name, eqc."CREATION_TIME" AS creation_time, ROUND((EXTRACT(EPOCH FROM (COALESCE(NOW(), date_trunc('second', now())::timestamp) - eqc."CREATION_TIME")) / 60)::NUMERIC,2) AS cost_time FROM equipment_quantity_collection AS eqc WHERE eqc."CREATION_TIME" IN( SELECT MAX("CREATION_TIME") AS time_sqe FROM equipment_quantity_collection AS eqc_sqe WHERE eqc_sqe."CREATION_TIME" > now()- INTERVAL '7 DAY' AND eqc_sqe.operation_number not in('BBCQ','JXHZDHJ','HH') GROUP BY eqc_sqe.equipment_number) AND ROUND((EXTRACT(EPOCH FROM (COALESCE(NOW(), date_trunc('second', now())::timestamp) - eqc."CREATION_TIME")) / 60)::NUMERIC,2) > 240 ORDER BY eqc."CREATION_TIME"

时间: 2025-06-23 22:19:12 浏览: 20

<think>好的，我现在需要帮助用户优化和理解一个复杂的SQL查询。用户的问题是从equipment_quantity_collection表中筛选出CREATION_TIME的最大值，排除特定的operation_number，同时计算cost_time超过240分钟的情况。首先，我得仔细分析用户的需求，可能存在的性能问题，以及如何正确实现这些逻辑。首先，用户提到要“通过CREATION_TIME进行最大值筛选”。这通常意味着他们需要每个分组中的最新记录。例如，可能按设备或其他字段分组，取每组中CREATION_TIME最大的那条记录。这时候可能需要用到窗口函数，比如ROW_NUMBER() OVER (PARTITION BY ... ORDER BY CREATION_TIME DESC)，或者使用MAX()配合GROUP BY。但用户的具体分组条件还不明确，可能需要进一步确认，但假设用户是按某个字段分组的，比如EQUIPMENT_ID。接下来是“排除特定operation_number”。这应该比较简单，使用NOT IN或者!=来排除不需要的operation_number值。需要注意的是，如果排除的列表很长，可能会影响性能，但一般这种过滤条件效率还是可以的。然后，计算cost_time超过240分钟的情况。这里需要明确cost_time是如何存储的。如果cost_time是以分钟为单位的数值字段，那么直接WHERE cost_time > 240即可。但如果cost_time是时间格式，比如存储的是时间差或时间戳，可能需要转换。例如，如果cost_time是时间间隔，可能需要使用DATEDIFF或其他日期函数来计算分钟数。不过用户的问题中可能已经假设cost_time是分钟数，所以暂时可以按数值处理。接下来，用户可能需要将这三个条件结合起来。可能的SQL结构是筛选出每个分组的最大CREATION_TIME记录，排除某些operation_number，并且cost_time超过240。这时候需要注意子查询或CTE的使用，尤其是在处理分组最大值时，可能需要先找到每个组的最大时间，再关联回原表获取其他字段。关于优化，如果原表数据量大，使用窗口函数可能会导致性能问题，尤其是没有合适的索引时。需要检查是否有索引在CREATION_TIME和分组字段上，或者是否可以使用覆盖索引。另外，排除operation_number的条件应尽可能提前应用，减少后续处理的数据量。例如，在子查询中就排除这些记录，而不是在外部查询中处理。可能的优化步骤包括： 1. 创建合适的索引，比如在分组字段和CREATION_TIME上建立复合索引。 2. 使用更高效的子查询方式，比如使用JOIN而不是窗口函数来获取最大值。 3. 确保排除条件和过滤条件尽早应用，减少中间结果集的大小。此外，用户可能需要计算超过240分钟的记录数量，或者是筛选这些记录。如果是前者，可能需要聚合函数如COUNT，但根据问题描述，可能只是筛选这些记录。需要确认用户是否需要返回所有符合条件的记录，还是进行某种聚合。总结下来，正确的SQL结构可能包括： - 子查询或CTE来获取每个分组的最大CREATION_TIME - 主查询中关联子查询，排除特定operation_number，并过滤cost_time > 240 例如： WITH MaxCreation AS ( SELECT GROUP_ID, MAX(CREATION_TIME) AS MaxTime FROM equipment_quantity_collection GROUP BY GROUP_ID ) SELECT e.* FROM equipment_quantity_collection e JOIN MaxCreation m ON e.GROUP_ID = m.GROUP_ID AND e.CREATION_TIME = m.MaxTime WHERE e.operation_number NOT IN ('excluded1', 'excluded2') AND e.cost_time > 240; 这里假设按GROUP_ID分组，并且需要返回所有字段。如果原表没有分组字段，可能需要调整，比如根据设备ID或其他字段分组。此外，用户可能需要计算cost_time超过240的总次数，或者相关统计，但根据问题描述，主要是筛选记录。需要进一步确认需求，但根据现有信息，先按上述结构处理。关于性能优化，如果equipment_quantity_collection表很大，MaxCreation这个CTE可能会消耗较多资源，尤其是如果分组字段很多。这时候，确保分组字段有合适的索引非常重要。例如，在GROUP_ID和CREATION_TIME上建立索引，可以加速分组和最大值的计算。另外，检查执行计划，看是否存在全表扫描，并考虑分区策略，如果按CREATION_TIME分区，可能有助于快速定位最大时间。对于排除operation_number，如果列表很长，可能需要使用临时表或表变量来存储排除列表，以提高效率。但一般来说，NOT IN在大多数情况下效率尚可，特别是如果operation_number有索引的话。最后，关于时间计算，如果cost_time存储的是时间戳差值，可能需要使用DATEDIFF函数来计算分钟差。例如，如果开始时间和结束时间分开存储，那么cost_time可以计算为DATEDIFF(minute, start_time, end_time)，然后过滤>240的情况。不过用户的问题中可能已经处理好了这一点，所以可能不需要额外步骤。总之，需要明确每个步骤的逻辑，确保SQL正确实现需求，并通过索引和查询结构调整来优化性能。</think>### 优化与理解SQL查询的逐步说明 #### 1. **明确需求与基础逻辑** 需要从表 `equipment_quantity_collection` 中实现以下功能： - **筛选每个分组的最新记录**：通过 `CREATION_TIME` 的最大值确定。 - **排除特定 `operation_number`**：如 `'INVALID'` 或 `'TEST'`。 - **过滤 `cost_time` 超过240分钟**：假设 `cost_time` 存储单位为分钟。 #### 2. **基础SQL结构** 假设按 `equipment_id` 分组，基础查询可能如下： ```sql SELECT * FROM equipment_quantity_collection WHERE (equipment_id, CREATION_TIME) IN ( SELECT equipment_id, MAX(CREATION_TIME) FROM equipment_quantity_collection GROUP BY equipment_id ) AND operation_number NOT IN ('INVALID', 'TEST') AND cost_time > 240; ``` 此查询通过子查询获取每个设备的最新记录，再过滤条件和耗时。 #### 3. **性能优化方法** - **索引优化**：对 `(equipment_id, CREATION_TIME)` 建立复合索引，加速分组和最大值计算[^1]。 - **使用窗口函数替代子查询**（适用于需要更多字段时）： ```sql WITH RankedData AS ( SELECT *, ROW_NUMBER() OVER (PARTITION BY equipment_id ORDER BY CREATION_TIME DESC) AS rn FROM equipment_quantity_collection WHERE operation_number NOT IN ('INVALID', 'TEST') ) SELECT * FROM RankedData WHERE rn = 1 AND cost_time > 240; ``` 此方法在子查询中提前过滤 `operation_number`，减少后续处理数据量。 - **避免全表扫描**：确保 `operation_number` 和 `cost_time` 字段有独立索引（若高频过滤）。 #### 4. **时间计算的边界情况** - 若 `cost_time` 为时间区间（如开始时间 `start_time` 和结束时间 `end_time`），需显式计算分钟差： ```sql SELECT *, DATEDIFF(MINUTE, start_time, end_time) AS cost_time_minutes FROM equipment_quantity_collection WHERE DATEDIFF(MINUTE, start_time, end_time) > 240; ``` 此时需注意时区与空值问题。 #### 5. **执行计划分析** 通过 `EXPLAIN` 命令检查查询是否命中索引、是否存在全表扫描。例如： ```sql EXPLAIN SELECT * FROM equipment_quantity_collection WHERE ...; ``` 根据结果调整索引或查询结构。 --- ### 最终优化后的SQL示例 ```sql /* 方法1: 子查询 + 复合条件 */ SELECT e.* FROM equipment_quantity_collection e JOIN ( SELECT equipment_id, MAX(CREATION_TIME) AS max_creation_time FROM equipment_quantity_collection GROUP BY equipment_id ) max_ctime ON e.equipment_id = max_ctime.equipment_id AND e.CREATION_TIME = max_ctime.max_creation_time WHERE e.operation_number NOT IN ('INVALID', 'TEST') AND e.cost_time > 240; /* 方法2: 窗口函数提前过滤 */ WITH FilteredData AS ( SELECT *, ROW_NUMBER() OVER (PARTITION BY equipment_id ORDER BY CREATION_TIME DESC) AS rn FROM equipment_quantity_collection WHERE operation_number NOT IN ('INVALID', 'TEST') AND cost_time > 240 ) SELECT * FROM FilteredData WHERE rn = 1; ``` ---

阅读全文

相关推荐

C#编程科学计算器.doc

Shell开发教程.docx

微软内部资料-SQL性能优化5

【揭秘length函数的奥秘】：字符串长度计算的终极指南

【案例剖析】：***mon.primitives解决基本类型问题的实战经验

打印机维护与监控高级课程：Print_Spooler服务的专业维护技巧

MyBatis-Plus扩展机制：打造非Spring项目个性化ORM工具的终极武器

eq中如何使用函数对字段和参数进行处理

以批量选择带有公差的标注作为参照，并对目标数值相等的没有公差的所有标注添加相同的公差，并更新显示，生成一个AutoCAD2022.lsp的txt文件

编写一个Jsp程序，使用<c:choose>,<c:when>和<C:otherwise>标签根据当前是星期几显示不同的提示信息

编写jsp程序使用<c:choose>,<c:when>和<otherwise>表签根据当前是星期几而显示不同的提示信息

hive上有一张表，表结构为A、B、C、D，使用kettle 将zip文件解压，将解压出来的照片文件截取文件名开头到18位，插入到hive表A列里，将文件上传到obs，并将obs路径写入到C列里，当前时间写入到B列里，照片文件名写入到D列

2022年网站美工个人年度工作总结(1).doc

财务软件销售实习报告格式范文-实习报告格式(1).doc

【航迹关联】基于标准 Hough 变换、修正 Hough 变换和序列 Hough 变换实现航迹起始算法研究Matlab代码.rar

Windows系统修复工具

大家在看

美敦力BIS监护仪串口通讯协议手册

Cisco Enterprise Print System-开源

web仿淘宝项目

只输入固定-vc实现windows多显示器编程的方法

小游戏源码-端午节龙舟大赛.rar

最新推荐

微软内部资料-SQL性能优化5

2022年网站美工个人年度工作总结(1).doc

财务软件销售实习报告格式范文-实习报告格式(1).doc

【航迹关联】基于标准 Hough 变换、修正 Hough 变换和序列 Hough 变换实现航迹起始算法研究Matlab代码.rar

Windows系统修复工具

获取本机IP地址的程序源码分析

【权威指南】：Win11笔记本上RTX4080驱动的安装与调试秘籍

windows环境举例

QQ自动发送/回复系统源代码开放

【7步打造Win11深度学习利器】：Tensorflow-GPU与RTX4080终极优化指南