SQL 数据处理技巧:从统计计算到层次结构分析
1. 计算中位数
中位数是描述数据中心位置的统计量,它是 n 个(已排序)值的中间点。若 n 为奇数,中位数是第 (n + 1) / 2 个观测值;若 n 为偶数,中位数是第 n / 2 和第 n / 2 + 1 个观测值的中点(平均值)。
1.1 标准 SQL 计算中位数
以下是使用标准 SQL 计算 empsales
表中 sales
列中位数的示例:
SELECT AVG(sales) AS median
FROM
(SELECT e1.sales
FROM empsales e1, empsales e2
GROUP BY e1.sales
HAVING
SUM(CASE WHEN e1.sales = e2.sales
THEN 1 ELSE 0 END) >=
ABS(SUM(SIGN(e1.sales -
e2.sales)))) t1;
这种方法使用自连接和 GROUP BY
创建笛卡尔积,然后使用 HAVING
和 SUM
找到中位数所在的行。但它比较繁琐,难以理解,运行速度也较慢。
1.2 不同数据库特定函数计算中位数
- Microsoft SQL Server :