系统规则模板列表

Knowledge Catalog(以前称为 Dataplex Universal Catalog)支持一系列规则模板,您可以使用这些模板来定义和自动化数据质量和数据验证流程。实现这些模板是数据治理的关键部分,可确保数据集保持准确一致。

如需确定要使用哪个模板,您可以对资源执行数据分析,以识别潜在的质量问题。确定所需质量检查后,您可以从此页面中选择合适的模板,为资源定义规则。

本页面列出了可在任何区域使用的可用系统规则模板。

表格形状

名称 说明
列数相等性预期 用于评估表格中的列数是否等于指定值的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
列数范围预期 用于评估表中的列数是否在指定范围内的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
列存在性预期 用于评估表中是否存在特定列的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
新鲜度预期 用于评估列中的最新数据是否比指定时间间隔更新的汇总规则。
分组新鲜度预期 用于评估列中最新的分组数据是否比指定时间间隔更新的汇总规则。
有序架构匹配预期 用于评估表格中的有序列是否与指定的有序列表完全匹配的聚合规则。
行数相等性预期 用于评估表格中的行数是否等于指定值的聚合规则。
行数范围预期 用于评估表中的行数是否在指定范围内的聚合规则。
架构包含预期 一种聚合规则,用于评估表中的列集是否包含指定集中的所有列。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
架构排除预期 用于评估表格中的列是否不在指定集合中的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
架构匹配预期 用于评估表中的列是否与指定集合完全匹配的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
Table Comparison Aggregate Equality Expectation 一种汇总规则,用于评估汇总表达式的结果在当前表和指定参考表之间是否相等。
表格比较汇总范围预期 用于评估当前表中聚合表达式的结果是否与参考表的偏差超过指定容差的聚合规则。
表格比较行数相等性预期 一种汇总规则,用于评估当前表格中的行数是否等于指定参考表格中的行数,并且在计数之前可以选择性地过滤行。
Table Comparison Row Count Factor Equality Expectation 一种汇总规则,用于评估当前表格中的行数是否等于指定参考表格中的行数的某个倍数,并且可以在计数之前选择性地过滤行。

缺失值、唯一值和类型

名称 说明
列类型预期 用于评估列数据类型是否与指定类型匹配的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
列类型列表预期 用于评估列数据类型是否位于指定集中的聚合规则。此规则要求对所查询的表和数据集拥有 bigquery.tables.getbigquery.tables.listbigquery.datasets.get 权限。
非 null 预期 用于评估每个列值是否不为 null 的行级规则。
Null Expectation 用于评估每个列值是否为 null 的行级规则。
字符串大小写预期 用于评估每个列值字符串是否与指定的大小写匹配的行级规则。
唯一性预期 用于评估每个列值是否唯一的行级规则。

集合和范围

名称 说明
降低预期 用于评估列中的值是否在减少的聚合规则。系统会忽略 NULL 值。返回第一个未满足预期值的行。
不断提高的期望 用于评估列中的值是否在增加的聚合规则。系统会忽略 NULL 值。返回第一个未满足预期值的行。
范围预期 用于评估每个列值是否在指定范围内的行级规则。
参考集预期 一种行级规则,用于评估每个列值是否包含在指定的参考集中。
设置排除预期 用于评估每个列值是否未包含在指定集中的行级规则。
设定预期 用于评估每个列值是否包含在指定集合中的行级规则。

字符串匹配

名称 说明
模式排除预期 用于评估每个列值是否与指定的 SQL LIKE 模式不匹配的行级规则。
模式排除预期列表 用于评估每个列值是否与任何指定的 SQL LIKE 模式都不匹配的行级规则。
图案预期 用于评估每个列值是否与指定的 SQL LIKE 模式匹配的行级规则。
模式预期列表 用于评估每个列值是否与至少一个指定的 SQL LIKE 模式匹配的行级规则。
正则表达式排除预期行为 用于评估每个列值是否与指定正则表达式不匹配的行级规则。
正则表达式排除预期列表 用于评估每个列值是否与任何指定的正则表达式都不匹配的行级规则。
正则表达式预期 用于评估每个列值是否与指定正则表达式匹配的行级规则。
正则表达式预期列表 用于评估每个列值是否与至少一个指定正则表达式匹配的行级规则。
字符串长度相等性预期 用于评估每个列值字符串长度是否等于指定值的行级规则。
字符串长度范围预期值 用于评估每个列值字符串长度是否在指定范围内的行级规则。

聚合函数

名称 说明
不同值的包含预期 一种聚合规则,用于评估一组不同的列值是否包含指定集中的所有值。
不同值数量相等性预期 用于评估列中不同值的数量是否等于指定值的聚合规则。
不同值的数量范围预期 用于评估列中不同值的数量是否在指定范围内的聚合规则。
不同值的匹配预期 用于评估一组不同的列值是否与指定的一组值完全匹配的聚合规则。
不同值的比例预期 用于评估列中不同值的比例(即不同值的数量 / 总行数)是否在指定范围内的聚合规则。
设置了预期不同值的数量 一种汇总规则,用于评估每个不同的列值是否包含在指定集中。
最大范围预期 用于评估列最大值是否位于指定范围内的汇总规则。
平均范围预期 用于评估列平均值是否在指定范围内的汇总规则。如果返回浮点类型,则 AVG() 函数的结果是不确定的
中位数范围预期 用于评估列中位数是否位于指定范围内的聚合规则。
最小范围预期 用于评估列最小值是否位于指定范围内的汇总规则。
模式范围预期 一种聚合规则,用于评估所有列众数(最常见的值)是否位于指定范围内。如果存在多种模式,系统会针对相应范围检查每种模式,并返回任何失败的模式。
模式设置预期 用于评估所有列众数(最常见的值)是否都在指定集内的聚合规则。计算众数时,系统会忽略 NULL 值。如果存在多个具有相同最高频次的众数,则会针对该组检查每个众数,并将任何不合格的众数返回到数组中。
分位数范围预期 用于评估列中指定分位数值是否在指定范围内的聚合规则。
标准差范围预期 用于评估列标准差是否在指定范围内的聚合规则。
总和范围预期 用于评估列总和是否位于指定范围内的汇总规则。如果返回浮点类型,则 SUM() 函数的结果是不确定的
表格比较唯一值数量相等性预期 一种汇总规则,用于评估指定列中当前表和参考表中的唯一值数量是否相等。

多列

名称 说明
列比较相等性预期 行级规则,用于评估每行的列 A 中的值是否等于列 B 中的值。
列比较(预期值较大) 一种行级规则,用于评估每行中列 A 的值是否大于列 B 的值。
列对设置预期 一种聚合规则,用于评估列 A 和列 B 中的配对值是否包含在指定集合中。
多列总和相等性预期 一种汇总规则,用于评估指定列列表中所有行的总和是否等于指定值。如果返回浮点类型,则 SUM() 函数的结果是不确定的
多列唯一性预期 用于评估指定列列表中的值组合对于每一行是否唯一的行级规则(例如,多列主键)。
记录列唯一性预期 一种行级规则,用于评估指定列列表中的值在每条记录(行)内是否唯一。请注意,记录可能会重复。

分布函数

名称 说明
日期部分完整性预期 用于评估表在日期范围内的每个时间间隔(例如每天)是否都有数据的汇总规则。
标准差值预期 一种行级规则,用于评估每个列值是否在列平均值的指定标准差范围内。

一般条件

名称 说明
行条件预期 用于评估表格中每一行是否满足指定条件的行级规则。
SQL 断言 用于评估指定语句返回的行数的汇总规则。如果返回了任何行,表示此规则失败。
表条件预期 用于评估所提供表达式对表的计算结果是否为 true 的汇总规则。

后续步骤