Oracle中REGEXP_SUBSTR函数的使用

最新推荐文章于 2025-04-15 23:44:20 发布

小辰的编程烦恼

最新推荐文章于 2025-04-15 23:44:20 发布

阅读量2.5k

点赞数 16

分类专栏： oracle 文章标签： oracle 数据库

本文链接：https://blog.csdn.net/weixin_47718782/article/details/143662853

版权

oracle 专栏收录该内容

1 篇文章

订阅专栏

一、基本介绍

REGEXP_SUBSTR函数是一个强大的字符串处理函数，它允许你使用正则表达式（Regular Expressions）来搜索和提取字符串中的子字符串。这个函数在数据清洗、数据转换和复杂字符串操作中非常有用。

二、参数的解释说明

REGEXP_SUBSTR(source_char, pattern, position, occurrence, match_param)

source_char
必需的，要搜索的源字符串。
pattern
必需的，用于匹配的正则表达式。
position
可选的。它是一个整数，指示开始搜索的起始位置。默认为 1。
occurrence
可选的。它是一个整数，指示要返回的是第几次出现。默认为 1。
match_param
可选的。执行匹配采用的模式：

‘i’ 指定不区分大小写的匹配，即使确定的条件排序规则区分大小写。
‘c’ 指定区分大小写和区分重音的匹配，即使确定的条件排序规则不区分大小写或不区分重音。
…

三、基本用法

找出字符串 ‘12AB34cd45ef’ 中的连续的小写字母序列。

SELECT
    REGEXP_SUBSTR('12AB34cd45ef', '[a-z]+') Result
FROM dual;

在这里插入图片描述

如果源字符串中没有与给定的正则表达式匹配的内容， REGEXP_SUBSTR() 将返回 NULL。

SELECT
    REGEXP_SUBSTR('12AB34cd45ef', '[a-z]{3,}') Result
FROM dual;

在这里插入图片描述

找出字符串 ‘12AB34cd45ef’ 中的连续的小写字母序列，从第 9 个字符开始搜索

SELECT
    REGEXP_SUBSTR('12AB34cd45ef', '[a-z]+', 9) Result
FROM dual;

在这里插入图片描述

用来找出字符串 ‘12AB34cd45ef’ 中的第 2 次出现的连续的小写字母序列

SELECT
    REGEXP_SUBSTR('12AB34cd45ef', '[a-z]+', 1, 2) Result
FROM dual;

在这里插入图片描述

用来找出字符串 ‘12AB34cd45ef’ 中连续的字母序列，不区分大小写。

SELECT
    REGEXP_SUBSTR('12AB34cd45ef', '[a-z]+', 1, 1, 'i') Result
FROM dual;

在这里插入图片描述

四、和connect by函数结合使用造成的生产问题

1、和connect by 函数的简单使用

SELECT REGEXP_SUBSTR('12AB34cd45ef', '[a-z]+', 1, level, 'i') Result
  FROM dual
connect by level <= REGEXP_COUNT('12AB34cd45ef', '[a-z]+', 1, 'i')

在这里插入图片描述
CONNECT BY是Oracle SQL中的一个子句，用于定义层次结构或递归关系，从而进行层次结构数据的查询。
LEVEL是Oracle SQL中的一个伪列，用于在层次结构或递归查询中获取当前行的级别。
REGEXP_COUNT 用于计算字符串中正则表达式匹配的次数。

2、未使用PRIOR连接条件，引发生产数据重复

数据案例

在这里插入图片描述

错误的执行脚本

select t.id, regexp_substr(t.param_value, '[^,]+', 1, level) result
  from test_01 t
connect by level <= regexp_count(t.param_value, '[^,]+', 1)

在这里插入图片描述

正确的执行脚本

select t.id, regexp_substr(t.param_value, '[^,]+', 1, level) result
  from test_01 t
connect by level <= regexp_count(t.param_value, '[^,]+', 1)
       and prior id = id
       and prior SYS_GUID() is not null