Oracle正则表达式学习

一、正则表达简介

二、REGEXP_LIKE(x,'匹配项')

三、REGEXP_INSTR

四、REGEXP_SUBSTR

五、REGEXP_REPLACE

一、正则表达简介

二、REGEXP_LIKE(x,'匹配项')

WHERE 字段 LIKE 'A_'

示例：找出 CONTENT 中包含数字的行有哪些?

select CONTENT
from T_STR
where regexp_like(CONTENT,'[0-9]+');

示例：找出 CONTENT 由纯数字组成

select *
from T_STR
where regexp_like(CONTENT,'^[0-9]+$')
-- where regexp_like(CONTENT,'^\d+$')
-- where regexp_like(CONTENT,'^[[:digit:]]+$');

示例：找出 CONTENT 由13位数字组成的有哪些?

select *
from T_STR
where regexp_like(CONTENT,'^[0-9]{13}$');

示例：校验输入手机号合法(11位纯数字,1开头,第二位是3/5/7/8/9)

-- REGEXP_LIKE 校验 11位纯数字 
-- REGEXP_LIKE(str,'^[0-9]{11}$')select *
from T_STR
where regexp_like(CONTENT,'^[1][35789][0-9]{9}$');

--^：表示字符串的开头。

--[1]：匹配数字1。

--[35789]：匹配数字3、5、7、8或9中的任意一个。

--[0-9]{9}：匹配任意数字0到9，重复9次。

--$：表示字符串的结尾

示例：找出 CONTENT 中包含字母的有哪些

select *
from T_STR
where regexp_like(CONTENT,'[a-zA-Z]+');

三、REGEXP_INSTR

regexp_instr(在哪个字符串中,正则表达式,从哪个位置开始匹配,第几次匹配)

示例：查找ENAME中从第一位开始第二次出现'T'的位置

示例：查找ENAME中从第一位开始第二次出现英文字母的位置

select ENAME, regexp_instr(ENAME, '[a-zA-Z]', 1, 2) rg
from EMP;

练习：
-- 1.输出所有员工姓名是 5个英文字母组成的，员工信息，用正则LIKE

select *
from EMP
where REGEXP_LIKE(ENAME, '^[a-zA-Z]{5}$');

2.查找所有员工姓名是从第二位开始第三次出现英文字母的位置。
-- 输出姓名 + 位置

select ENAME, regexp_instr(ENAME, '[a-zA-Z]', 2, 3) loc
from EMP;

四、REGEXP_SUBSTR

语法同substr

regexp_substr(字段,正则表达式,第几个字符开始匹配正则表达式,取第几个匹配组)
REGEXP_SUBSTR(source_string,      -- 源文本pattern,            -- 正则表达式模式[position],         -- 起始位置（可选，默认1）[occurrence],       -- 匹配第几次出现的结果（可选，默认1）[match_parameter]   -- 匹配参数（可选）)
第一个参数是源字符串，
第二个参数是正则表达式截取规则，
第三个表示从第几个字符开始匹配正则表达式，
第四个参数表示取第几个匹配组

示例：将 CONTENT 中'张三,李四,王五'内容按照逗号进行分割

--从字符串中提取匹配模式的子串

select regexp_substr(CONTENT, '[^,]+', 1, 1) a,regexp_substr(CONTENT, '[^,]+', 1, 2) b,regexp_substr(CONTENT, '[^,]+', 1, 3) c
from T_STR
where CONTENT = '张三,李四,王五';

[^,]表示匹配除逗号以外的任意字符

+ 表示前面的字符（即除逗号以外的字符）出现一次或多次

参数 1（第一个 1）：表示从目标字符串的第 1 个字符开始进行匹配。

参数 1（第二个 1）：表示返回匹配到的第 1 个子串。如果这个参数改为 2，就会返回按逗号分割后的第二个子串（前提是存在第二个子串），以此类推。

--[^-]+：匹配除了连字符以外的任意单个字符，至少出现一次或多次。

CREATE TABLE TT(CON VARCHAR2(100));
INSERT INTO TT VALUES ('广东省-深圳市-龙岗区');
INSERT INTO TT VALUES ('广东省-广州市-天河区');
INSERT INTO TT VALUES ('内蒙古-呼和浩特-蕲春县');
COMMIT;

示例：取 TT 表中所有的市名

select regexp_substr(CON, '[^-]+', 1, 2) city_name
from TT;

示例：将姓名分列，并为每个人均摊金额

select ENAME,AMOUNT,regexp_substr(ENAME, '[^,]+', 1, 1)                      a,regexp_substr(ENAME, '[^,]+', 1, 2)                      b,regexp_substr(ENAME, '[^,]+', 1, 3)                      c,-- 人数相当于逗号的数量+1=总长度-去掉逗号的长度+1length(ENAME) - length(replace(ENAME, ',')) + 1          num,AMOUNT / length(ENAME) - length(replace(ENAME, ',')) + 1 amt
from T_WRITEOFF;

五、REGEXP_REPLACE

regexp_replace(字符串，正则表达式，替换之后的值)

select ENAME,regexp_replace(ENAME,'[^,]','Q') Q
from T_WRITEOFF;

regexp_replace(ENAME,'[^,]','Q')中，如果换成[^,]+，意思是：匹配除逗号 (,) 以外的任意字符的连续序列（即一个或多个非逗号字符）

结果就会变成：

因此，要注意+号的使用

示例：查找字符串 'KJSADKABxkabdksa1432mn2k3n4k2,.1#@$mnad' 中，英文字母的个数

'[^a-zA-Z]+' 将非英文的替换为空，剩下的就是英文字母

select regexp_replace('KJSADKABxkabdksa1432mn2k3n4k2,.1#@$mnad', '[^a-zA-Z]+')         a,length(regexp_replace('KJSADKABxkabdksa1432mn2k3n4k2,.1#@$mnad', '[^a-zA-Z]+')) b
from DUAL;

示例：查找字符串 ' 01010101011100110 '中 1 的个数

-- 总长度-非1的个数

select regexp_replace(' 01010101011100110 ', '[^1]+')         a,length(regexp_replace(' 01010101011100110 ', '[^1]+')) b
from DUAL;

练习：

1. 截取字符串 'CEO-总监-经理-主管-小组长-基层员工'中的'小组长'

select regexp_substr('CEO-总监-经理-主管-小组长-基层员工', '[^-]+', 1, 5) a
from DUAL;

2.提取字符串 'KJASDAKzjxzzkjz212321,,.,1DA' 中，所有的小写英文字母

select regexp_replace('KJASDAKzjxzzkjz212321,,.,1DA', '[^a-z]+') a
from DUAL;

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/diannao/85345.shtml
繁体地址，请注明出处：http://hk.pswp.cn/diannao/85345.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！