일정한 패턴을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어(formal language)
정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공한다.
패턴 매칭 기능이란 특정 패턴과 일치하는 문자열을 검색하거나 추출 또는 치환할 수 있는 기능을 말한다.
정규표현식을 사용하면 반복문과 조건문 없이 패턴을 정의하고 테스트하는 것으로 간단히 체크할 수 있다.
다만, 정규표현식은 주석이나 공백을 허용하지 않고, 여러가지 기호를 혼합하여 사용하기 때문에 가독성이 좋지않다는 문제가 있다.
정규 표현식의 생성
정규 표현식 객체(RegExp 객체)를 생성하기 위해서는 정규 표현식 리터럴과 RegExp 생성자 함수를 사용할 수 있다.
일반적인 방법은 정규 표현식 리터럴을 사용하는 것이다.
정규 표현식 리터럴은 패턴과 플래그로 구성된다.
RegExp 생성자 함수를 사용하여 RegExp 객체를 생성할 수도 있다.
RegExp 생성자 함수를 사용하면 변수를 사용해 동적으로 RegExp 객체를 생성할 수 있다.
const target = 'Is this all, there is?';
// 패턴: is
// 플래그: i => 대소문자를 구별하지 않고 검색한다.
const regexp = /is/i;
// test 메서드는 target 문자열에 대해 정규 표현식 regexp의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.
regexp.test(target); // true
/**
* pattern: 정규 표현식의 패턴
* flags: 정규 표현식의 플래그(g, i, m, u, y)
*/
new RegExp(pattern[, flags])
RegExp 메서드
✅RegExp.prototype.exec
인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환
매칭 결과가 없는 경우 null을 반환한다.
exec 메서드는 문자열 내의 모든 패턴을 검색하는 g 플래그를 지정해도 첫 번째 매칭 결과만 반환한다.
const target = 'Is this all there is?';
const regExp = /is/;
regExp.exec(target);
// ["is", index: 5, input: "Is this all there is?", groups: undefined]
✅RegExp.prototype.test
인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환
const target = 'Is this all there is?';
const regExp = /is/;
regExp.test(target); // true
✅String.prototype.match
대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환
const target = 'Is this all there is?';
const regExp = /is/;
regExp.match(regExp);
// ["is", index: 5, input: "Is this all there is?", groups: undefined]
플래그
정규 표현식의 검색 방식을 설정하기 위해 사용
플래그
의미
설명
i
ignore case
대소문자를 구별하지 않고 패턴을 검색한다
g
Global
대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다.
m
Multi line
문자열의 행이 바뀌더라도 패턴 검색을 계속한다.
플래그는 옵션이므로 선택적으로 사용할 수 있으며 순서와 상관없이 하나 이상의 플래그를 동시에 설정할 수도 있다.
어떠한 플래그를 사용하지 않은 경우 대소문자를 구별해서 패턴을 검색한다.
문자열에 패턴 검색 매칭 대상이 1개 이상 존재해도 첫 번째 매칭한 대상만 검색하고 종료한다.
패턴
문자열의 일정한 규칙을 표현하기 위해 사용
✅문자열 검색
정규 표현식의 패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자 열을 검색한다.
RegExp 메서드를 사용하여 검색 대상 문자열과 정규 표현식의 매칭 결과를 구하면 검색이 수행된다.
검색 대상 문자열과 플래그를 생략한 정규 표현식의 매칭 결과를 구하면 대소문자를 구별하며 정규 표현식과 매치한 첫 번째 결과만 반환한다.
대소문자 구별X 검색 시 플래그 i 사용
패턴과 매치하는 모든 문자열을 전역 검색하려면 플래그 g 사용
✅임의의 문자열 검색
.은 임의의 문자 한 개를 의미하며 문자의 내용은 무엇이든 상관없다.
const target = 'Is this all there is?';
// 임의의 3자리 문자열을 대소문자를 구별하여 전역 검색한다.
const regExp = / ... /g;
target.match(regExp); // ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]
✅반복 검색
{m,n}은 앞선 패턴이 최소 m번, 최대 n번 반복되는 문자열을 의미한다.
콤마 뒤에 공백이 있으면 정상 동작하지 않는다.
{n}은 앞선 패턴이 n번 반복되는 문자열을 의미한다. 즉, {n}은 {n, n}과 같다.
+는 앞선 패턴이 최소 한 번 이상 반복되는 문자열을 의미한다. 즉, +는 {1, }과 같다.
?는 앞선 패턴이 최대 한 번(0번 포함) 이상 반복되는 문자열을 의미한다. 즉, ?는 {0,1}과 같다.
const target = 'A AA B BB Aa Bb AAA' ;
// 'A'가 최소 1번, 최대 2번 반복되는 문자열을 전역 검색한다.
const regExp = /A{1,2}/g;
target.match(regExp); // ["A", "AA", "A", "AA", "A"]
✅OR 검색
|는 or의 의미를 갖는다.
분해되지 않은 단어 레벨로 검색하기 위해서는 +를 함께 사용한다.
[ ] 내의 문자는 or로 동작한다.
[ ]뒤에 + 를 붙이면 앞선 패턴을 한 번 이상 반복한다.
[ ]내에 -를 사용하면 범위를 지정한다.
\d: 숫자를 의미한다.
\D: \d와 반대로 동작한다. 즉, 숫자를 제외한 모든 문자를 의미한다.
\w: 알파벳, 숫자, 언더스코어를 의미한다.
\W: \w와 반대로 동작한다 , 즉, 알파벳, 숫자, 언더스코어를 제외한 모든 문자를 의미한다.
const target = 'A AA B BB Aa Bb' ;
// 'A' 또는 'B'를 전역 검색한다.
const regExp = /A|B/g;
target.match(regExp); // ["A", "A", "A", "B", "B", "B", "A", "B"]
✅NOT 검색
[ ... ] 내의 ^은not의 의미를 갖는다.
const target = ' AA BB 12 Aa Bb';
// 슷지를 제외한 문자열을 전역 검색한다.
const regExp = /[^0-9]+/g;
target.match(regExp); // ["AA BB ", " Aa Bb"]
const target = 'abc#123';
// 특수 문자는 A-Za-z0-9 이외의 문자이다.
(/[^A-Za-z0-9]/gi).test(target); // true
// 아래 방식으로 대체해 사용할 수도 있다.
// 이 방식은 특수 문자를 선택적으로 검사할 수 있다는 장점이 있다.
(/[\{\}\[\]\/?.,;:|\)*~`!^\-_+<>@\#$%&\\\=\(\'\"]/gi).test(target); // true
// 특수 문자를 제거할 때는 String.prototype.replace 메서드를 사용한다.
target.replace(/[^A-Za-z0-9]/gi, ''); // abc123