1. 정규표현식
문자열의 특정 패턴을 찾을 수 있는 문법입니다.
예를들면 회원가입 화면에서 사용자로부터 입력받은 아이디, 이름, 이메일형식이 유효한지 체크할 필요가 있습니다. 이때 정규표현식을 사용하면 간단히 처리할 수 있습니다.
1
2
3
4
5
6
|
const tel = '0101234567팔';
// 정규 표현식 리터럴
const myRegExp = /^[0-9]+$/;
|
반복문과 조건문을 사용한 복잡한 코드도 정규표현식을 이용하면 매우 간단하게 표현할 수 있습니다. 하지만 가독성이 좋지 않다는 단점이 존재합니다.
정규표현식은 아래와 같이 표현합니다.
1.2 플래그
플래그는 아래와 같은 종류가 있습니다.
Flag | Meaning | Description |
i | Ignore Case | 대소문자를 구별하지 않고 검색한다. |
g | Global | 문자열 내의 모든 패턴을 검색한다. |
m | Multi Line | 문자열의 행이 바뀌더라도 검색을 계속한다. |
플래그는 옵션이므로 선택적으로 사용합니다. 플래그를 사용하지 않은 경우 문자열 내 검색 매칭 대상이 1개 이상이더라도 첫번째 매칭한 대상만을 검색하고 종료합니다.
1
2
3
4
5
6
7
8
9
10
11
12
|
const targetStr = 'Is this all there is?';
// 문자열 is를 대소문자를 구별하여 한번만 검색한다.
let regexr = /is/;
// 문자열 is를 대소문자를 구별하지 않고 대상 문자열 끝까지 검색한다.
regexr = /is/ig;
|
1.3 패턴
패턴에는 검색하고 싶은 문자열을 지정합니다. 이때 문자열의 따옴표는 생략합니다. 따옴표를 포함하면 따옴표까지도 검색합니다. 또한 패턴은 특별한 의미를 가지는 메타문자(Metacharacter) 또는 기호로 표현할 수 있습니다. 몇가지 패턴 표현 방법을 소개합니다.
1
2
3
4
|
const targetStr = 'AA BB Aa Bb';
// 임의의 문자 3개
const regexr = /.../;
|
. 은 임의의 문자 한 개를 의미합니다. 문자의 내용은 무엇이든지 상관없습니다. 위 예제의 경우 . 를 3개 연속해서 패턴을 생성하였으므로 3자리 문자를 추출합니다.
1
|
|
이때 추출을 반복하려면 플래그 g를 사용합니다.
1
2
3
4
5
6
|
const targetStr = 'AA BB Aa Bb';
// 임의의 문자 3개를 반복하여 검색
const regexr = /.../g;
|
패턴에 문자 또는 문자열을 지정하면 일치하는 문자 또는 문자열을 추출합니다.
1
2
3
4
5
6
|
const targetStr = 'AA BB Aa Bb';
// 'A'를 검색
const regexr = /A/;
|
이때 대소문자를 구별하며 패턴과 일치한 첫번째 결과만 반환됩니다. 대소문자를 구별하지 않게 하려면 플래그 i를 사용합니다.
1
2
3
4
5
6
|
const targetStr = 'AA BB Aa Bb';
// 'A'를 대소문자 구분없이 반복 검색
const regexr = /A/ig;
|
앞선 패턴을 최소 한번 반복하려면 패턴 뒤에 +를 붙입니다. 아래 예제의 경우, 앞선 패턴은 A이므로 A+는 A만으로 이루어진 문자열('A', 'AA', 'AAA', ...)를 의미합니다.
1
2
3
4
5
6
|
const targetStr = 'AA AAA BB Aa Bb';
// 'A'가 한번이상 반복되는 문자열('A', 'AA', 'AAA', ...)을 반복 검색
const regexr = /A+/g;
|
| 를 사용하면 or의 의미를 가지게 됩니다.
1
2
3
4
5
6
|
const targetStr = 'AA BB Aa Bb';
// 'A' 또는 'B'를 반복 검색
const regexr = /A|B/g;
|
분해되지 않은 단어 레벨로 추출하기 위해서는 +를 같이 사용하면 됩니다.
1
2
3
4
5
6
7
|
const targetStr = 'AA AAA BB Aa Bb';
// 'A' 또는 'B'가 한번 이상 반복되는 문자열을 반복 검색
// 'A', 'AA', 'AAA', ... 또는 'B', 'BB', 'BBB', ...
const regexr = /A+|B+/g;
|
위 예제는 패턴을 or로 한번 이상 반복하는 것인데 간단히 표현하면 아래와 같습니다. []내의 문자는 or로 동작합니다. 그 뒤에 +를 사용하여 앞선 패턴을 한번 이상 반복하게 합니다.
1
2
3
4
5
6
7
|
const targetStr = 'AA BB Aa Bb';
// 'A' 또는 'B'가 한번 이상 반복되는 문자열을 반복 검색
// 'A', 'AA', 'AAA', ... 또는 'B', 'BB', 'BBB', ...
const regexr = /[AB]+/g;
|
범위를 지정하려면 []내에 -를 사용합니다. 아래의 경우 대문자 알파벳을 추출합니다.
1
2
3
4
5
6
7
8
|
const targetStr = 'AA BB ZZ Aa Bb';
// 'A' ~ 'Z'가 한번 이상 반복되는 문자열을 반복 검색
// 'A', 'AA', 'AAA', ... 또는 'B', 'BB', 'BBB', ... ~ 또는 'Z', 'ZZ', 'ZZZ', ...
const regexr = /[A-Z]+/g;
|
대소문자를 구별하지 않고 알파벳을 추출하려면 아래와 같이 합니다.
1
2
3
4
5
6
7
8
|
const targetStr = 'AA BB Aa Bb';
// 'A' ~ 'Z' 또는 'a' ~ 'z'가 한번 이상 반복되는 문자열을 반복 검색
const regexr = /[A-Za-z]+/g;
// 아래와 동일하다.
// const regexr = /[A-Z]+/gi;
|
숫자를 추출하는 방법입니다.
1
2
3
4
5
6
|
const targetStr = 'AA BB Aa Bb 24,000';
// '0' ~ '9'가 한번 이상 반복되는 문자열을 반복 검색
const regexr = /[0-9]+/g;
|
, 때문에 결과가 분리되므로 패턴에 포함시킵니다.
1
2
3
4
5
6
|
const targetStr = 'AA BB Aa Bb 24,000';
// '0' ~ '9' 또는 ','가 한번 이상 반복되는 문자열을 반복 검색
const regexr = /[0-9,]+/g;
|
이것을 간단히 표현하면 아래와 같습니다. \d는 숫자를 의미합니다. \D는 \d와 반대로 동작합니다.
1
2
3
4
5
6
7
8
9
10
11
|
const targetStr = 'AA BB Aa Bb 24,000';
// '0' ~ '9' 또는 ','가 한번 이상 반복되는 문자열을 반복 검색
let regexr = /[\d,]+/g;
// '0' ~ '9'가 아닌 문자(숫자가 아닌 문자) 또는 ','가 한번 이상 반복되는 문자열을 반복 검색
regexr = /[\D,]+/g;
|
/w는 알파벳과 숫자를 의미합니다. \W는 \w와 반대로 동작합니다.
1
2
3
4
5
6
7
8
9
10
11
|
const targetStr = 'AA BB Aa Bb 24,000';
// 알파벳과 숫자 또는 ','가 한번 이상 반복되는 문자열을 반복 검색
let regexr = /[\w,]+/g;
// 알파벳과 숫자가 아닌 문자 또는 ','가 한번 이상 반복되는 문자열을 반복 검색
regexr = /[\W,]+/g;
|
1.4 자주 사용하는 정규표현식
- 특정 단어로 시작하는지 검사
1
2
3
4
5
6
7
|
- 특정 단어로 끝나는지 검사
1
2
3
4
5
6
7
|
- 숫자인지 검사
1
2
3
4
5
6
7
8
|
const targetStr = '12345';
// 모두 숫자인지 검사
// [^]: 부정(not)을 의미한다. 얘를 들어 [^a-z]는 알파벳 소문자로 시작하지 않는 모든 문자를 의미한다.
// [] 바깥의 ^는 문자열의 처음을 의미한다.
const regexr = /^\d+$/;
|
- 하나 이상의 공백으로 시작하는지 검사
1
2
3
4
5
6
7
|
const targetStr = ' Hi!';
// 1개 이상의 공백으로 시작하는지 검사
// \s : 여러 가지 공백 문자 (스페이스, 탭 등) => [\t\r\n\v\f]
const regexr = /^[\s]+/;
|
- 아이디로 사용 가능한지 검사
1
2
3
4
5
6
7
|
const id = 'abc123';
// 알파벳 대소문자 또는 숫자로 시작하고 끝나며 4 ~10자리인지 검사
// {4,10}: 4 ~ 10자리
const regexr = /^[A-Za-z0-9]{4,10}$/;
|
- 메일 주소 형식에 맞는지 검사
1
2
3
4
5
|
const email = 'ungmo2@gmail.com';
const regexr = /^[0-9a-zA-Z]([-_\.]?[0-9a-zA-Z])*@[0-9a-zA-Z]([-_\.]?[0-9a-zA-Z])*\.[a-zA-Z]{2,3}$/;
|
- 핸드폰 번호 형식에 맞는지 검사
1
2
3
4
5
|
const cellphone = '010-1234-5678';
const regexr = /^\d{3}-\d{3,4}-\d{4}$/;
|
- 특수 문자 포함 여부를 검사
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
const targetStr = 'abc#123';
// A-Za-z0-9 이외의 문자가 있는지 검사
let regexr = /[^A-Za-z0-9]/gi;
// 아래 방식도 동작한다. 이 방식의 장점은 특수 문자를 선택적으로 검사할 수 있다.
regexr = /[\{\}\[\]\/?.,;:|\)*~`!^\-_+<>@\#$%&\\\=\(\'\"]/gi;
// 특수 문자 제거
console.log(targetStr.replace(regexr, '')); // abc123
|
>cs |
참고자료: https://poiemaweb.com/js-regexp
RegExp | PoiemaWeb
정규표현식(Regular Expression)은 문자열에서 특정 내용을 찾거나 대체 또는 발췌하는데 사용한다. 예를 들어 회원가입 화면에서 사용자로 부터 입력 받는 전화번호가 유효한지 체크할 필요가 있다. 이때 반복문으로 한문자씩 체크할 수 도 있지만 정규표현식을 사용하면 간단히 처리할 수 있다.
poiemaweb.com
'웹 프로그래밍 > JavaScript' 카테고리의 다른 글
handlebars 템플릿 (0) | 2019.08.20 |
---|---|
객체 리터럴과 this (0) | 2019.08.19 |
자바스크립트 객체 (0) | 2019.08.03 |
자바스크립트 배열 (0) | 2019.08.02 |
Browser Event, Event object, Event handler (0) | 2019.02.07 |