정규표현식의 패턴들 18~24) 경계()
\w \W \d \D \b \B \A \Z
pattern :
\w
- [A-z0-9__] 와 동일
- 공백은 미포함(아래는 귀찮아서 밑줄안뺀거)
source : A1 B2 c3 d__4 e:5 ffGG77--____--
\w
- first match :
<U>A</U>1 B2 c3 d__4 e:5 ffGG77--____--
- all matches :
<U>A1 B2 c3 d__4 e</U>:<U>5 ffGG77</U>--<U>____</U>--
\w*
- *때문에 글자가 더 있어도 단어로 인식해서 first match인 경우가 다르다
- first match :
<U>A1</U> B2 c3 d__4 e:5 ffGG77--____--
- all matches :
<U>A<1 B2 c3 d__4 e</U>:<U>5 ffGG77</U>--<U>____</U>--
[a-z]\w*
- a부터 z까지의 문자 그다음 여러개의 문자가 오거나 없거나 다 해당
- first match :
A1 B2 <U>c3</U> d__4 e:5 ffGG77--____--
- all matches :
A1 B2 <U>c3</U> <U>d__4</U> <U>e</U>:5 <U>ffGG77</U>--____--
\w{5}
- [A-z0-9__] 다섯개
- first match :
A1 B2 c3 d__4 e:5 <U>ffGG7</U>7--____--
- all matches :
A1 B2 c3 d__4 e:5 <U>ffGG7</U>7--____--
pattern : \W
- 대문자로 W를 쓰면 \w가 아닌 문자열만 선택한다는것
- [^A-z0-9__]
- 공백, __를 제외한 특수문자등
source : AS __34:AS11.23 @#$%12^*
\W
- first match :
AS<U> </U>__34:AS11.23 @#$%12^*
- all matches :
AS<U> </U>__34<U>:</U>AS11<U>.</U>23<U> @#$%</U>12<U>^*</U>
source : Page 123; published: 1234 id=12#24@112
pattern : \d
- [0-9]
- first match :
Page <U>1</U>23; published: 1234 id=12#24@112
- all matches :
Page <U>123</U>; published: <U>1234</U> id=<U>12</U>#<U>24</U>@<U>112</U>
pattern : \D
- [^0-9] : 공백 및 특수문자 포함
- first match :
<U>P</U>age 123; published: 1234 id=12#24@112
- all matches :
<U>Page </U>123<U>; published: </U>1234<U> id=</U>12<U>#</U>24<U>@</U>112
pattern : \b
- work boundery : 앞문자\b뒷문자
- \b를 중심으로 앞에 문자를 넣을 경우 앞에 일치하는 단어를 찾고
- 뒤에 넣으면 뒤에 일치하는 단어를 찾는다.
pattern : \B
- not work boundery
- 단어에서 \b에 일치하지 않는 문자
pattern : \A
- \A시작조건
- \A... 하면 문장에서 첫 문자중 3개 선택
- 멀티라인이여도 첫 문장에서만 체크(^와 차이점)
pattern : ...\Z
- 끝조건\Z
- ...\Z 하면 문장에서 마지막 문자중 3개 선택
- 멀티라인이여도 첫 문장에서만 체크($와 차이점)
'RegEXR > Common' 카테고리의 다른 글
[오늘의 정규표현식] http로 시작하는 url <a>태그로 감싸기 (0) | 2020.12.19 |
---|---|
정규표현식 ?= (0) | 2019.12.16 |
탐욕적인 수량자(Greedy Quntifiers), 게으른 수량자(Lazy Quntifiers) (0) | 2019.12.12 |
정규표현식 * + ? (0) | 2019.12.11 |
정규표현식 [] [-] [^] (|) (0) | 2019.12.10 |