본문 바로가기

RegEXR/Common

정규표현식 \w \W \d \D \b \B \A \Z

정규표현식의 패턴들 18~24) 경계()

  • \w \W \d \D \b \B \A \Z

    pattern : \w

  • [A-z0-9__] 와 동일
  • 공백은 미포함(아래는 귀찮아서 밑줄안뺀거)

source : A1 B2 c3 d__4 e:5 ffGG77--____--

\w

  • first match : <U>A</U>1 B2 c3 d__4 e:5 ffGG77--____--
  • all matches : <U>A1 B2 c3 d__4 e</U>:<U>5 ffGG77</U>--<U>____</U>--

\w*

  • *때문에 글자가 더 있어도 단어로 인식해서 first match인 경우가 다르다
  • first match : <U>A1</U> B2 c3 d__4 e:5 ffGG77--____--
  • all matches : <U>A<1 B2 c3 d__4 e</U>:<U>5 ffGG77</U>--<U>____</U>--

[a-z]\w*

  • a부터 z까지의 문자 그다음 여러개의 문자가 오거나 없거나 다 해당
  • first match : A1 B2 <U>c3</U> d__4 e:5 ffGG77--____--
  • all matches : A1 B2 <U>c3</U> <U>d__4</U> <U>e</U>:5 <U>ffGG77</U>--____--

\w{5}

  • [A-z0-9__] 다섯개
  • first match : A1 B2 c3 d__4 e:5 <U>ffGG7</U>7--____--
  • all matches : A1 B2 c3 d__4 e:5 <U>ffGG7</U>7--____--

pattern : \W

  • 대문자로 W를 쓰면 \w가 아닌 문자열만 선택한다는것
  • [^A-z0-9__]
  • 공백, __를 제외한 특수문자등

source : AS __34:AS11.23 @#$%12^*

\W

  • first match : AS<U> </U>__34:AS11.23 @#$%12^*
  • all matches : AS<U> </U>__34<U>:</U>AS11<U>.</U>23<U> @#$%</U>12<U>^*</U>

source : Page 123; published: 1234 id=12#24@112

pattern : \d

  • [0-9]
  • first match : Page <U>1</U>23; published: 1234 id=12#24@112
  • all matches : Page <U>123</U>; published: <U>1234</U> id=<U>12</U>#<U>24</U>@<U>112</U>

pattern : \D

  • [^0-9] : 공백 및 특수문자 포함
  • first match : <U>P</U>age 123; published: 1234 id=12#24@112
  • all matches : <U>Page </U>123<U>; published: </U>1234<U> id=</U>12<U>#</U>24<U>@</U>112

pattern : \b

  • work boundery : 앞문자\b뒷문자
  • \b를 중심으로 앞에 문자를 넣을 경우 앞에 일치하는 단어를 찾고
  • 뒤에 넣으면 뒤에 일치하는 단어를 찾는다.

pattern : \B

  • not work boundery
  • 단어에서 \b에 일치하지 않는 문자

pattern : \A

  • \A시작조건
  • \A... 하면 문장에서 첫 문자중 3개 선택
  • 멀티라인이여도 첫 문장에서만 체크(^와 차이점)

pattern : ...\Z

  • 끝조건\Z
  • ...\Z 하면 문장에서 마지막 문자중 3개 선택
  • 멀티라인이여도 첫 문장에서만 체크($와 차이점)