PHP에서 제공하는 정규 표현식에 대해서 알아보겠습니다.
정규 표현식은 웹 프로그래밍을 할 때 문자열을 정교하게 처리하기 위해 필요합니다.
먼저, 정규 표현식에서 사용되는 패턴 문자 몇 가지를 소개하면 아래와 같습니다.
+ -> '+' 표시 바로 앞의 문자열(문자)이 한 번 이상 존재하는 것을 의미
^ -> '^' 표시 뒤의 문자열(문자)로 시작되는 것을 의미
[ ] -> '[ ]' 로 둘러쌓인 문자열(문자) 중에서 하나의 문자를 의미
[^ ] -> '[ ]' 패턴의 문자열(문자)을 제외한 나머지 문자열(문자)을 의미
{ } -> '{ }' 앞의 문자열(문자)이 '{ }' 안의 숫자가 나타내는 갯수만큼 존재하는 것을 의미
[[:digit:]] -> 하나의 숫자(0 에서 9 까지) 를 의미
[[:alpha:]] -> 하나의 영문자(a 에서 Z 까지) 를 의미
[[:alnum:]] -> 하나의 숫자(0 에서 9 까지) 또는 영문자(a 에서 Z 까지) 를 의미
[[:space:]] -> 하나의 공백 문자(blank) 를 의미
위 패턴 문자를 사용한 정규 표현식이 어떻게 사용되는지 살펴보기 전에, 위와 같은 패턴 문자로 나타내어진 정규 표현식을 사용하기 위해 필요한 함수가 있는데, ereg() 함수가 있습니다.
ereg() 함수는 일반적으로 두 개의 인자를 취하는데, 첫 번째 인자는 패턴 문자로 나타내어진 정규 표현식이 오며 두 번째 인자는 그 정규 표현식에 의해 검색될 대상 문자열이 옵니다.
이렇게 ereg() 함수 내의 두 번째 인자인 검색 대상 문자열에서 첫 번째 인자인 정규 표현식의 패턴이 존재할 경우 ereg() 함수는 true 값을 반환하며 그렇지 않을 경우에는 false 값을 반환하게 됩니다.
그럼, ereg() 함수를 사용하여 위 패턴 문자로 나타내어진 정규 표현식이 어떻게 사용되는지 몇 가지 예제를 살펴보겠습니다.
<?
$sMessage = "mizzle PHP 2005";
# '+' 패턴 검사
if(ereg("iz+", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>"; # 실행 라인
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>";
}
# '^' 패턴 검사
if(ereg("^mi", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>"; # 실행 라인
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>";
}
# '[ ]' 패턴 검사
if(ereg("[si]m", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>";
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>"; # 실행 라인
}
# '[[:digit:]]' 패턴 검사
if(ereg("[[:digit:]]{4}", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>"; # 실행 라인
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>";
}
# '[[:alpha]]' 패턴 검사
if(ereg("[[:alpha:]]{7}", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>";
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>"; # 실행 라인
}
# '[[:space]]' 패턴 검사
if(ereg("[[:space:]]{2}", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>";
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>"; # 실행 라인
}
?>
위 예제를 실행하게 되면, 위 예제 코드의 주석("#실행 라인")으로 표기한 라인이 실행되는 것을 볼 수 있습니다.
위 예제 중 몇 가지만 살펴보면,
'+' 패턴 검사 코드의 경우, "iz" 문자열이 한 번 이상 존재해야 함을 의미하는 iz+ 패턴이 "mizzle PHP 2005" 문자열에 존재하기 때문에 비교 조건식에 일치하는 결과가 출력됩니다.
'[ ]' 패턴 검사 코드의 경우, "sm" 또는 "im" 문자열이 존재해야 함을 의미하는 [si]m 패턴이 "mizzle PHP 2005" 문자열에 존재하지 않기 때문에 비교 조건식에 일치하지 않는 결과가 출력됩니다.
'[[:digit:]]' 패턴 검사 코드의 경우, 연속되는 숫자 4개의 문자가 존재해야 함을 의미하는 [[:digit:]]{4} 패턴이 "mizzle PHP 2005" 문자열에 존재하기 때문에 비교 조건식에 일치하는 결과가 출력됩니다.
이상, 정규 표현식의 기초에 대해서 살펴보았습니다.
좀 지루한 내용이죠 ^^;
정규 표현식의 경우, 위에 제가 설명해 드린 부분 외에도 배울 내용이 많기 때문에 그 부분에 대해서 개인적으로 공부하시면서 충분히 연습 하시기 바랍니다.
정규 표현식은 웹 프로그래밍을 할 때 문자열을 정교하게 처리하기 위해 필요합니다.
먼저, 정규 표현식에서 사용되는 패턴 문자 몇 가지를 소개하면 아래와 같습니다.
+ -> '+' 표시 바로 앞의 문자열(문자)이 한 번 이상 존재하는 것을 의미
^ -> '^' 표시 뒤의 문자열(문자)로 시작되는 것을 의미
[ ] -> '[ ]' 로 둘러쌓인 문자열(문자) 중에서 하나의 문자를 의미
[^ ] -> '[ ]' 패턴의 문자열(문자)을 제외한 나머지 문자열(문자)을 의미
{ } -> '{ }' 앞의 문자열(문자)이 '{ }' 안의 숫자가 나타내는 갯수만큼 존재하는 것을 의미
[[:digit:]] -> 하나의 숫자(0 에서 9 까지) 를 의미
[[:alpha:]] -> 하나의 영문자(a 에서 Z 까지) 를 의미
[[:alnum:]] -> 하나의 숫자(0 에서 9 까지) 또는 영문자(a 에서 Z 까지) 를 의미
[[:space:]] -> 하나의 공백 문자(blank) 를 의미
위 패턴 문자를 사용한 정규 표현식이 어떻게 사용되는지 살펴보기 전에, 위와 같은 패턴 문자로 나타내어진 정규 표현식을 사용하기 위해 필요한 함수가 있는데, ereg() 함수가 있습니다.
ereg() 함수는 일반적으로 두 개의 인자를 취하는데, 첫 번째 인자는 패턴 문자로 나타내어진 정규 표현식이 오며 두 번째 인자는 그 정규 표현식에 의해 검색될 대상 문자열이 옵니다.
이렇게 ereg() 함수 내의 두 번째 인자인 검색 대상 문자열에서 첫 번째 인자인 정규 표현식의 패턴이 존재할 경우 ereg() 함수는 true 값을 반환하며 그렇지 않을 경우에는 false 값을 반환하게 됩니다.
그럼, ereg() 함수를 사용하여 위 패턴 문자로 나타내어진 정규 표현식이 어떻게 사용되는지 몇 가지 예제를 살펴보겠습니다.
<?
$sMessage = "mizzle PHP 2005";
# '+' 패턴 검사
if(ereg("iz+", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>"; # 실행 라인
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>";
}
# '^' 패턴 검사
if(ereg("^mi", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>"; # 실행 라인
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>";
}
# '[ ]' 패턴 검사
if(ereg("[si]m", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>";
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>"; # 실행 라인
}
# '[[:digit:]]' 패턴 검사
if(ereg("[[:digit:]]{4}", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>"; # 실행 라인
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>";
}
# '[[:alpha]]' 패턴 검사
if(ereg("[[:alpha:]]{7}", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>";
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>"; # 실행 라인
}
# '[[:space]]' 패턴 검사
if(ereg("[[:space:]]{2}", $sMessage)) {
echo "지정된 패턴과 일치합니다.<br>";
} else {
echo "지정된 패턴과 일치하지 않습니다.<br>"; # 실행 라인
}
?>
위 예제를 실행하게 되면, 위 예제 코드의 주석("#실행 라인")으로 표기한 라인이 실행되는 것을 볼 수 있습니다.
위 예제 중 몇 가지만 살펴보면,
'+' 패턴 검사 코드의 경우, "iz" 문자열이 한 번 이상 존재해야 함을 의미하는 iz+ 패턴이 "mizzle PHP 2005" 문자열에 존재하기 때문에 비교 조건식에 일치하는 결과가 출력됩니다.
'[ ]' 패턴 검사 코드의 경우, "sm" 또는 "im" 문자열이 존재해야 함을 의미하는 [si]m 패턴이 "mizzle PHP 2005" 문자열에 존재하지 않기 때문에 비교 조건식에 일치하지 않는 결과가 출력됩니다.
'[[:digit:]]' 패턴 검사 코드의 경우, 연속되는 숫자 4개의 문자가 존재해야 함을 의미하는 [[:digit:]]{4} 패턴이 "mizzle PHP 2005" 문자열에 존재하기 때문에 비교 조건식에 일치하는 결과가 출력됩니다.
이상, 정규 표현식의 기초에 대해서 살펴보았습니다.
좀 지루한 내용이죠 ^^;
정규 표현식의 경우, 위에 제가 설명해 드린 부분 외에도 배울 내용이 많기 때문에 그 부분에 대해서 개인적으로 공부하시면서 충분히 연습 하시기 바랍니다.
출처 : http://cafe.daum.net/lcrcStudy
'컴퓨터 > 언어,프로그래밍' 카테고리의 다른 글
[PHP] 파일관련 함수모음 (종류/용도/방법) (0) | 2009.01.26 |
---|---|
[PHP] 파일시스템 함수 목록 (0) | 2009.01.26 |
PHP 기초 강좌 - 파일 처리 함수 (0) | 2009.01.26 |
input 태그에서 name과 id의 차이 (0) | 2009.01.14 |
[JavaScript] 자바스크립트 :: Math 객체, 속성, 메소드 (0) | 2009.01.14 |