본문 바로가기

php

UTF8 문자관련


php에서 utf-8인 경우에는 정규식을 사용하면.. 한방에 해결된다.

$line ="ABAFDSAFDSFasdfds123412321fdsaf한글"; <--- 입력값

$pattern = '/([\xEA-\xED][\x80-\xBF]{2}|[\ -\~])+/';
preg_match_all($pattern, $line, $match);
echo implode('', $match[0])."\n";

만약 조건을 추가하고 싶으면...$pattern = '/([\xEA-\xED][\x80-\xBF]{2}|[\ -\~])+/'; 에..
| 앞에다가 추가하면된다.

유니코드 범위는 다음과 같고,
영대소 : [\x{1100}-\x{11FF}]
한글 자모 : [\x{3130}-\x{318F}]
한글 : [\x{AC00}-\x{D7AF}]
특수문자 : [\ -\~]
한자 : [\x{2E80}-\x{2EFF}\x{31C0}-\x{31EF}\x{3200}-\x{32FF}\x{3400}-\x{4DBF}\x{4E00}-\x{9FBF}\x{F900}-\x{FAFF}\x{20000}-\x{2A6DF}\x{2F800}-\x{2FA1F}]

utf-8 문자표는 http://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_5000%7E5FFF 에서 참조하면된다.

'php' 카테고리의 다른 글

[함수] $_SERVER['PATH_INFO'] 사용하기.  (0) 2010.03.09
파일다운로드 - 이어받기 속도제한 인증 기타  (0) 2010.03.08
php 이메일주소 유효성검사  (0) 2009.11.11
html 제거  (0) 2009.10.07
욕필터링  (0) 2009.10.07