일부 HTML 코드 단편을 구문 분석하려고 시도하고 있으며 다양한 이유 (XSS 외)로 정리하려고합니다.eregi_replace를 preg_replace로 변환
현재 앵커의 href를 제외한 모든 태그의 모든 속성을 제거하려고합니다. eregi_replace 호출 시퀀스를 사용하여이 작업을 수행하고 있지만 preg_replace와 몇 줄의 코드를 사용하여 더 똑똑한 방법이 있다고 확신하지만이 코드를 작동시키지 못했습니다. 누구든지 도와 줄 수 있습니까?
현재 코드 :
$data_item = eregi_replace("<p[^>]*>","<p>", $data_item);
$data_item = eregi_replace("<h2[^>]*>","<h2>", $data_item);
$data_item = eregi_replace("<h3[^>]*>","<h3>", $data_item);
$data_item = eregi_replace("<h4[^>]*>","<h4>", $data_item);
$data_item = eregi_replace("<h5[^>]*>","<h5>", $data_item);
$data_item = eregi_replace("<h6[^>]*>","<h6>", $data_item);
$data_item = eregi_replace("<ul[^>]*>","<ul>", $data_item);
$data_item = eregi_replace("<ol[^>]*>","<ol>", $data_item);
$data_item = eregi_replace("<li[^>]*>","<li>", $data_item);
$data_item = preg_replace("/<a([^>]*)(href=\S+)([^>]*)>/i", '<a$2 rel="nofollow">', $data_item);
가 (난 단지 이전에 내가 어떤 undesireables을 제거 이것으로 HTML 태그의 하위 집합을 구문 분석 할 필요가있다).