2017-01-23 6 views
1

PHP 간단한 HTML DOM 파서를 사용하여 웹 사이트에서 긁어 내고 싶습니다. 소스 코드는 같은 랜덤 : 내부 < p는> </P>가> < 글꼴을 사용하여 넣어 것 "(.. 로브, 공동 V). 세부 사항을"대신 직접 퍼팅의PHP를 사용한 폐기 간단한 HTML DOM 파서

 <font face="Arial" color="#ff0000"> 
     <p>Parameters</p> 
     </font><font face="Arial" size="2" color="#ff0000"> 
     <p>Param1</p> 
     </font><font face="Arial" size="2" color="#0000ff"> 
     <p>Details. (Lob., </font><i><font face="Arial" 
     size="2" color="#ff0000">Co v</font><font face="Arial" size="2" 
     color="#0000ff">.)</p> 

및 < 전 >. 내가

foreach($html->find('p') as $p) 
{ 
    echo $p->plaintext.'<br>'; 
} 

내가 <을 찾을 때 "세부 사항. (로브.는,"그것은 중지 발견이 코드를 사용할 때> 또는 < FONT>. 나는 전체 라인을 추출 할 수있는 방법 "세부 사항. (로브., 공동 V.) "

당신은 불필요한 태그. 불필요한 태그를 제거한 후, 당신은 DOM 파서를 사용하여 제거 strip_tags() 기능을 사용할 수 있습니다

+0

_ "긁히다"_를 의미합니까? 그냥 확인해. –

+0

예 죄송합니다. 다쳤습니다. – balimaco00

답변

1

답변 주셔서 감사합니다.

strip_tags() 함수는 HTML, XML 및 PHP 태그에서 문자열을 제거합니다.

문자열 strip_tags (문자열 $ str을 [문자열 $ allowable_tags])

당신은 (strip_tags에 대한 자세한 내용을보실 수 있습니다) php.net

예에 기능 :

$html = '<font face="Arial" color="#ff0000"> 
    <p>Parameters</p> 
    </font><font face="Arial" size="2" color="#ff0000"> 
    <p>Param1</p> 
    </font><font face="Arial" size="2" color="#0000ff"> 
    <p>Details. (Lob., </font><i><font face="Arial" 
    size="2" color="#ff0000">Co v</font><font face="Arial" size="2" 
    color="#0000ff">.)</p>'; 

$html = strip_tags($string, '<p>'); 
echo $html; 

결과 :

<p>Parameters</p> 

    <p>Param1</p> 

    <p>Details. (Lob., Co v.)</p>