lxml 사용법 모든 src 태그 찾기 및 바꾸기

2015-02-04 2 views 0 likes

lxml을 사용하여 src 컨텐츠를 가져 와서 공백으로 바꾸고 싶습니다.
하지만 신체는 여전히 교체되지 않습니다. 도와주세요. 감사합니다. 예를 들어lxml 사용법 모든 src 태그 찾기 및 바꾸기

import re 
import lxml.html 
#the content of source.log is a webpage source code I got by scrapy 
with open("source.log", "r") as bb: 
    c_str = bb.read() 
    body = c_str.decode('utf-8') 


doc = lxml.html.fromstring(body) 
src = doc.xpath("//@src") 

for ss in src: 
    re.search(ss,body) 
    body.replace(str(ss),'') 
    print body

: 몸이

'src="http://pic/1379181836.jpg"/><br>紅心<br></div><div>tel:12345678</div>' \ 
      'src="http://pic/4447918.jpg"/>'

나는 것이 원하는 결과 인 경우

'src=""/><br>紅心<br></div><div>tel:12345678</div>' \ 
      'src=""/>'

출처

2015-02-04 user2492364

답변

는 적어도, 당신은 body에 교체의 결과를 할당해야 :

for ss in src: 
    body = body.replace(str(ss), '') 
print body

비록 개인적으로이 방법이 마음에 들지 않습니다.

for element in doc.xpath("//*[@src]"): 
    element.attrib['src'] = '' 

print lxml.html.tostring(doc)

출처

2015-02-04 05:24:44 alecxe

감사합니다 : 더 나은 src 속성이 있고 빈 문자열로 속성 값을 설정 모든 태그를 찾을 수 있습니다! 네 말이 맞다. 그리고 코드가 아주 아름답다. – user2492364

최근 질문

1. 4 번째 자리 이후에 숫자를 복제하는 3 자리 이상이있는 줄을 출력하도록합니다.

2. mysql에서 클래스 카트 어레이 값을 codegniter에 저장하는 방법은 무엇입니까? 방법 <code>codegniter</code>에 <code>mysql</code> 이러한 배열의 값을 저장하고, 배열

3. [admin-on-rest] [aor-graqhql]을 사용하는 사용자 정의 테마

4. JS : 예기치 않은 스크립트 끝

5. fontawesome 아이콘 근처에서 텍스트를 어떻게 배치 할 수 있습니까?

6. 젠킨스 파일에 설정된 환경을 얻는 방법

7. 레일 사용자 정의 금액으로 스트라이프 체크 아웃

8. Semantic UI React에서 드롭 다운 항목을 클릭 할 때 모달을 트리거하는 방법은 무엇입니까?

9. Xcode 9.2 (9C40b) iOS 프로젝트의 ViewController로 참조 객체 드래그

10. AEM의 동적 미디어 및 장면 7 통합

관련 문제

관련 문제 없음^_^

문의하기

© 2020 KO.UWENKU.COM

沪ICP备13005482号-4

简体中文

繁體中文

Русский

Deutsch

Español

हिन्दी

Italiano

日本語

한국어

Polski

Türkçe

Tiếng Việt

Française