나는 html 파일에서 일부 텍스트를 긁어 내려고 노력하고 있습니다. 그러나 태그에서 단어 (contextref
)로 서로 다른 2 가지 유형의 텍스트가 필요합니다. : 순간BeautifulSoup html 태그 - 파이썬 3 2 용어를 통해 텍스트를 찾으십시오
1) <ix:nonfraction contextref="cfwd_30_04_2016" name="ns5:TangibleFixedAssets" unitref="GBP" decimals="0" format="ixt2:numdotdecimal" scale="0" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">180,649</ix:nonfraction>
2) <ix:nonfraction contextref="cfwd_30_04_2015" name="ns5:TangibleFixedAssets" unitref="GBP" decimals="0" format="ixt2:numdotdecimal" scale="0" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">200,395</ix:nonfraction>
텍스트를 찾을 수 내 코드는 다음과 같습니다 var1=(soup.find('ix:nonfraction',{'name':'uk-gaap:{}'.format(variable)}).text)
하는주고 위의 예제 : 180,649.
두 값을 모두 얻을 수 있으려면 name
(contextref
) ive와 함께 다른 단어를 포함 시키려면 다른 변수가 필요하지만 작동하지 않는 것 같습니다.
어떤 도움이 좋을 것, 감사
이 xml 코드입니까? 원하는 출력을 게시하십시오. –
아니요, 그 파일은 모두'.html'입니다. 이상적인 출력은'var1'이 첫 번째 태그 = 180,649와'var2'의 텍스트 파일을 두 번째 = 200,395부터 포함시키는 것입니다. 두 태그가 동일한 헤드 태그 – reuben