나는 탐욕스럽지 않게 TD 태그를 파싱하려고 시도하고있다.정규식 비 - Greedy
Regex.Split(tempS, @"\<TD[.\s]*?\>");
레코드는 다음과 같이 반환 : 왜
""
"stuff<TD align="right">More stuff<TD align="right>Other stuff"
"things"
"more things"
없는 내 정규식으로 아래 사용하고
<TD>stuff<TD align="right">More stuff<TD align="right>Other stuff<TD>things<TD>more things
을 :이 같은 뭔가 시작 해요 그 첫 번째 전체 결과 ("stuff"로 시작하는 것)를 나눕니다. 매개 변수가 있거나없는 TD 태그의 모든 인스턴스에서 정규식을 분할하도록 조정하려면 어떻게해야합니까?
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –
을'참조하십시오 시도 .' 문자 클래스가 문자 클래스가 아니라 문자 클래스가 아니라. 여러분은'[^>] *'로 더 성공할 수 있습니다. 그러나 그것은 애트리뷰트에서'>'을 깰 것입니다. (html과 xml을 조작하는 정규 표현식보다는 파서를 자주 보는 이유 중 하나이기도합니다.) – Wrikken
@Wrikken 여기 HTML은 꽤 정적입니다. 많은 변형이 없으며 그것을 위해 작동하는 정규식을 알고 있습니다. 그 때문에 나는 파서의 길을 가지 않았다. 그것을 만드는 방법이 있습니까? 문자는 공백을 포함하여 '임의의 문자'를 의미합니까? – steventnorris