2012-03-01 3 views
0

텍스트 파일에 wikimedia 태그가 있습니다. 중첩 할 때조차도 시작부터 끝까지 태그를 제거해야합니다. Perl을 사용하고 있습니다.Perl을 사용하여 Wikipedia 중첩 태그를 제거하는 방법

중첩 된 태그에 어려움이 있습니다. 나는 제거 할 수없는 이러한 태그의 두 가지 예제를 제공 할 것입니다.

예 1

{{ text 
text 
text {{ text 
text}} 
text }} 

예 2 대신에 "{{"실시 예 1에서, 우리는 태그 "]"가의 .

[[ text 
text [[ text 
text]] 
text ]] 

나는 누군가가 삭제됩니다 Can I use Perl regular expressions to match balanced text?

+1

원하는 결과가 무엇이며 무엇을해야 당신은 시도? – dgw

+2

브래킷이나 괄호 안의 것들도 제거해야합니까? –

답변

4

이 문제를 해결하기 위해 저를 찾아 낼 희망 {{ 또는 }}

-1
s/{{|}}//g; 

봤어