2015-01-10 6 views
0

제거해야하는 텍스트가있는 매우 큰 .CSV 문서가 있습니다. 데이터는이Textmate Regex Issue

774431994&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774431994 

774431996&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774431996 

774431998&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774431998 

774432000&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774432000 

774432003&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774432003     

774432006&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774432006 

774432009&images=774431994,774431996,774431998,774432000,774432003,774432006,774432009&formats=0,0,0,0,0 /1/6/9/5/2/6/8/webimg/774432009 

처럼 나는 그냥 TextMate를 검색에서 작동하지 않는 것 http://regexr.com/3a6oa

/.{128}(?=webimg).{10}/g 

에 노력하고 다음과 같은 정규식을 사용하고 있습니다 보인다. 아무도 이유를 아나요? 이 쓰레기를 모두 선택하고 아무 것도 대치 할 필요가 없습니다. 숫자는 매번 고유합니다. 왜 당신이 당신의 패턴에 내다을 사용하는

답변

1
  • 매우

    감사합니다? 그냥 다음을 사용하십시오 : /.{128}webimg.{10}/g

  • 왜 Textmate 검색을 사용하고 있습니까? 내가 확실히 말할 수있는 더 많은 문제 상황을 알아야 할 것입니다,하지만 난 간단한 sed 명령은 단지 대신에 사용될 수있다 내기 :

sed -i "webimg/d" ./filename.csv

+0

그 긴 이야기하지만 짧은 버전을 ... Shopify에 대한 가져 오기를 만들 필요가 있습니다. eBay에서 내보냈지만 제품 설명에 제거해야하는 불쾌한 인라인 이베이 템플릿 HTML이 포함되어 있습니다. (내 CSV를 깨는 것처럼) Regex에 익숙하지 않지만 발견되었습니다. 이것은 동적 HTML (제품 이미지)을 제거하는 유일한 방법입니다. 나는 당신의 정규 표현식을 사용했고 그것은 정상적으로 작동했습니다. 시간을내어 답변 해 주셔서 대단히 감사합니다! –