나는 다음과 같은 링크에서 도구 상자를 사용하여 파이썬으로 WARC 파일을 열려고 시도하고있다 : http://warc.readthedocs.org/en/latest/열린 WARC 파일
로 파일을 여는 :
import warc
f = warc.open("00.warc.gz")
다 괜찮 및 f를 객체는 다음과 같습니다
<warc.warc.WARCFile instance at 0x1151d34d0>
그러나 내가 사용하여 파일에 모든 것을 읽을려고 할 때 :
012 3,516,for record in f:
print record['WARC-Target-URI'], record['Content-Length']
다음 오류가 나타납니다
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Users/xxx/anaconda/lib/python2.7/site-packages/warc/warc.py", line 390, in __iter__
record = self.read_record()
File "/Users/xxx/anaconda/lib/python2.7/site-packages/warc/warc.py", line 373, in read_record
header = self.read_header(fileobj)
File "/Users/xxx/anaconda/lib/python2.7/site-packages/warc/warc.py", line 331, in read_header
raise IOError("Bad version line: %r" % version_line)
IOError: Bad version line: 'WARC/0.18\n'
내 WARC 파일 버전이 WARC의 내가 사용 도구 상자 또는 뭔가에 의해 지원되지 않기 때문에이인가?
그게 오류라고합니다. – simonzack