어제 Scrapy
을 사용해 보았을 때 중국 루비 포럼 게시물의 제목을 가져 오려고했습니다. 하지만, 어떻게 든 Scrapy
의 출력은 내가 응답의 인코딩이 UTF-8
입니다 체크 아웃 한부적절한 응답의 인코딩
"[\u5317\u4eac][2017\u5e746\u670818\u65e5] Rails Girls"
처럼, 모든 Unicode
하고 내가 제대로 중국어 문자를 보여 본문의 내용을 인쇄.
그래서 저는 Scrapy selector를 사용하여 제목을 선택하고 출력을 Json 파일에 저장하는 이유를 혼동합니다. 그런 다음 파일의 내용은 모두 \u5317
과 같은 모든 문자 포인터입니다. 어떤 도움을 주시면 감사하겠습니다. 감사.
내 코드 :
import scrapy
class MySpider(scrapy.Spider):
name = 'myspider'
start_urls = ['https://ruby-china.org/topics']
def parse(self, response):
self.logger.warning("body: %s", response.body)
for topic in response.css('div.topic'):
title = topic.css('div.media-heading')
yield {'title': title.css('a ::attr(title)').extract_first()}
정확하고 자세한 답변을 보내 주셔서 감사합니다. –