0
나는 한동안이 작업에 매달 렸습니다. 현재이 함수는 날짜, 위도, 경도, 사용자 ID, 라이브 트윗의 텍스트를 CSV 파일에 씁니다.tweepy를 사용하여 인코딩 된 JSON 데이터를 CSV에 쓰기
문제는 트윗의 텍스트가 다른 알파벳의 글자를 포함한다는 것입니다. 아라비아 말. 이 편지는이 양식 (\ u0641 \ u064a)에 표시됩니다.
텍스트를 utf-8 문자열로 인코딩하고 나머지 데이터에 추가하여 csv 파일이 모든 문자를 표시 할 수 있습니까?
def on_data(self, data):
try:
tweets = json.loads(data)
with open('Data.csv','a',encoding = 'utf-8') as f:
if(tweets['coordinates'] is not None):
coordinates_string = json.dumps(tweets["coordinates"]["coordinates"])
val_lg = coordinates_string.split(',')[0].strip("[")
val_lt = coordinates_string.split(',')[1].strip("]")
else:
val_lg = "None"
val_lt = "None"
text = json.dumps(tweets["text"])
user_id = json.dumps(tweets["user"]["id_str"])
time = json.dumps(tweets["created_at"])
data_string = time + "," + val_lt + "," + val_lg + "," + user_id + "," + text + "\n"
print(data_string)
f.write(data_string)
except:
pass
data_string.decode '는 ("UTF-8")'을해야 작업 –
문자열의 디코딩 된 버전을 쓰려고하면 아무 일도 일어나지 않습니다. – Ivan
try/except/pass를 삭제하십시오. 아마 예외가 숨어있을 것입니다. –