저는 파이썬에서 초보자입니다. 파일에서 트위터 데이터를 토큰 화하는 방법을 알고 싶습니다.파이썬 : 파일에서 토큰을 만드는 방법?
내 코드는 다음과 같습니다
with codecs.open('example.csv', 'r',"utf-8") as f:
for line in f:
tweet = f.readlines()
tokens = word_tokenize(tweet["text"])
print(tokens)
그러나 오류 :
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-15-98b6d77c2fcf> in <module>()
2 for line in f:
3 tweet = f.readlines()
----> 4 tokens = word_tokenize(tweet["text"])
5 print(tokens)
TypeError: list indices must be integers or slices, not str
가 어떻게 내 코드를 향상시킬 수 있습니까?
무엇이'word_tokenize'입니까? 또한'tweet'는'list'입니다. 목록 항목을 액세스하기 위해 인덱스를 사용하여 참조해야합니다 (오류가 표시하는 것처럼) – Arman
나는 nltk.word_tokenize를 가정합니까? – coffeemakr
word_tokenize from code : pythainlp.tokenize 가져 오기 word_tokenize 및 example.csv의 텍스트를 –