import pandas as pd
from nltk.stem import PorterStemmer, WordNetLemmatizer
porter_stemmer = PorterStemmer()
df = pd.read_csv("last1.csv",sep=',',header=0,encoding='utf-8')
df['rev'] = df['reviewContent'].apply(lambda x : filter(None,x.split(" ")))
Dataset내가 내 dataframe을 막기 위해 노력하고 더 속성 '분할'
이 없습니다. 내가
df['rev'] = df['reviewContent'].apply(lambda x : filter(None,x.split(" ")))
AttributeError이 오류를 얻고있다 토큰 화하는 동안 : 나는 또한 플로트 문제를
df['reviewContent'] = df["reviewContent"].apply(lambda x: [stemmer.stem(y) for y in x])
형식 오류를 얻을 형태소 사용하는 동안 '부동'개체가 어떤 속성을 '분할'
이 없습니다 ' float '객체는 반복 가능하지 않습니다.
어떻게해야합니까?
:
이제 전에 귀하의 형태소 분석기를 실행할 수 있습니까? 예상되는 결과는 무엇입니까? 코드만으로는 도움이되지 않습니다. –
이것은 옐프 가짜 검토를위한 데이터 세트입니다. 내 전체 데이터 집합을 줄이려고합니다. 너무 데이터 집합을 업로드해야합니까 ?? –
처음 5 행은 어떻습니까? –