2014-11-04 10 views
0

데이터 프레임 생성자 인 pd.Dataframe testdf = pd.DataFrame(test)에 생성기를 구문 분석하려고합니다. 각 줄을 탭으로 구분하도록 지정할 수 없습니다. 결과적으로 각 열이 '\t'으로 분리 된 값의 전체 행인 단일 열 데이터 프레임으로 끝납니다.각 라인이 탭으로 구분 된 행인 생성기의 팬더 데이터 프레임

나는 다른 몇 가지 방법으로 시도했다 :

pd.read_csv(test) 
    pandas.io.parsers.read_table(test, sep='\t') 

을하지만, 입력 유형 생성기를하지 않기 때문에 그들의 이러한 작업도 작동합니다.

답변

2

발전기에 익숙하지 않습니다. 당신은 그들을 목록 이해력으로 던질 수 있습니까? 그렇다면, 약

pd.DataFrame([x.split('\t') for x in test]) 
+0

위대한; 선을 그만두고 내 해결책보다 더 무난한 느낌이 든다. –

0

하나 개 내가 그것을 파괴하기 위해 하나 개의 컬럼에 분할 기능을 사용하는 것입니다 발견 솔루션 :

testdf_parsed = pd.DataFrame(testdf.row.str.split('\t').tolist(),) 

... 그리고 나를 위해 그 않았다 작동하지만 어쩌면 더 우아한이 있고 팬더의 핵심 역량을 활용하는 간단한 솔루션이 있습니까?

0

그런 다음 그 read_table을 공급, 발전기를 래핑 파일 - 류의 객체를 구현하려고하는 방법.