팬 데이터 데이터 프레임을 읽어야하는 큰 데이터 집합이 있습니다.Python pandas 문자열 SQL 데이터베이스의 범주 데이터 처리
다소 긴 문자열을 포함하는 많은 양의 범주 형 데이터가 포함되어 있습니다.
팬더를 사용하려고합니다. read_sql_query 메소드 어떤 열을 범주 형 데이터로 처리해야하는지 지정할 수 없습니다.
이것은 메모리 문제가 있음을 의미합니다.
나는 R과 같은 것을 지정할 수있는 배경을 가지고 있는데, string을 factor로 지정할 수 있습니다. 작은 메모리 풋 프린트로 긴 문자열을 가질 수 있다는 의미는 R에서 정수로 인덱싱되기 때문입니다. Python/Pandas에서도 동일한 작업을 수행 할 수 있습니까?
데이터베이스에서 데이터를 읽으면서 작업을 수행하고 싶습니다. 안돼. 팬더에서 문자열을 카테고리로 변환하면 데이터 프레임에 포함 된 문자열을 쉽게 변환 할 수 있지만 원하는 것은 아닙니다.
나는 데이터베이스의 데이터를 단순히 인코딩 할 수 있다고 생각하지만이를 피하고 싶습니다.
고마워. 나는 이것이 이미 가능하지 않다는 것에 조금 슬퍼한다. 일반적으로 전체 유형 매핑은 R과 비교하여 판다에서 다소 개략적 인 것처럼 보입니다. R을 사용하면 사전을 만들어 모든 유형간에 변환 할 수 있습니다. 오 잘 나는 기다려야 할 것이다. 내가 chunkks로 어쩌면 내가 주위에 내 자신의 래퍼를 할 수있는보십시오. – CodeMonkey