jupiter 노트북 셀로 셸 명령의 출력 (즉, csvkit 도구 호출 체인)을 스트리밍하는 방법을 알고 있지만, 특히 Pandas DataFrame으로 스트리밍하는 방법을 알고 계십니까? 셀의 콘텐츠에서 다음과 같이 보입니다.껍질에서 jupyter 노트북 셀로의 배관
output = !find /path -name "*.csv" | csvstack ... | csvgrep ...
df = DataFrame.read_csv(output)
위의 내용 만 실제로 작동하지 않습니다. 셸의 출력은 Pandas가 잘 처리 할 수있는 수백만 행의 매우 큰 출력이지만 출력을 전체적으로 문자열로 메모리에로드하지 않으려합니다.
팬더가 출력을 읽을 수 있도록하는 파이핑/스트리밍 솔루션을 찾고 있습니다.
. @ Dmitry csv를 클립 보드로 읽은 다음 pd. read_clipboard? 마찬가지로, 멀리 팬더 스트림을 처리하지 않습니다 .. – Merlin