2017-11-28 12 views
1

aws의 s3 버킷에서 팬더에 CSV 파일을로드하려고합니다. Boto3은 하위 폴더에서 파일을로드하는 기능을 제공하는 데 부족합니다. 내가 s3에서 다음 경로를 가지고 있다고 가정 해 봅시다 : bucket1/bucketwithfiles1/file1.csvs3의 파일을 파이썬 서브 폴더로 로딩

file1.csv를로드하는 방법을 어떻게 지정합니까? 나는 s3에 디렉토리 구조가 없다는 것을 알고있다.

import boto3 
import pandas as pd 

s3 = boto3.client('s3') 
obj = s3.get_object(Bucket='/bucket1/creditdefault-ff.csv') 

df = pd.read_csv(obj['Body']) 

답변

1

버킷, 폴더 및 객체 키를 혼동하는 것 같습니다. 코드는 다음과 유사해야합니다 (키에는 폴더와 파일 이름이 모두 포함되며 버킷에는 S3 버킷 이름 만 포함).

obj = s3.get_object(Bucket='bucketname', Key='folder1/folder2/filename.csv')