2016-09-17 6 views
3

나는 Kaggle 's San Fransico Salaries에서 추출한 데이터 프레임을 가지고 있습니다 : https://www.kaggle.com/kaggle/sf-salaries 그리고 'Status'와 같은 열 값 집합을 만들고 싶습니다.팬더 시리즈에서 세트 만들기

이것은 내가 시도했지만 집합 대신 모든 레코드 목록을 가져옵니다 (sf는 데이터 프레임의 이름 임).

a=set(sf['Status']) 
print a 

이 웹 페이지에 따르면이 기능이 작동합니다. How to construct a set out of list items in python?

+0

왜 'a'는 목록입니까? – tacaswell

+0

아마 내가 용어를 잘못 사용했는데, 순수한 nans 인 경우 신경 쓰지 않고도 모든 값을 나에게 제공한다는 의미입니다 –

답변

15

유일한 값의 목록 만 가져와야하는 경우 unique 메서드를 사용할 수 있습니다. 파이썬의 설정을 원한다면 는 다음 DataFrame이있는 경우, 그냥 (some_data_frame['<col_name>']) 중 계열을 선택, 그러나 set(some_series)

In [1]: s = pd.Series([1, 2, 3, 1, 1, 4]) 

In [2]: s.unique() 
Out[2]: array([1, 2, 3, 4]) 

In [3]: set(s) 
Out[3]: {1, 2, 3, 4} 

을한다.