2017-10-05 7 views
2

도움이 필요합니다. 나는 걸러 내고 가속 크기와 함께 elapsed_seconds 열에서 10769 년 이후에 수집 된 데이터로 구성된 다른 CSV 파일에 씁니다. 그러나, 나는 KeyError를 받고 있어요 : 0 ... 내가 점점 오전KeyError : 0 Pandas

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

data = pd.read_csv(accelDataPath) 
data.columns = ['t', 'x', 'y', 'z'] 

# calculate the magnitude of acceleration 
data['m'] = np.sqrt(data['x']**2 + data['y']**2 + data['z']**2) 

data['datetime'] = pd.DatetimeIndex(pd.to_datetime(data['t'], unit = 'ms').dt.tz_localize('UTC').dt.tz_convert('US/Eastern')) 
data['elapsed_seconds'] = (data['datetime'] - data['datetime'].iloc[0]).dt.total_seconds() 
i=0 
csv = open("filteredData.csv", "w+") 
csv.write("Event at, Magnitude \n") 
while (i < len(data[data.elapsed_seconds > 10769])): 
    csv.write(str(data[data.elapsed_seconds > 10769][i]) + ", " + str(data[data.m][i]) + "\n") 
csv.close() 

오류 것은 :

Traceback (most recent call last): 
    File "C:\Users\Desktop\AnalyzingData.py", line 37, in <module> 
csv.write(str(data[data.elapsed_seconds > 10769][i]) + ", " + str(data[data.m][i]) + "\n") 
    File "C:\python\lib\site-packages\pandas\core\frame.py", line 1964, in __getitem__ 
    return self._getitem_column(key) 
    File "C:\python\lib\site-packages\pandas\core\frame.py", line 1971, in _getitem_column 
    return self._get_item_cache(key) 
    File "C:\python\lib\site-packages\pandas\core\generic.py", line 1645, in _get_item_cache 
    values = self._data.get(item) 
    File "C:\python\lib\site-packages\pandas\core\internals.py", line 3590, in get 
    loc = self.items.get_loc(item) 
    File "C:\python\lib\site-packages\pandas\core\indexes\base.py", line 2444, in get_loc 
    return self._engine.get_loc(self._maybe_cast_indexer(key)) 
    File "pandas\_libs\index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc (pandas\_libs\index.c:5280) 
     File "pandas\_libs\index.pyx", line 154, in pandas._libs.index.IndexEngine.get_loc (pandas\_libs\index.c:5126) 
     File "pandas\_libs\hashtable_class_helper.pxi", line 1210, in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas\_libs\hashtable.c:20523) 
     File "pandas\_libs\hashtable_class_helper.pxi", line 1218, in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas\_libs\hashtable.c:20477) 
    KeyError: 0 
+1

당신의 dataframe이 '0'이라는 열이없는 것을 매우 분명하다. 그러나'data [data.elapsed_seconds> 10769] [i]'는'i == 0' 일 때'0' 열을 선택합니다. 또한 무한 루프를 작성하는 것 같습니다 ... – IanS

+1

설명해 주셔서 감사합니다. 첫 번째 줄 [data.elapsed_seconds> 10769]이 첫 줄이되도록 초기화하는 방법을 알고 있습니까? – user2995019

+1

알았습니다. 'data [data.elapsed_seconds> 10769] .iloc [i]'를 시도하면 첫 번째 행이 선택됩니다. – IanS

답변

1

변경이 줄을 여기에

csv.write(
    str(data[data.elapsed_seconds > 10769][i]) + ", " + str(data[data.m][i]) + "\n" 
    ) 

:

csv.write(
    str(data[data.elapsed_seconds > 10769].iloc[i]) + ", " + str(data[data.m].iloc[i]) +"\n" 
    ) 

또한 증가하지 않고 있습니다. i과 같이, i += 1과 같이 while 루프에 있습니다. 다음과 같이


또는 더 나은, df.to_csv를 사용

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

data = pd.read_csv(accelDataPath) 
data.columns = ['t', 'x', 'y', 'z'] 

# calculate the magnitude of acceleration 
data['m'] = np.sqrt(data['x']**2 + data['y']**2 + data['z']**2) 

data['datetime'] = pd.DatetimeIndex(pd.to_datetime(data['t'], unit = 'ms').dt.tz_localize('UTC').dt.tz_convert('US/Eastern')) 
data['elapsed_seconds'] = (data['datetime'] - data['datetime'].iloc[0]).dt.total_seconds() 

# write to csv using data.to_csv 
data[data.elapsed_seconds > 10769][['elapsed_seconds', 'm']].to_csv("filteredData.csv", 
      sep=",", 
      index=False) 
+0

가능한 중복 작동하지 않습니다 ... 다른 오류 집합을 생성합니다. KeyError ('% s는 색인'% objarr [마스크]에 없습니다.) KeyError : '[0.20489437 0.21313549 0.22022774 ..., 1.53666405 1.31770629 \ n 1.55170659] 색인에 없음 ' – user2995019

+0

@ user2995019, 업데이트를 확인하십시오. – MedAli

+0

색인 ([u't ', u'x', u'y ', u'z', u'm ', u'detime', u'elapsed_seconds '], dtype ='객체 ') – user2995019