팬더에서 몇 가지 시계열 분석을하고 있으며 제거하고 싶은 특이한 패턴이 있습니다. 벨로우즈 플롯은 데이터 당신이 산재 유사한 값 그 점을보고있는 라인과 같은 가능성이 악기의 단점을보고해야 할 수있는 날짜로 첫 번째 열의 두 번째 열이있는 dataframe을 기반으로 제거하십시오. 필자는 rolling_mean, median 및 표준 편차에 기반한 제거를 사
이 문제는 루프에서 다른 변수 이름을 사용하여 해결할 수 있습니다. 그러나 데이터 프레임을 저장할 수있는 List 요소의 길이를 확인할 수 있는지 확인해야합니다. 폴더에 저장된 모든 .csv 파일을 읽는 코드를 작성했습니다. 문자가 들어있는 목록을 만들었습니다. 이제는 폴더에서 CSV 파일을 하나씩 읽고 목록의 요소에 데이터 프레임으로 저장하고 있습니다.
거대한 timeseries DataFrame (약 100 000 000 행)이 있으며 조건에 따라 행을 필터링해야합니다. 다른 데이터 프레임의 각 행에있는 각 조건이 있습니다. 이 Dataframe에는 약 2000 개의 행이 있고 각 행은 조건입니다. 장난감 예 : df = pd.DataFrame({val: [1, 3, 2, 4, 3, 1, 2, 3], d
나는 numpy 및 pandas에 상당히 새로운 것이라고 말함으로써 시작하겠습니다. 나는 판다 데이터 프레임을 만들려고 노력하고 있지만 적절한 방법으로 일을하고 있는지 확신 할 수 없습니다. 필자가 설정 한 .Net 개체의 목록이 매우 커서 (그리고 제어 할 수있는 권한이 거의 없음) 팬더 데이터 프레임을 사용하여 시계열을 만들고 싶습니다. 데모 용으로 단
나는 raw_df라는 데이터 프레임을 가지고 있습니다. 첫 번째 열이 E01, E02, ... E14 인 행이 필요합니다. 수동으로 입력하지 않고도이를 생성 할 수있는 목록 이해력 (또는 다른 방법)을 작성하려면 어떻게해야합니까? row_data = raw_df.loc[
(raw_df.col0=='E01') | (raw_df.col0=='E0
최대 값을 찾기 위해 코드를 작성했습니다. 이제는 .iloc [] 함수를 사용하여 데이터 프레임의 다른 위치에 저장하려고합니다. 그것의 dtype이 시리즈이기 때문에 나는 그것을 할 수 없다. 시리즈를 실수 값으로 변환하는 방법? 코드 : master = pd.read_csv("new.csv")
a = master.iloc[:, 154:181].max(a
타임 스탬프 작업과 동시에 Python으로 NaT를 확인하려면 어떻게해야합니까? 예 : 변수 _date이 될 수 있습니다 NaT 또는 나는이 사용하는 경우 Timestamp('2017-12-02 00:00:00') : np.isnat(np.datetime64(_date)), 그것은 Timestamp('2017-12-02 00:00:00') 작동하지만 NaT
멀티 인덱스 데이터 프레임에서 값을 설정하려고합니다. .loc을 사용하고 있지만 여전히 SettingsWithCopyWarning을 얻고 있습니다. 설명서를 읽었지만 어떻게해야하는지 잘 모르겠습니다. 내가 도대체 뭘 잘못하고있는 겁니까? "SettingWithCopyWarning :. 값이 DataFrame에서 슬라이스의 카피에 설정하려고 [row_in