data-analysis

1열

1답변

이것은 문제 이상의 아이디어이므로 분명한 질문을 쓸 수 있기를 바랍니다. 나는 일상적인 작업에서 여러 데이터를 생성하는 웹 응용 프로그램에서 작업하고 있습니다. 그 특성은 여기에서 중요하지 않습니다. 응용 프로그램에서 이러한 데이터를 관리자에게 보여줘야하므로 분석 섹션이나 그와 비슷한 것이 필요할 것이고, 실제로 사용 가능한 것을 함께 묶는 것은 그리 어렵

2열

1답변

yt 배열에 스칼라 값을 어떻게 추가합니까?

yt에서 파생 필드 중 하나에 숫자 바닥을 추가하려고합니다. 그러나, 나는 시도 : new_field = 1.0E-10 + 데이터를 [ 'metal_density'] 나는 다음과 같은 오류 얻을 :만큼 당신이 조심 당신이 추가 스칼라이라고 In [1]: ad = ds.all_data() In [2]: floored_density = 1.0e-10 + a

0열

1답변

데이터베이스에서 20,000 개의 항목에 대한 데이터 변경 저장 방법

추적 할 항목이 20,000 개 있습니다. 이름, 높이, 가중치, 배정 된 ID 및 비용은 모두 동일한 속성을가집니다 (이는 단지 예일뿐입니다). 이름이나 할당 된 ID와 같은 특정 속성은 절대 변경되지 않습니다. 다른 속성은 어떤 경우에는 빠르게 (시간당 5-10 회), 다른 경우에는 드물게 (일주일에 한두 달에 1-2 회) 바뀝니다. 데이터베이스의 모든

1열

1답변

팬더에서 겹치는 세그먼트 찾기

나는 두 개의 팬더 데이터 프레임 A와 B를 가지고 있는데, 열 수는 같고 행 수는 같지 않습니다. ['start', 'end', 'value']입니다. B의 복수 행의 가능성이있다 A.iloc(i) = B['value'][B['start'] < A[i,'start'] & B['end'] > A[i,'end']] 각 I이 조건을 만족하는 경우, 최대 또

0열

1답변

팬더 :이 대답에서에서 아이디어를 복용 여러 행

반환하는 큰 DataFrame의 많은 컬럼에 함수를 적용 : 내 경우 pandas: apply function to DataFrame that can return multiple rows 을, 나는 이런 식으로 뭔가를 가지고 있지만, 더 큰 : df = pd.DataFrame({'Restaurants': ['A', 'B', 'C'], 'T

4열

3답변

groupby 이후 팬더 정렬 카테고리 라벨

데이터 세트를 이산화하기 위해 pd.cut을 사용하고 있습니다. 모든 것이 훌륭하게 작동합니다. 그러나 내가 가지고있는 질문은 에 의해 반환 된 데이터 형식 인 Categorical 개체 유형입니다. 문서에서는 Categorical 개체가 문자열 배열처럼 취급되므로 그룹화 할 때 레이블이 어휘 적으로 정렬되는 것을보고 놀라지 않습니다. 예를 들어 , 다음

1열

1답변

구조화되지 않은 데이터를위한 BigQuery

데이터 (비 구조적) 분석에 BiqQuery를 사용하는 아이디어를 고민하고 있습니다. 테라 바이트 이상의 데이터에 대해 임시 쿼리를 실행할 수 있다는 것이 BigQuery의 가장 큰 장점 중 하나임을 알고 있습니다. 어떻게 구조화되지 않은 데이터를 처리 할 수 있습니까? BigQuery를 이해함에 따라 관계형으로 표시된 데이터에서 작동하며 BigQuer

6열

1답변

MATLAB에서 숫자 배열에

좋은 오후의 사람을 파괴 점을 확인하는 방법 나는이 새로운 질문이, 나는 다시 나를 도울 수 있기를 바랍니다 : 난 당신이 다음 링크에서 찾을 수있는 벡터를 가지고 : 당신이 볼 수 있듯이 : https://drive.google.com/file/d/0B4WGV21GqSL5Y09GU240N3F1YkU/edit?usp=sharing 이 벡터는이 같은 모습을

0열

1답변

팬더 : 단어에 대한 매트릭스 교정

나는 팬더와 파이썬에서 새롭다. 내 데이터 세트에 대한 공통 단어를 찾고 싶습니다. 예를 들어 나는 회사 목록 [ "Microsoft.com", "Microsoft", "Microsoft com", "apple"...] 등을 가지고 있습니다. 이러한 회사의 1M 목록을 가지고 있으며 그들 사이의 상관 관계를 계산하려고합니다. 예를 들어 Microsoft.c

0열

1답변

팬더 : 한 열에서 값을 기준으로 계산 된 열

나는 (내가 read_csv('fileA.csv', parse_dates=['ProcessA_Timestamp'])를 사용하여로드) Item ProcessA_Timestamp 'A' 2014-06-08 03:32:20 'B' 2014-06-08 03:32:20 'A' 2014-06-08 03:33:19 'C' 2014-06-08 03:33:20 '