이것은 문제 이상의 아이디어이므로 분명한 질문을 쓸 수 있기를 바랍니다. 나는 일상적인 작업에서 여러 데이터를 생성하는 웹 응용 프로그램에서 작업하고 있습니다. 그 특성은 여기에서 중요하지 않습니다. 응용 프로그램에서 이러한 데이터를 관리자에게 보여줘야하므로 분석 섹션이나 그와 비슷한 것이 필요할 것이고, 실제로 사용 가능한 것을 함께 묶는 것은 그리 어렵
yt에서 파생 필드 중 하나에 숫자 바닥을 추가하려고합니다. 그러나, 나는 시도 : new_field = 1.0E-10 + 데이터를 [ 'metal_density'] 나는 다음과 같은 오류 얻을 :만큼 당신이 조심 당신이 추가 스칼라이라고 In [1]: ad = ds.all_data()
In [2]: floored_density = 1.0e-10 + a
추적 할 항목이 20,000 개 있습니다. 이름, 높이, 가중치, 배정 된 ID 및 비용은 모두 동일한 속성을가집니다 (이는 단지 예일뿐입니다). 이름이나 할당 된 ID와 같은 특정 속성은 절대 변경되지 않습니다. 다른 속성은 어떤 경우에는 빠르게 (시간당 5-10 회), 다른 경우에는 드물게 (일주일에 한두 달에 1-2 회) 바뀝니다. 데이터베이스의 모든
나는 두 개의 팬더 데이터 프레임 A와 B를 가지고 있는데, 열 수는 같고 행 수는 같지 않습니다. ['start', 'end', 'value']입니다. B의 복수 행의 가능성이있다 A.iloc(i) = B['value'][B['start'] < A[i,'start'] & B['end'] > A[i,'end']]
각 I이 조건을 만족하는 경우, 최대 또
반환하는 큰 DataFrame의 많은 컬럼에 함수를 적용 : 내 경우 pandas: apply function to DataFrame that can return multiple rows 을, 나는 이런 식으로 뭔가를 가지고 있지만, 더 큰 : df = pd.DataFrame({'Restaurants': ['A', 'B', 'C'],
'T
데이터 세트를 이산화하기 위해 pd.cut을 사용하고 있습니다. 모든 것이 훌륭하게 작동합니다. 그러나 내가 가지고있는 질문은 에 의해 반환 된 데이터 형식 인 Categorical 개체 유형입니다. 문서에서는 Categorical 개체가 문자열 배열처럼 취급되므로 그룹화 할 때 레이블이 어휘 적으로 정렬되는 것을보고 놀라지 않습니다. 예를 들어 , 다음
데이터 (비 구조적) 분석에 BiqQuery를 사용하는 아이디어를 고민하고 있습니다. 테라 바이트 이상의 데이터에 대해 임시 쿼리를 실행할 수 있다는 것이 BigQuery의 가장 큰 장점 중 하나임을 알고 있습니다. 어떻게 구조화되지 않은 데이터를 처리 할 수 있습니까? BigQuery를 이해함에 따라 관계형으로 표시된 데이터에서 작동하며 BigQuer
좋은 오후의 사람을 파괴 점을 확인하는 방법 나는이 새로운 질문이, 나는 다시 나를 도울 수 있기를 바랍니다 : 난 당신이 다음 링크에서 찾을 수있는 벡터를 가지고 : 당신이 볼 수 있듯이 : https://drive.google.com/file/d/0B4WGV21GqSL5Y09GU240N3F1YkU/edit?usp=sharing 이 벡터는이 같은 모습을
나는 팬더와 파이썬에서 새롭다. 내 데이터 세트에 대한 공통 단어를 찾고 싶습니다. 예를 들어 나는 회사 목록 [ "Microsoft.com", "Microsoft", "Microsoft com", "apple"...] 등을 가지고 있습니다. 이러한 회사의 1M 목록을 가지고 있으며 그들 사이의 상관 관계를 계산하려고합니다. 예를 들어 Microsoft.c