DSL 회선의 인터넷 세션에 대한 데이터를 분석해야합니다. 세션 기간이 어떻게 분포되어 있는지 살펴보고 싶었습니다. 나는 이것을하기위한 간단한 방법이 모든 세션의 지속 시간에 대한 확률 밀도 도표를 작성하는 것으로 시작한다고 생각했습니다. 데이터를 R에로드하고 density() 함수를 사용했습니다. 그래서 이런 식이었습니다 plot(density(data$
저는 "데이터 분석"(아마도 지나치게 광범위한 용어)의 엔지니어링 측면에 대해 더 많은 것을 배우고 자하는 수학/통계 담당자입니다. 그러나 이것은 분명히 "나는 내가 모르는 것을 모른다", 그래서 나는 더 구체적인 방법을 모름). 일단 데이터가 이미 어딘가에 저장되고 액세스 할 수 있으면 조작하고 분석하는 것이 좋습니다. 스크립트 및 SQL 쿼리를 작성하고
나는 가속도계 데이터 (android phone, btw에서 추출한 기능)를 추출하는 데 도움이되는 라이브러리/알고리즘/기법 (파이썬, 가능한 모든 경우)이 있는지 알고 싶습니다. , 가속 에너지 등을들 수있다. 누구든지 전에 이런 종류의 작업을 했습니까? 사전 : 나는 안드로이드에 대해 알고 있지만, 많은 작업이 파이썬/Symbain 가속도계 물건에 완료
솔리드 스테이트 드라이브에 저장된 데이터와 함께 r/python을 사용한 경험이있는 사람이 있습니까? 이론적으로는 대부분 읽기 작업을 수행하는 경우 큰 데이터 세트의로드 시간을 크게 향상시켜야합니다. 나는 이것이 진실인지, 그리고 데이터 집약적 인 어플리케이션에서 입출력 률 (IO rate)을 개선하기 위해 SSD에 투자할만한 가치가 있는지 알아보고자합니다
다차원 데이터 세트에 대한 k-means 구현을 테스트하려면 어떻게해야합니까? 데이터에서 기존 구현 (예 : Matlab)을 실행하고 알고리즘과 결과를 비교하려고합니다. 그러나 이렇게하려면 두 알고리즘이 대략 비슷하게 작동해야하며 두 결과 간의 매핑은 아마도 케이크 조각이 아닙니다. 더 좋은 아이디어가 있습니까?
문제 제약 데이터 세트의 크기가 아닌 데이터 자체는 공지되어있다. 데이터 세트는 한 번에 하나의 데이터 포인트만큼 증가합니다. 트렌드 라인은 한 번에 하나의 데이터 포인트로 그래프 화됩니다 (스플라인/베 지어 곡선 사용). 그래프 아래 합성 합리적으로 정확한 트렌드 라인 데이터 세트를 보여준다 그래프이다 : 가 좌상. 시간당 ~ 24 데이터 포인트. 오른쪽
이 3D bar graph sample code이 주어지면 x 축의 숫자 데이터를 형식이 지정된 날짜/시간 문자열로 변환하는 방법은 무엇입니까? 나는 성공없이 ax.xaxis_date() 함수를 사용하려고 시도했다. 나는 또한 3D 막대 그래프에 대해 작동하지 않는 plot_date()를 사용하여 시도했다. 다음은 샘플 코드의 수정 된 버전은 내가 뭘하려고
지금 당장 무엇을하고 있는지 전혀 모르므로 내 말씨는 재미있을 것입니다. 그러나 진지하게, 나는 배울 필요가있다. 제가 직면 한 문제는 소프트웨어 프로그램이 작동하는 방식, 즉 실행 시간과 최대 메모리 사용량을 추정하는 방법 (모델)을 제시하는 것입니다. 이미 가지고있는 것은 많은 양의 데이터입니다. 이 데이터 세트는 다양한 조건에서 프로그램이 작동하는 방
안녕하세요, 저는 웹 서비스에서 DataTable을 생성 중입니다. 전체 DataTable을 하나의 데이터베이스 테이블에 저장하고 싶습니다. DataTable ds = //get info from webservice
가 생성지고 DataTable을하지만 내가 어떤 syntax.I 중 하나가 선택 문을 필요로 정말 해달라고 .Show .I 난 그냥에서 모
SPSS에서 파트너 선택의 결정 요인에 대한 분석을 준비하고 있지만 기본적으로 새로운 변수를 만드는 방법을 모르기 때문에 기본적으로 벗어날 수는 없습니다. (즉, 교육, 임금, 사회적 배경, 민족성 등)에 대한 정보를 제공해야합니다. 각 응답자는 현재 ID #에 의해 식별되며 매트릭스에 두 곳으로 존재합니다. 단위/응답자와 배우자 (아내 또는 남편)로 다른