모든 길이가 다른 CSV 파일이 있습니다. 그러나, 나는 초당 10x 샘플을 가지고있는 진실 파일을 가지고 있지만, 기록되는 데이터는 두 번째 경계에서 초당 한 번 기록됩니다. 이 두 번째 경계를 일치시켜 테스트 자동화에 대한 오류를 비교하려고합니다. 다음은 내 CSV 파일의 예입니다.numpy를 사용하여 서로 다른 크기의 두 배열 사이의 오류를 비교하고 찾음
진실 파일
0, 1
0.1, 2
0.2, 3
.
.
.
x, n
측정 파일
0, 1.01
1, 9.99
3, 30.05
.
.
.
x, n
내 측정 결과를 각 데이터 풀에 진실 파일에 대한 데이터 세트에서 당겨, 나는 빠른 비교를 위해 노력하고 있어요 상기 측정 된 파일 내의 데이터 값과 연관된 시간 값이 상기 진리 파일에서의 동일한 시간 값 사이의 오차 한계 내에 있는지를 판정하는 단계를 더 포함하는 방법. 데이터 변경을 샘플링 할 때마다 for 루프를 사용하여 배열을 검색 할 필요없이 값 중 하나가 동등한 지 여부를 배열에서 얼마나 정확하게 검색 할 수 있습니까?
, 그래서 사소한'data_timestamps'가 필요합니다. –
@AndrasDeak 진실 시간은 완전해야합니다. 이것들은 그들이 제안하는 방식으로 표현됩니다. 'truth_data [data_timestamps]'는 데이터와 일치하는 올바른 참조 값을 선택합니다. 간단한 예제 : 데시 메이트 된 진리 시간 0,1,2,3, ... 데이터 타임 스탬프 0,1,3 다음 위치 0,1,3의 데시 메이트 된 진리 데이터가 선택됩니다. Q는 데이터 시간이 초 단위라고 명시합니다. 그리고 마지막으로, 나는 분명히 매우 피상적으로 진실의 시대의 사건을 어떻게 규칙적이고 완전하지 않게 다루는 지 언급한다. –
@PaulPanzer 이것은 내가 비교할 다른 데이터 세트를 가지고 있다는 점을 제외하면 좋을 것입니다. 초당 10 번 기록됩니다. 따라서이 진리 값을 무시할 수는 없습니다. 내 측정 된 데이터 파일의 위치를 해당 진리 값과 동시에 비교하는 방법을 찾고 있습니다. 내 다른 데이터 파일은이 빠른 속도로 기록되며 소프트웨어 결함으로 시간이 지날수록 건너 뛰기 때문에 단순히 증분을 사용하여 비교할 수 없습니다. – nichollsg