0
.xls 파일의 일부 데이터 처리를 자동화하고 싶습니다. 데이터 형식은 소스에 따라 다릅니다.약간 다른 형식으로 데이터를 처리하는 방법은 무엇입니까?
데이터의 수동 처리는이 형식으로 파일 출력 :
ID (번호) | NAME (문자열) | PRICE (플로트)
I는 정보가 일반적으로 상기 된 바와 같이 열에 있지만 행에있을 수 있거나 하나만 처리해야하는 두 개의 테이블이있을 수 있습니다. 전략 패턴을 사용
- : 나는 세 가지 방법을 고려했다. 단점 : 어쨌든 각 사례를 코드화해야합니다.
- ETL 도구 사용. 단점 : 나는 그것이 내가 필요로하는 것 이상이라고 생각한다.
- 선형 회귀 또는 신경망 또는 다른 기계 학습 알고리즘을 사용하여 예제가 쌍 (.xls 원시 파일, .xls 처리 파일)이됩니다. 단점 : 목적 함수에 대한 측정 항목이 무엇인지 알지 못합니다 (두 Excel 파일 간의 유사점은 무엇입니까?)
도움이나 도움을 주셔서 감사합니다!
너무 구체적이지 않은 질문입니다. 경험이 부족한 프로그래머가 아니라는 점은 분명합니다. 그러나 가능한 다양한 입력 형식에 대해 자세히 설명하지는 않습니다. (3 ~ 300 ?) "최상의"전략을 제안하는 것은 어려울 것입니다. –
다른 포맷의 수는 약 70 개입니다. 어쨌든 대부분이 꽤 비슷하기 때문에 전략 패턴을 사용하는 것 또는 각 포맷을 처리하는 메소드가있는 클래스가 가장 적절하다고 생각하는 것입니다. – MithPaul