1

나는 어떤 종류의 객체 모델을 가지고 있으며, 그것을 필터링하고 어떤 종류의 속성을위한 노드로 정렬해야합니다. 어떤 종류의 자동화 된 시스템이 존재하고 내가 원하는 것과 상관 관계가있는 객체 모델의 속성을 생성하고 선택 하는가? (나는 추상적이고 비특이적이다.)개체 모델 노드를 필터링/정렬/순위 지정하는 방법은 무엇입니까?

예를 들어 주어진 데이터 세트에서 관심있는 노드를 찾는 규칙을 지정하면 스팸 필터 나 감독 된 분류 시스템처럼 작동하는 시스템을 생각하고있다. 그러나 개체 모델에 대한 디자인 타임 정보가 필요하지 않아야한다는 점에서 좀 더 일반적인 시스템을 찾고 있습니다. 전자 메일의 스팸 필터, 코드 기반의 버그 파인더, 뉴스 그룹의 관심 필터 또는 소셜 네트워킹 사이트의 봇 계정 찾기와 마찬가지로 평등을 유지해야합니다. 리플렉션을 통해 객체 모델을 탐색 할 수 있고 "흥미로운"노드 집합을 제공 할 수 있다면 더 많은 노드를 찾을 수있는 규칙을 찾을 수 있어야합니다.

+1

BTW : 좋은 해결책이없는 경우 전혀 놀라지 않을 것입니다. – BCS

답변

1

당신이 요구하는 모든 것을 할 수있는 하나의 자동 분류 시스템이있을 것 같지 않습니다. 또한 버그 검색 응용 프로그램은 해당 도메인에서 성공적으로 사용되는 방법이 구문 분석, 데이터 흐름 분석 및 소프트웨어 오류를 둘러싼 문제에 맞게 조정 된 기타 알고리즘 방법을 중심으로 이루어지기 때문에 그러한 시스템의 범위 밖에 있다고 생각합니다. 기계 학습에 대한 연구가 이루어지고 있지만,이 영역의 분류 체계는 분석 방법을 대체하기보다는 오히려 보급에 사용되고 있습니다 (지금까지 내가 아는 한).

대부분의 중요하지 않은 분류 문제의 경우 기계 학습을 통해 유용하고 효과적인 결과를 얻으려면 일반적으로 문제 표현을 신중하게 선택하고 세분화해야합니다. 상태 공간의 일종의 맞춤형 변환없이 기존의 "원시"데이터 객체 모델을 사용하는 것만으로는 입력 데이터 값의 분포가 불완전하게 커버되거나 학습 된 분류기가 일반화되지 못하는 경향이 있습니다. 또한 사용중인 기계 학습 방법과 관련된 다른 매개 변수는 주어진 문제에 대한 적절한 결과를 얻기 위해 시행 착오를 조정해야 할 수도 있습니다. 모든 방법이 그런 매개 변수를 가지고있는 것은 아니지만 신경망, 유전 알고리즘, 베이지안 추론 방법 등과 같이 많은 것들이 있습니다.

당신이 원하는 것은 거의 보편적 인 기계 학습 방법입니다. 이것은 현재 존재하지 않습니다. 내가 볼 수있는 가장 유력한 대안은 (1) 요구되는 역량/정교함 수준이 아닌 여러 문제의 하위 집합을 찾거나 (2) 하나의 분류 기법을 사용하는 것이 아니라 오히려 하나의 분류 기법을 사용하는 시스템을 만드는 것입니다. 주어진 문제에 대해 자동으로 테스트 한 다음 감독 학습 체제 하에서 최상의 분류 결과를 생성하는 도구 상자를 사용하는 다른 방법의 도구 상자가 있습니다. 후자는 여전히 효과적으로 벗어나기에 여전히 도전 과제이며, 데이터 모델의 상태 공간을 표현/변환하는 방법의 문제를 제거하지는 못합니다.

+0

마지막 문장의 "데이터 모델의 상태 공간을 표현/변환하는 방법"의 마지막 부분. 실제로 솔루션에 대해 궁금해하는 문제를 정확히 설명합니다. – BCS

+0

상태 공간 모델 문제에 대한 한 가지 가능성은 "도구 상자"개념을 확장하고 다양한 테스트를 자동으로 테스트하는 것입니다. 여기에는 (1) 어떤 변형 (이산 가치 또는 텍스트 데이터의 일부 유형에 대해서는 정상적으로 작동 할 수 있음), (2) 자연 언어에 대한 개념적 클러스터 또는 온톨로지, (3) 수치 데이터에 대한 거친 코딩 표현 등이 포함될 수 있습니다. 또한 패턴을보다 쉽게 ​​익히기위한 유용한 방법으로 상태 공간을 분할 할 수있는 적절한 기회를 제공하지만 더 많은 맞춤형 접근 방식의 기능이 부족한 일반적인 계획이 될 것입니다. –