2

일반적으로 기계 학습 시스템이 잘 작동합니다. 그러나 훈련 된 기계 학습 시스템에 문제가있을 때 (예를 들어, 기계 학습 시스템이 무작위로 수행하는 경우 ...)이 훌륭한 "추측 게임"이 시작됩니다. "추측 게임"으로, 나는 나의 경험을 언급한다. 저에게는 디버깅 기계 학습 시스템이 방법 론적 방법보다는 문제를 추측하여 가장 자주 수행되는 것 같습니다.디버깅하기 쉬운 기계 학습 시스템이 있습니까?

기계 학습 시스템이 실패 할 수있는 수많은 이유가 있기 때문에 실제 버그를 찾는 데 꽤 많은 시간이 걸릴 수 있습니다.

  • 대표성/너무 많은 기능 오류에게 신경 네트워크들에서, 예를 들면
  • 조잡 훈련 (함유

    • 바이어스 트레이닝 세트
    • 충분한 트레이닝 데이터
    • 셋 : 예를 들어, 버그 기인하는 것일 수있다 , 훈련 데이터가 무작위로 제시되지 않은 경우)
    • ...

    디버깅하기 쉬운 기계 학습 시스템이 있습니까? (그리고 어떻게 디버깅을 할 수 있습니까?)

    기계 학습 시스템을 디버깅하는 방법을 잘 알고 있습니까?

  • 답변

    0

    "디버깅"이라고하는 것을 기계 학습 커뮤니티에서 최적화라고합니다. 분류기와 문제에 따라 분류기를 최적화하는 방법이 있지만이를위한 표준 방법은 없습니다. 예를 들어, 텍스트 분류 문제에서 특정 기능으로 분류자를 학습하면 분류 기준의 성능이 향상된다는 것을 실험을 통해 알 수 있습니다. 분류 자의 분류 정확도를 높이는 특징 조합을 선택하는 방법이 있습니다. 이러한 방법 중 일부는 유전 알고리즘을 사용하여 최상의 기능 조합을 찾는 것을 포함합니다. 당신이 배울 수있는 한 가지 방법은 순차적 피쳐 선택입니다. 또한 그러한 주제에 대한 많은 논문이 유용 할 수 있습니다. 또한 더 나은 분류 결과를 얻기 위해 분류 기능 구현에서 분류 기능이나 다른 계산을 변경하는 연구가 있습니다.

    그런데 부정 행위로 간주되어 피해야하는 분류 기준을 최적화하는 몇 가지 방법이 있습니다 (일반적으로 분류 기준이 단일 데이터 세트 또는 매우 유사한 데이터 세트에서만 문제를 해결하도록 최적화 된 경우 및 이전에는 볼 수 없었던 다른 데이터 세트에는 포함되지 않음).