0

나는 웹 페이지의 주어진 스냅 샷에서 텍스트 상자, 라디오 버튼, 버튼 및 드롭 다운 목록과 같은 다양한 HTML 객체를 감지하기 위해 신경망을 훈련시키려는 문제에 대해 작업 중이다. 트레이닝을 위해 1500 개의 이미지 (트레이닝 세트)에서 슬라이드 창 작업으로 생성 된 패치를 내 CNN에 제공하고 있습니다. 레이블 세트는 5 개의 클래스 클래스 (예 : 클래스 0, 다른 오브젝트 영역 클래스 1,2, .. 4로 분류됩니다.caffe를 사용하여 웹 페이지의 스크린 샷에서 HTML 객체 (포 그라운드)와 백그라운드를 구별하기 위해 CNN을 훈련시키는 방법은 무엇입니까?

Caffe를 사용하여이 훈련 데이터 세트에 Con-Decon Architecture를 적용 해 보았습니다. 그러나 IMHO에서 발생하는 문제는 슬라이딩 창 교육에서 대부분의 지역이 배경이기 때문에 실제 출력에서 ​​클래스 0을 향한 강한 편향이 있다는 것입니다. 따라서 실제 출력의 모든 픽셀을 백그라운드 0 인 클래스 0으로 분류하고 네트워크에 제공 한 테스트 이미지에서 클래스 레이블 1,2, .. 4의 다른 HTML 객체를 감지 할 수 없습니다.

이 문제를 해결하는 방법은 무엇입니까?

+0

클래스 0을 선택하면 손실 함수를 페널티 킥 시도 할 수 있습니다. 또는 훈련 데이터의 균형을 잡으십시오. – gidim

+0

훈련 용 패치 세트 2 개를 만들었습니다. 즉, 첫 번째 세트에는 적어도 하나의 html 오브젝트가있는 패치 만 포함되어 있습니다. 두 번째 세트에는 어떤 오브젝트도 들어 있지 않은 패치가 들어 있습니다. 트레이닝을 위해 처음으로 설정된 모든 패치를 제공하지만 네트워크에 오브젝트가없는 패치의 수를 제한하기 위해 트레이닝을 위해 두 번째 세트의 5 % 만 제공합니다. 그러나이 접근법은 모델 개선에 많은 도움이되지 못했습니다. – shripati007

+0

불균형 데이터 세트를 다루고 있습니다.이 답변에서 도움이되는 몇 가지 전략이 있습니다. http://stats.stackexchange.com/questions/193887/classification-with-a-neural-network-when-one-class -has-disproportionately-many – 7VoltCrayon

답변

0

이 문제는 많은 실제 데이터 집합에서도 나타납니다.

해결 방법 중 하나는 배경 데이터를 표시하는 것보다 배경이 아닌 데이터 (클래스 1,2,3 ...)를 신경망에 더 많이 표시하는 것입니다. 이것은 샘플 수가 적은 데이터를 인위적으로 복제하여 수행 할 수 있습니다.

+0

정보를 제공해 주셔서 감사합니다! 매우 감사. – shripati007

0

님도 설정할 수 있습니다 : 도움이 될 그

ignore_label: 0 

.

+0

나는이 방법을 시도하고 점검 할 것이다. 고맙습니다. – shripati007

+0

작동 했습니까? @ shripati007 – thigi