완전 컨벌루션 네트워크를 위해 데이터 세트를 준비하려고합니다. 일부 데이터 세트를 살펴본 결과 형식을 지정하는 방법을 파악하는 데 어려움을 겪고 있습니다.완전 컨벌루션 네트워크의 데이터 세트를 포맷하는 방법은 무엇입니까?
텍스트 : 예를 들어, Kitti 데이터 세트에서 교육 폴더에서 이러한 2 개 이미지와이 텍스트 파일이 있습니다
P0 : 7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 0.000000000000e + 00 0.000000000000e + 00 7.215377000000e +02 1.728540000000e + 02 0.000000000000e + 00 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 0.000000000000e + 00 P1 : 7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 -3.875744000000e + 02 0.000000000000e + 00 7.215377000000e + 02 1.728540000000e + 02 0.000000000000e + 00 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 0.000000000000e + 00 P2 : 7.215377000000e + 02 0.000000000000e + 00 6.095593000000e +02 4.485728000000e + 01 0.000000000000e + 00 7.215377000000e + 02 1.728540000000e + 02 2.163791000000e-01 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 2.745884000000e- 03 P3 : 7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 -3.395242000000e + 02 0.000000000000e + 00 7.215377000000e + 02 1.728540000000e + 02 2.199936000000e + 00 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 1.000000000000e + 00 - 03 2.729905000000e R0_rect : 9.999239000000e 9.837760000000e - 01 - 03 - 03 -7.445048000000e -9.869795000000e 9.999421000000e - 03 - 01 - 03 -4.278459000000e 7.402527000000e 4.351614000000e - 03 - 03 - 01 9.999631000000e Tr_velo_to_cam : 7.533745000000e-03 -9.999714000000e-01 -6.166020000000e-04 -4.069766000000e-03 1.480249000000e-02 7.280733000000e-04 -9.998902000000e-01 -7.631618000000e-02 9.998621000000e-01 7.523790000000e-03 1.480755000000e-02 - 2.717806000000e-01 Tr_imu_to_velo : 9.999976000000e-01 7.553071000000e-04 -2.035826000000e-03 -8.086759000000e-01 -7.854027000000e-04 9.998898000000e-01 -1.482298000000e-02 3.195559000000e-01 2.024406000000e-03 1.482454000000e- 02 9.998881000000e-01 -7.997231000000e-01 Tr_cam_to_road : 9.999570839814e-01 -5.508724949246e-03 -7.452906591504e-03 9.610489538319e-03 5.425697507328e-03 9.999234779341e-01 -1.111504746388e-02 -1.597134401910e 00의 7.513565886504e-03 1.107413060494e-02 9.999104059534e-01 2.788606298060e-01
이 데이터 세트는 내가 CNNs에 사용되는 본 적이 정규 데이터 세트는 매우 다르다. 따라서 다음 질문을했습니다.
- 텍스트 파일에는 어떤 현상이 있습니까?
- 단색 픽셀로 두 번째 이미지를 생성하는 방법은 무엇입니까?
- FCN의 제안 된 장점 중 하나는 임의의 크기의 입력 이미지를 공급할 수 있다는 것입니다. 입력 이미지를 얼마나 작게 만들 수 있습니까? 50x50이 너무 작습니까? 나는 이것을 둘러싼 몇 가지 문헌을 찾았지만 많이 찾을 수 없었다.
기본적으로이 데이터를 사용하여이 network from this github을 만들려고합니다. 트레이닝을위한 폴더는 두 개뿐입니다 : training_img_lmdb
및 training_label_lmdb
. 따라서 텍스트 파일 또는 픽셀 화 된 이미지가 레이블 폴더에 있는지 확실하지 않습니다. 어떤 도움이라도 대단히 감사 할 것입니다 !!