치수 46 * 46 * 3 (채널 길이 x 높이 x 없음)의 2D 이미지를 고려하십시오. 이것은 이미지가 지정된 길이와 높이의 세 가지 채널, 즉 빨간색, 파란색 & 녹색을 의미합니다.컴퓨터 비전에서 여러 채널을 사용하는 2 차원 이미지의 직감을 설명하십시오.
다음 20 x 20 * 32 크기의 이미지가 나타납니다. 32 개의 채널을 갖는 것은 무엇을 의미합니까? 32 색 32 색을 표현한 이미지라고하면 맞습니까?
치수 46 * 46 * 3 (채널 길이 x 높이 x 없음)의 2D 이미지를 고려하십시오. 이것은 이미지가 지정된 길이와 높이의 세 가지 채널, 즉 빨간색, 파란색 & 녹색을 의미합니다.컴퓨터 비전에서 여러 채널을 사용하는 2 차원 이미지의 직감을 설명하십시오.
다음 20 x 20 * 32 크기의 이미지가 나타납니다. 32 개의 채널을 갖는 것은 무엇을 의미합니까? 32 색 32 색을 표현한 이미지라고하면 맞습니까?
올바른 길을 가고 있습니다. 일반적으로 RGB를 나타내는 세 개의 채널이 표시됩니다. 그러나 4 채널을 가질 수 있으므로 알파 용 RGBa를 하나 추가하십시오. 알파 숫자는 특정 픽셀이 다른 이미지와 레이어로 결합 될 때 얼마나 투명하게 보이는지 나타냅니다.
위성 센서로 수집 한 이미지에는 픽셀 당 수백 개의 채널이 포함될 수 있으며 각 채널은 해당 센서에서 수집 한 특수 품질을 나타내는 숫자입니다. 채널은 픽셀의 높이, 공간에서 보았을 때의 온도 또는 인간의 눈에 보이지 않는 다양한 스펙트럼 밴드에서 볼 수있는 반사율을 코딩 할 수 있습니다. 컴퓨터 모니터는 각 픽셀에 RGB 요소가 3 개만 있기 때문에 이러한 다중 채널 이미지를 표시하려면 표시를 위해 많은 채널을 단 3 개로 매핑하는 소프트웨어가 필요합니다. 이러한 다중 채널 이미지는 하나 이상의 채널 값을 특정 범위의 RGB 값으로 매핑하는 "거짓 색상"기술을 사용하여 종종 표시됩니다. http://www.georeference.org/doc/images_and_channels.htm
랜달의 대답은 일반적으로 몇 가지 채널이 빨강, 녹색, 파랑, 깊이 등의 정보를 나타내는 일반적인 이미지, 투명성 사실이지만 :이 대답은 체크 아웃 어디서 얻었 자세한 정보는 어디에서 들어
은 찾을 수 , 온도 등과 같이 멀티 채널 이미지의 또 다른 매우 일반적인 사용은 단순히 단일 데이터 구조에서 많은 이미지를 갖는 것입니다.따라서 20x20x32 크기의 "이미지"에서는 32 개의 20x20 크기의 이미지를 저장할 수 있습니다. 특히 태그를 지정한 CNN에는 동일한 크기의 많은 작은 이미지가 여러 개있는 레이어가 있습니다.
또 다른 일반적인 사용은 현미경에서 소위 이미지 스택 또는 서로 다른 높이에서 촬영 한 여러 이미지를 저장할 일부 3D 영상 기술이다.
컨볼 루션 레이어 (예 : 45 2 * 2 * 32 필터, 동일한 패딩)를 통과 한 후 20 * 20 * 32의 이미지가있는 경우 새 크기는 20 * 20 * 45입니다. 따라서이 45는 20 * 20 차원의 45 개의 작은 이미지를 포함합니까? 입력 이미지에서 32는 무엇을 나타 냅니까? 세 번째 차원이 나타내는 것을 지정해야합니까? 예를 들어, 색상이나 작은 이미지는 무엇입니까? – RPM
CNN의 입력으로 32 채널 이미지가있는 예제를 보여줄 수 있습니까? 32x20x32 이미지에서 32 채널이 나타내는 것을 말해 줄 수있는 유일한 사람은 그것을 만든 사람입니다. 색상이 나에게 어떤 의미가되지 않을 것입니다. – Piglet
당신이 말했듯이, 그것은 입력 이미지가 아닙니다 (MOOC를 추구하고 있습니다). 이 치수 (32)는 필터를 적용한 후에 나타납니다. conv 필터를 적용한 후 28 * 28 * 192와 같은 출력을 이해하는 방법을 궁금합니다. 같은 종류의 작은 이미지가 192 개나있을 것입니다. 이 192 이미지 각각에 하나의 학습 된 기능이있는 것입니까? 미안해, 내 질문에 어리 석다. – RPM
그 링크에는 지금 필요한 모든 정보가 있습니다. 도움이되었습니다. – RPM