답변

3

기능에 대해 아는 경우 자주 배우는 대신이 정보를 사용하는 것이 유용합니다.

예를 들어 신호 에너지 만이 음성 인식에 중요하며 신호 위상은 중요하지 않다는 것이 알려져 있습니다. 그래서 일반 신호와 비교하여 스펙트로 그램을 사용하는 것이 중요하므로 중요한 정보를 사용하고 중요하지 않은 것은 아닙니다. 에너지 계산은 사각형을 필요로하며 단일 레이어로 배우기가 쉽지 않습니다. 여러 레이어가 필요하거나 특별한 비선형 성이 필요합니다.

실제로 더 나아가 log-filterbank를 사용하는 것이 더 좋으며, 동일한 예측 품질로 더욱 컴팩트 한 피쳐를 생성합니다.

위상이 중요한 경우가 있습니다. 그 중 하나는 DIET 알고리즘과 같은 단계 정보를 기반으로 소스를 분리 할 수있는 혼합 소스를 인식하는 경우입니다. 그러나 이러한 문제가 음성 인식을 위해 고려 될 때까지 스펙트로 그램이 사용됩니다.