2011-10-05 5 views
12

일부 사람들은 도메인 이름이 대소 문자를 구분하지 않는다고 회신 할 것입니다. 새로운 유니 코드 세계에서는 더 이상 사실이 아닙니다.IDN 도메인 이름은 대소 문자를 구분합니까?

(Source)는

제가

유니> 퓨니 코드 변환의 단계 중 하나의 도메인 이름을 소문자 렌더링 "정규화"라고 생각했다.

+0

공식 사양 (IETF RFC 4343)을 참조하십시오 : [DNS (Domain Name System) 사례 무감각 해명] (http://tools.ietf.org/html/rfc4343) –

답변

12

예 : ASCII- 기반 domain names을 사용하는 경우 도메인 이름은 계속 대소 문자를 구분하지 않습니다.

  • example.com
  • Example.com 현대에서
  • EXAMPLE.COM
  • EXampLE.com

:

예를 들어,이 모두가 동일한 도메인을 나타냅니다 DNS, 이제 우리는 유니 코드 문자를 허용하는 Internationalized Domain Names (IDN)을 갖게되었습니다. 문제는 대문자와 소문자를 정의하는 것이 ASCII가 아닌 일부 언어 및 문자 세트에서는 까다로울 수 있다는 것입니다 (유니 코드는 US-ASCII의 수퍼 세트 임).

도메인 이름의 의도는 대소 문자를 구분하지 않으며이지만 특정 인간 언어의 특정 스크립트에는 특정 문자와 관련된 복잡성이있을 수 있습니다. 따라서 귀하의 질문에 간단한 YES 또는 NO 대답은 없습니다.

ASCII가 아닌 도메인 이름을 사용하는 경우, 당신은 읽어야

-1

URL은 IDN의 경우에도 대/소문자를 구분하지 않습니다.

+1

RFC 3987 "국제화 된 자원 식별자 (IRI)"를 참조하십시오. 대소 문자를 구분하지만 특정 체계에 따라 대소 문자를 구분하지 않을 수 있습니다. IRI의 도메인 부분은 대소 문자를 구분하지만 경로 및 파일 이름과 같은 다른 부분은 구분하지 않습니다. – davispuh

+0

질문은 IRI가 아니라 IDN에 관한 것입니다. 도메인 이름은 IRI의 일부일뿐입니다. RFC 3490을 확인하십시오. toASCII는 stringprep (RFC 3454)를 참조하는 nameprep (RFC 3491)을 호출합니다. 섹션 3.2 "케이스 접기"는 정확한 접기 테이블 (CaseFolding.txt)과 유니 코드 버전 (3.2)을 지정하므로 대소 문자를 구별하지 않을뿐만 아니라 정확한 대소 문자 변환 테이블이 지정됩니다. –

+0

"ASCII 이외의 언어 및 문자 집합에서 대문자와 소문자를 구분하는 것이 까다로울 수 있습니다"라는 말로 승인 된 대답이 정확하지 않습니다. 유니 코드이며 정확한 버전이 지정되어 있습니다. 다른 문자 세트는 없습니다. "답변"으로 추천 된 Wikipedia 기사조차도 "레이블을 소문자로 변환하고 다른 정규화를 수행하는 Nameprep 알고리즘을 적용합니다"라고 말합니다. 그러니 제발 투표를하기 전에 숙제를하십시오. –