2009-04-27 2 views
1

나는 영어가 아닌 어떤 언어로도 무엇이든하기를 처음이다. 지금까지 프로그래밍으로 해본 적이있는 유일한 방법은 기본 영어 문자 + 숫자를 입력 받아 출력하는 것입니다. 이제는 러시아어 (특히 러시아어 위키피디아 페이지)의 일부 텍스트를 조작해야하지만 어디서부터 시작해야하는지 전혀 알지 못합니다. 나는 Google과 Google하지만 내가 얻는 것은 결과가 유니 코드, UTF-8 및 다른 것들에 대해 이야기하고 있지만 그것들이 의미하는 것이 확실하지 않기 때문에 그것들은 의미가 없습니다. Wikipedia 항목 자체는 이미이 내용을 알고있는 사람들을 위해 쓰여진 것으로 보입니다.Perl에서 러시아어 텍스트를 처리하려면 어떻게해야합니까?

누구나 나를 좋은 출발점으로 안내 할 수 있습니까?

답변

7

먼저 유니 코드가 무엇인지 생각해야합니다. 조엘 스폴 스키 (Joel Spolsky)의 기사 The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)은 좋은 출발점이 될 수 있습니다 (경험이 많은 사람들에게는 매우 유익하지 않습니다).

그런 다음 Perl Unicode Tutorial을 살펴 보는 것처럼 Perl이 유니 코드를 처리하는 방법을 살펴보아야합니다.

+0

감사합니다. 나는 그 기사가 내가 찾고 있었던 것이라고 생각한다. – Mike

+0

참고 : 사실 Joel의 기사는 기술적 인 관점에서 보면 끔찍하고 아마도 그렇게해서는 안되는 많은 것들을 단순하게 만든다. 나는 더 좋은 글을 쓸 수 있다고 주장하지는 않지만 반쯤 지식이 실제로 상처를 입었고 아마도이 기사를 읽은 후 더 많은 지식을 얻지 못할 것이라는 것을 여러 번 입증되었습니다. – Joey