나는 서양과 중국 문자가 혼합 된 텍스트 파일을 가지고 있습니다. 각 파일에 나타나는 중국어 문자 목록을 원합니다.자바 스크립트에서 문자열의 고유 한 문자 목록을 가져 오는 방법은 무엇입니까?
나는 있지만, 일부 반복과,
ch = text.match(/[\u4E00-\u9FFF]/g); // unicode usual chinese characters - that'll do for me
if (ch != null) {
alert(ch);
}
이 나에게 중국어 문자의 목록을 제공을 시도했습니다. 예를 들어 :
肉,捕,兵,死,兵,半,水
파일 서로에 대한
卵,水,半,水,土,木,水,清,慢,底,海,海,海,清,清,清,木,清,慢,底,清,土,半,水,水,土,半,水,土
에 대한 ...
1) 나는 그 쉼표가 필요하지 않습니다. 저들은 어디서 왔어요? (나는 그들을 하나의 replace로 제거 할 수 있지만, 정규 표현식을 사용하고 있기 때문에 정규 표현식 자체에서 해결하면 더 빠를 것이라고 생각한다.) 2) 유일한 값만 얻는 방법? 예를 들어 첫 번째 파일 두 번째에 대한
卵水半土木清慢底海
에 대한
肉捕兵死半水
...
'정규 표현식 자체에서 해결하면 더 빠를 것이라고 생각합니다. 정규 표현식에 넣을 때 얻을 수있는 한계 및 눈에 띄지 않는 속도 향상은 더 복잡한 정규 표현식을 사용하는 데 정신적 인 가치가 없습니다. 가능하면 정규 표현식을 나눕니다. 그들은 한눈에 이해하기가 어려우므로, 읽을 수있게 만드는 것이 그만한 가치가 있습니다. – ajp15243
다른 측면에서, 나는 더 복잡한 정규 표현식을 구성하기 위해 가지고있는 정신적 번거 로움이 한 번 일어났습니다. 내가 할 수있는 스피드 부스트 (테스트하는 것이 중요하다.)는 내가 당신과 의견이 일치하지 않는 여러 번 일어날 것이고이 신사의 디자인 철학에 동의 할 것이다 : www.micosyen.com – Rodrigo
그의 사이트에서 : 25 세기 동안 일관되고 간결하게 적용된 나의 디자인 철학은 단순성보다 더 뛰어난 우아함이 없다는 것입니다. 8 비트는 16 비트보다 16 비트, 16 비트는 32 비트보다 더 선호됩니다. 5MHz 클록이 50보다 높고 50이 500보다 더 좋습니다. 조립이 선호됩니다 C over C, C++ C++ 하드웨어의 부 풀기 제거는 하드웨어의 부풀림을 제거하는 열쇠입니다. 하드웨어의 팽창을 제거하는 것은 혁신, 성능 및 비용면에서 찬사를 얻으려고 평범함의 불협화음 이상으로 상승하는 제품을 만드는 열쇠입니다. 유효성." – Rodrigo