2012-10-15 2 views
2

I 하드웨어 측면에서 두 개의 동일한 서버가 (실제의 VM) RHEL 4.7에서 하나 RHEL6의 둔한에서 RHEL 제10 배 느린 LANG와는 UTF-8과 비교하여 설정 둔한 LANG = C

이상의 매우 느립니다. 간단한 gawk 명령으로 3.7M 줄의 텍스트를 처리하는 간단한 테스트를 수행했습니다.

RH4.7에

, GAWK 3.1.3 내가 얻을 :

real 1m28.138s user 1m27.657s sys 0m0.453s

:

RH6에 time gawk '/^pat1/&&/pat2/ {x++};END {print "x="x}' file

x=40874

real 0m7.266s user 0m6.809s sys 0m0.460s

, 나는 시간에, 같은 X의 결과를 얻을 3.1.7 둔한 7 대 1m28s! 처음에는 업그레이드 후 VM에 어떤 일이 일어 났지만 다른 CPU 테스트 (예 : gzips, perl에서 같은 프로그램)는 각각 비슷한 결과를 산출합니다. 그래서 그것은 멍청한 것 같습니다. 이것이 올바른 장소인지는 모르지만 RH 6의 gawk 3.1.7에 알려진 성능 문제가 있습니까? 여기서 가장 좋은 곳은 어디입니까?

+0

시도 게시에 비해 UTF-8로 설정하여 둔한 10 배 느렸다. 행운을 빕니다. – shellter

답변

2

나는 gawk 버그 메일 링리스트에서 대답을 얻었다.

로켈 설정에 모두 미치지 않습니다. 내 RH6 상자에서 LANG은 en_US.UTF-8로 설정되었으며, RH4에서는 C였습니다. RH6에서 변경하면 성능이 고정됩니다.

확실히 가치가 기억 - LANG 구글 그룹에 comp.lang.awk하는 C