본문 바로가기
IT분야 해외뉴스

SSE4 대응 DivX로 Penryn의 효과가 가장 명확하게 (2007.4.19)

by leeyj. 2007. 4. 20.

SSE4 대응 DivX Penryn의 효과가 가장 명확하게


 

기간:4 17~18(중국 시간)

장소:Beijing International Convention Center




● Intel 975 X탑재 마더보드에서 Penryn 동작


 이번 IDF에서 45 nm프로세스로 제조되는 차기 프로세서 「Penryn」이 큰 토픽이지만 이 제품의 벤치마크 측정을 행할 수가 있는 세션이 보도 관계자 전용으로 행해졌다. 이 세션에서는 다음에 나타내는 쿼드/듀얼 각 Penryn 코어 제품과 Kentsfield 코어 제품을 탑재한 PC가 준비되어 실제로 벤치마크를 행해 스코어를 비교할 수 있었다.


· Penryn
쿼드 코어(3.33 GHz, 1,333MHz FSB, 12MB L2캐쉬)
· Penryn
듀얼 코어(3.33 GHz, 1,333MHz FSB, 6MB L2캐쉬
)
· Core 2 Extreme QX6800(2.93 GHz, 1,066MHz FSB, 8MB L2
캐쉬)


 주된 환경은 다음과 같이.

· 메인보드:Intel D975XBX2(Rev. 505)
·
메모리:
Corsair TWIN2X2048-8500C5(1GB×2/5-5-5-15)
·
비디오 카드:
GeForce 8800 GTX(ForceWare 100.65)
· HDD
Seagate Barracuda 7200.10(320GB)
· OS
Windows Vista Ultimate


 여기서 Intel 975X를 탑재한 메인보드를 이용하고 있는 점이 신경이 쓰인 사람도 있을지도 모르다. Intel 975X는 본래 1,333MHz FSB를 서포트하고 있지 않기 때문에이다. 그러나 이번에 이용된 Intel D975XBX2 Rev. 505에서는 1,333 MHz 동작이 가능하게 되도록 변경이 더해진 제품이라는 것.


 다만, 1,333MHz FSB는 공식적으로 서포트되는 것은 아니라고 말하고 있어 Intel D975XBX Rev. 303 DDR2-800 동작은 가능하지만 정식으로는 서포트되어 있지 않았던 것과 닮은 상황이 태어날 것 같다. Penryn Intel 3 시리즈 칩셋과 조합하는 것이 원칙이라고 할 수 있다.


 덧붙여서 CPU-Z의 화면도 확인할 수가 있었지만 CPU-Z측이 Penryn에 대응하고 있지 않는 버전이었기 때문에, CPU에 관한 정보로 확인할 수 있던 것은 동작 클럭 정도에 머무르고 있다.



           


● SSE4 우위성을 나타내는 DivX의 결과에 주목


 그러면 Penryn의 벤치마크 결과를 소개해 나가고 싶다. 이번 세션은 3대의 PC에 미리 몇 개의 벤치마크가 인스톨 되고 있어 그것을 이용해 Intel 스탭이 계측. 스코어를 보도 관계자가 취득할 수가 있다고 하는 것(세션에는 타매체의 관계자도 동석 하고 있다).


 다만, 시간의 제약이 있어 일부 벤치마크 소프트가 실시 되어 있지 않기 때문에 여기에서는 Intel로부터 배포된 자료에 게재되고 있는 수치도 인용해 그래프화한다. 덧붙여 그래프를 게재하는 벤치마크 소프트는 아래와 같이 표시를 한 것은 Intel의 자료보다 데이터를 인용한 것이다. , 그래프 1~4는 길이가 긴것이 좋은 성능인 것을 나타내고 그래프 5~6은 짧을수록 성능이 좋은 것이므로 주의깊게 봐야 한다.





【グラフ1】3DMark06 Build 1.1.0(※)

【グラフ2】CineBench 9.5

【グラフ3】CineBench 10

【グラフ4】Half-Life2 Lost Coast Build 2707

【グラフ5】MainConcept H.264 Encoder

【グラフ6】DivX 6.6 Alpha(フロントエンドにはVirtulDub 1.7.1使用)


 우선, Core 2 Extreme QX6800과 쿼드 코어 Penryn 비교로 보면 그래프 1~5로 그렇게 큰 차이는 없다. 안정되게 20~30% 전후의 스코어 향상을 보여주고 있다. 소프트웨어적으로는 CineBench 10을 제외하면 기존의 어플리케이션이며 소프트웨어측의 대응이 필요한 SSE4 관련의 영향은 없을 것. 이 스코어의 성장을 가져온 것은 클럭 향상, FSB 대역폭, Radix-16 Divider, L2캐쉬 용량이라고 하는 것이지만 우선 클럭 업이 큰 영향을 미치고 있는 것은 틀림없다.


 다만, 쿼드 코어 Penryn 코어의 3.33 GHz라고 하는 동작 클럭은 QX6800 2.93 GHz보다 13.5%정도 높고 클럭비보다 양호한 스코어를 나타내고 있다. 그 이상의 스코어의 성장은 아키텍쳐의 개량에 의해 초래된 것이라는 것이 된다. 무엇보다 이번 테스트 결과만으로는 어떤 것이 어느 정도 영향을 주어 이번 스코어가 되어 있을까를 판단하는 것은 어렵다. 다만, FSB 대역폭에 관해서는 메모리에 DDR2-800을 이용한 환경이어서 그다지 영향을 주지 않은 것이 아닐까 생각된다.


 한편, 듀얼 코어 Penryn Core 2 Extreme QX6800에 이르지 않는 스코어가 대부분으로 이러한 테스트에서는 multi-thread 대응 어플리케이션에 대해 코어수의 비하인드를 역전할 수 있을 정도의 우위성은 보여지지 않는다. 다만, 그래프 1~5중 유일, Half-Life2 Lost Cost에서는 Core 2 Extreme QX6800를 웃돌았다. 이것은 클럭이 향상하고 있다고 하는 메리트가 발휘된 것일 것이다. 게다가 30%를 넘는 FPS의 성장을 보이고 있어 게임에 대해 Penryn의 마이크로 아키텍쳐가 유효한 가능성을 느끼게 하는 결과가 되어 있다.




DivX 6.6 Alpha版には「SSE4.1 Advanced Motion Serach(AMD)」という設定項目が用意されていた。もちろん、有効にした状態で測定が行なわれている


  마지막은 DivX지만 보아서 익숙하지 않은 버전을 사용하고 있다. 이것은, SSE4에 대응한 알파판으로 encode 설정 항목이 준비되어 있다. 일반적으로 multi-thread에 대응한 encode 소프트는 아키텍쳐나 클럭이 같으면 코어수가 많은 편이 유리하고 클럭차이 이상으로 코어수 쪽이 속도에 가져오는 영향은 크다. 먼저 가리킨 MainConcept H. 264 Encoder는 그 전형적인 예라고 해도 좋다.


 그러나, 이번 SSE4를 이용한 DivX에서는 듀얼 코어 Penryn Core 2 Extreme QX6800를 웃도는 속도로 encode를 끝내는 결과를 보였다. 준비되어 있던 샘플 동영상이 짧은 것으로 있던 몇 초 차이지만 일반적인 길이의 동영상이면 몇 분, 수십 분의 차이가 될 정도의 큰 차이를 내고 있다.


 왜 SSE4를 이용하면 동영상 encode가 고속으로 될까에 대해서도 설명이 있었다. 그 큰 이유로서 SSE4로 추가된 「MPSADBW」 「PHMINPOSUW」의 2개의 인스트럭션이다. 전자는 복잡한 SAD 연산을 행하는 것, 후자는 레지스터내의 값으로부터 가장 작은 UWORD를 뽑아내는 것. 이러한 인스트럭션이 준비된 것으로 MPEG encode에 대해 시간이 걸리는 이러한 처리를 적은 인스트럭션수로 실행할 수 있다고 하고 있다.


 처리를 가볍게 하기 위해서 수평/수직 방향의 움직임 검색을 행하고 있던 것 같은 알고리즘을 짜고 있는 경우 없는 방향의 이동이 발생하면 올바르게 압축이 행해지지 않다고 하는 일도 있다. 하지만, 128 bit 레지스터와 상기의 인스트럭션을 이용하면 이러한 어프로치를 뽑지 않아도 넓은 범위의 픽셀을 이용한 움직임 검색을 고속으로 처리할 수 있다는 것이다. 이 외 Super Suffle Engine의 탑재에 의해 이 128 bit 레지스터의 개선이 1 클럭으로 끝낼 수 있을 것으로 이것도 영향을 주고 있을 가능성은 높다.


 이상대로, 몇 개의 benchmark test의 결과를 소개했지만 시험한 어플리케이션의 대부분이 클럭비 이상의 스코어 향상을 볼 수 있던 점에 주목해 두어야 할 것이다. Penryn에 대한 최적화가 이루어지지 않은 어플리케이션에서도 높은 성능 향상을 향수할 수 있다고 하는 것이 되기 때문이다.


 덧붙여 이번에 이용한 DivX는 아직 알파판이기 때문에 입수는 할 수 없다. 원래 SSE4를 포함한 CPU가 시장에 나와 있지 않기 때문에 현상으로 대응한 어플리케이션이 없는 것도 당연하다. Penryn 등장 후에 SSE4를 이용하는 어플리케이션이 어느 정도 등장할지 기다려봐야 한다. SSE4를 이용한 성능 개선에는 소프트웨어측의 대응을 빠뜨릴 수 없지만 그 효과는 DivX의 테스트 결과만으로 충분히 기대할 수 있는 것이다.



 
(2007
4 19)


[Reported by
타와다 신야]

 

원본출처 : http://pc.watch.impress.co.jp/docs/2007/0419/idf06.htm