아크로팬

산업 경제 테크 게임
사회 생활 자동차 미디어

리뷰 - 인텔 코어 i9-9980XE 익스트림 에디션 프로세서 : 특징

  • 2018-11-30 01:11
  • ACROFAN=권용만
  • yongman.kwon@acrofan.com
인텔의 프로세서 제품군에서 ‘익스트림 에디션’은 당대 최고의 성능이라는 상징성으로, 나름대로의 역사로 이어지고 있다. 특히 초대 코어 프로세서 이후, 익스트림 에디션은 하이엔드 데스크톱 플랫폼에서만 찾아볼 수 있는 특별한 존재로, 메인스트림 플랫폼의 최상위 모델인 ‘K 시리즈’와는 분명한 차이를 보여주고 있다. 그리고 이런 차이는, 메인스트림 급 프로세서들과 분명한 기술적 차이를 가진 ‘X-시리즈’ 제품군과 플랫폼이 등장하면서 좀 더 분명해졌으며, 익스트림 에디션의 상징성 역시 좀 더 높아진 모습이다.

9세대 코어 프로세서와 함께 등장한 새로운 ‘X-시리즈’ 프로세서는, 9세대 코어 프로세서와 같은 시기에 등장한 점을 감안해, 라인업의 일관성을 위해 9000대 모델명을 가지고 있지만, 기술적으로는 9세대 코어 프로세서와는 전혀 다른 모습을 갖추고 있다. 기존 X-시리즈 프로세서에서 사용된 ‘스카이레이크-X(Skylake-X)’ 마이크로아키텍처의 리프레시로 등장한 새로운 X-시리즈 프로세서는, 8코어부터 시작해 18코어까지의 모델이 갖추어져 있으며, 모든 제품군에서 44개의 PCIe 레인을 제공하고, 이전보다 좀 더 늘어난 L3 캐시를 제공하며, 동작 속도의 상향과 함께 TDP또한 전 모델 165W로 조정된 것이 특징이다.

인텔 코어 i9-9980XE 익스트림 에디션 프로세서는 이런 새로운 코어 X-시리즈 프로세서의 최상위 모델로, 기존 제품인 코어 i9-7980XE 익스트림 에디션 프로세서와 같은 18코어 36쓰레드 구성이지만, 기본 동작 속도가 0.4GHz 올라가고, 최대 터보 부스트 동작 속도가 소폭 상향되는 등 전반적인 동작 속도가 올라간 것이 특징이다. 이를 통해 어떠한 작업 유형에서도 일관적인 고성능을 기대할 수 있게 되었다. 또한 새로운 프로세서에서는 오버클록킹 등 높은 발열이 예상되는 상황에서 효과적인 쿨링이 가능하도록 STIM(Solder Thermal Interface Material)이 적용되는 등, 여러 가지의 개선도 있었다.

 
▲ 새로운 ‘X-시리즈’ 프로세서의 플래그십 모델 ‘코어 i9-9980XE 익스트림 에디션 프로세서’

9000대 모델명과 함께 등장한 새로운 ‘X-시리즈’ 프로세서는 기존 X-시리즈가 사용하던 ‘스카이레이크-X’ 마이크로아키텍처를 그대로 사용하고 있지만, 상품 구성의 방법들은 단순한 ‘리프레시’로 넘길 수 없을 정도의 변화를 보여주는 것이 특징이다. 기본적으로, 새로운 X-시리즈 프로세서들은 기존의 X-시리즈 프로세서보다 동작 속도가 더 높아졌으며, 같은 코어, 쓰레드 수에서는 이에 따른 세대 간의 성능 차이를 기대할 수 있다. 또한 엔트리 급의 코어 i7 X-시리즈 프로세서에서도 TDP 165W와 프로세서 내장 44레인 PCIe 컨트롤러를 기본으로 해, 플랫폼의 확장성 측면에서의 장점을 강조했다.

코어 X-시리즈 프로세서 제품군이 메인스트림 급 코어 프로세서와 기술적으로 차별화되는 가장 큰 특징은 역시 ‘AVX-512’의 지원이다. 코어 X-시리즈 프로세서는 골드 급 제온 스케일러블 프로세서와 마찬가지로 두 개의 AVX-512 FMA를 갖추고 있으며, 이 중 하나는 AVX2 FMA 두 개를 하나로 합친 것이고, 다른 하나는 코어 외부에 연결된 형태다. 512비트 폭의 벡터를 다룰 수 있는 AVX-512는 기존 256비트 폭의 AVX2 대비 이론적으로는 두 배의, 사이클 당 SP 연산은 64 FLOPs, DP 연산은 32 FLOPs의 성능을 낼 수 있다.

새로운 X-시리즈 제품군은 기존 X-시리즈 제품군과 거의 동일하다. 기존 익스트림 프로세서인 ‘코어 i9-7980XE 익스트림 프로세서’와의 비교에서는, 두 프로세서 모두 ‘스카이레이크-X’ HCC 다이의 최대 구성인 18코어 36쓰레드, 18MB L2와 24.75MB L3 캐시를 갖추고, 프로세서에 44레인 PCIe 3.0 컨트롤러와 쿼드 채널 메모리 컨트롤러를 갖추고 있으며, TDP는 165W로 설정되어 있다. 하지만 9980XE는 7980XE보다 기본 동작 속도는 0.4GHz 높은 3.0GHz, 최대 터보 부스트 동작 속도는 0.2GHz 높은 4.4GHz, 올 코어 최대 터보 부스트는 3.8GHz, 터보 부스트 맥스 3.0 동작 속도는 0.1GHz 높은 4.5GHz로 설정되어, 전체적으로 0.3~0.5GHz 높아진 동작 속도 덕분에 크게는 10% 정도의 세대 간 성능 향상을 기대할 수 있다.

 
▲ 이번 ‘X-시리즈’ 프로세서들은 L2 캐시 용량에서 짐작할 수 있듯이 모두 HCC 다이 기반이다

이 ‘스카이레이크-X’ 아키텍처의 기본 캐시 구성은 코어 당 1MB의 L2와 1.375MB의 L3이고, 동작 방식은 L2와 L3의 내용이 서로 다른 non-inclusive 방식을 사용한다. 그리고 코어 수 대비, L2 캐시가 커지고 공유 L3 캐시가 비교적 줄어듬에 따라, 캐시를 사용하는 방법에 따라 성능 향상의 수준도 달라지는 모습이었다. 코어 간 연결은 기존의 링버스 형식이 아닌, 근접한 코어와 격자 형태의 네트워크로 연결되는 ‘메시(Mesh)’ 아키텍처를 사용하며, 링버스보다 자유로운 라우팅 경로 설정과 함께 코어와 I/O 블록 간 연결 대역폭과 지연 시간 측면에서 큰 향상이 있었다.

새로운 X-시리즈 프로세서 제품군에서 가장 흥미로운 부분은 ‘캐시 구성’이다. ‘스카이레이크-X’ 아키텍처에서 코어 당 캐시는 L2 1MB, L3 1.375MB고 이 자체를 바꾸긴 쉽지 않다. 하지만 새로운 ‘X-시리즈’ 프로세서들의 L3 캐시 구성은 코어 수와 별개로, 코어 당 1.375MB보다 더 큰 용량을 제공하고 있는데, 8코어의 i7-9800X는 16.5MB를 제공하고, i9-9820X와 i9-9900X는 10코어 모델임에도 16.5MB, 19.25MB의 L3 캐시로 차별화된다. 그리고 9900X부터 9940X까지, 10코어부터 14코어까지의 L3 캐시 용량이 같다. 한편 9940X부터 9980XE까지는 코어당 1.375MB의 L3가 할당된 모습이다.

아키텍처 기반에서 코어마다 할당된 L3 캐시의 전체 용량을 코어와 별개로 늘릴 수 있는 방법으로는 일부 코어 블록에서 코어를 비활성화시키고 L3 캐시만 활성화시키는 방법을 생각할 수 있다. 그리고 이를 생각할 때, 엔트리 모델의 16.5MB L3는 12개 코어 블록에 해당하며, 19.25MB의 경우 14개 코어 블록에 해당된다. 이에, 새로운 X-시리즈 프로세서는 전체 모델에서 LCC 다이 없이 HCC 다이만을 사용하며, 일부 코어와 캐시 블록을 비활성화시켜 제품군을 구성하는 것으로 보인다. 그리고 이렇게 좀 더 확보한 L3 캐시를 통해, L3 캐시 용량이 중요한 일부 애플리케이션들에서 성능 향상을 기대할 수 있다.

 
▲ X299 기반 메인보드와 조합되며, 이제 모든 프로세서가 44레인 PCIe 구성을 갖췄다

프로세서 내장 PCIe 컨트롤러의 구성에서는, 새로운 X-시리즈 제품군에서는 엔트리급 모델부터 44레인 전체 구성을 제공하고 있다. 이 44레인의 PCIe 컨트롤러는 x16 단위로 구성되어, 메시 아키텍처 기반에서 3개의 블록이 모두 메시에 직접 연결되어 높은 성능을 제공한다. 그리고 메모리 컨트롤러는 이전과 마찬가지로 두 개의 컨트롤러에서 2채널을 활성화, 쿼드 채널 구성과 8개 메모리 소켓을 활용할 수 있도록 했다. 메모리의 정규 동작 속도는 이전과 같은 DDR4-2666으로, 최대 구성 가능한 메모리 용량은 16GB 모듈 8개를 사용한 128GB다.

새로운 코어 X-시리즈 프로세서들은 이전 모델들과 마찬가지로, LGA 2066 소켓 기반의 X299 메인보드와 함께 사용할 수 있다. 모든 모델이 165W TDP 설정이지만, 기존 모델들도 일부 모델이 165W TDP를 가지고 있었던 만큼, 하드웨어 수준에서의 변화는 그리 필요하지 않다. 그리고 X299 칩셋 기반 메인보드는 프로세서의 쿼드 채널 메모리 컨트롤러나 44레인 PCIe 컨트롤러의 지원을 위한 구성 이외에도, 하이엔드 데스크톱 플랫폼에 어울리는 최대 8개 드라이브의 SATA RAID, M.2 NVMe와 옵테인 SSD 지원, 최대 24레인의 PCIe 확장성에 기반한 다양한 부가 기능들을 갖추고 있다.

플랫폼 확장성 측면에서 볼 때 기존 ‘X-시리즈’ 프로세서의 경우, 코어 i7 브랜드의 6코어, 8코어 모델은 프로세서에서 28레인의 PCIe 확장성을 제공해, 메인보드의 PCIe 구성을 더 복잡하게 하는 경우가 있었다. 하지만 새로운 X-시리즈 모델에서는, 최하위 모델인 코어 i7-9800X 부터 44레인 구성 전체를 지원해, 메인스트림 플랫폼과는 확장성 측면에서 확실한 격차를 기대할 수 있게 했다. 이 외에도, ‘X-시리즈’는 전체 모델이 오버클록킹 가능한, 배수 제한이 해제된 모델인 만큼, 플랫폼 차원에서도 인텔 XTU(Extreme Tuning Utility) 등의 오버클록킹을 위한 다양한 도구도 제공하고 있다.

물론, 18코어 36쓰레드에 이르는 대형 프로세서의 오버클록킹은 꽤 어려운 일이며, 특히 어려운 것이 18개 코어에서 나오는 발열 문제일 것이다. 그리고 이 발열 문제의 대응에 있어, 새로운 X-시리즈 프로세서는 STIM(Solder Thermal Interface Material)을 적용해, 고성능 쿨러와의 조합에서 좀 더 빠른 열 배출을 통한 온도 측면에서의 여유를 확보할 수 있도록 했다. 기존 모델의 경우 쿨러의 성능이 충분하더라도 오버클록킹 시 코어에서 히트스프레더로의 순간적인 열 이동에 대한 문제가 일부 제기되었었는데, STIM의 적용에 따라 이런 문제들이 다소 완화된 모습이다.

 
▲ 이전 세대 대비 제품군 전체에서 코어 수, 캐시 용량, 동작 속도 등이 조정되었다 (출처: ark.intel.com)

새로운 코어 X-시리즈 프로세서의 제품 구성 또한 기존과는 다소 변화가 있다. 먼저 엔트리급 모델에서는, 메인스트림 급 플랫폼에서 8코어의 코어 i7, 코어 i9 프로세서가 등장함에 따라, X-시리즈 모델의 시작인 코어 i7-9800X 프로세서는 8코어 16쓰레드와 기본 3.8GHz 동작 속도, 최대 터보 부스트 동작 속도는 4.4GHz까지다. 메인스트림 급 코어 i9-9900K와 비교하면, 같은 코어와 쓰레드 수에 동작 속도는 좀 밀리지만 AVX-512, 쿼드 채널 메모리 구성과 44개 PCIe, 조금 더 많은 L3 캐시 등을 얻을 수 있는 것이다. 이는 기존 ‘X-시리즈’보다 플랫폼 입문의 동기를 좀 더 높이는 의미로 볼 수 있겠다.

10코어 모델부터는 코어 i9 브랜드를 사용하며, 10코어 모델은 동작 속도와 L3 캐시 용량에 따라 모델이 나뉜다. 그리고 10코어 모델인 9900X와 12코어 모델인 9920X는 기본 동작 속도와 L3 캐시 용량이 동일하며, L3 캐시 용량은 9940X까지도 19.25MB다. 한편 코어당 L3 캐시 용량에서, 9940X, 9960X, 9980XE는 모두 코어당 1.375MB지만, 하위 모델은 상황에 따라 코어당 2MB를 넘게 할당되기도 한다. 이런 구성이 가능한 이유는 전체 제품군이 HCC 다이를 기반으로, 코어 블록에서 L3 캐시만 활성화시켜 제품을 구성했기 때문으로 보이며, HCC 다이의 최대 구성인 18코어 모델이 정확히 코어당 1.375MB의 구성을 가지고 있다는 것이 이를 뒷받침한다.

한편, 최대 18코어 구성을 가진 코어 X-시리즈 프로세서는 메인스트림 급의 9세대 코어 프로세서와 동작 속도는 물론이고, 마이크로아키텍처와 플랫폼, 지원 기술 등에서 분명한 차이가 있다. 특히 동작 속도 측면에서, 코어 X-시리즈 프로세서는 코어 수가 늘어날수록 전반적인 동작 속도가 내려가게 되고, 이에 멀티쓰레드 환경의 활용 여부에 따라 프로세서가 제공하는 성능의 가치가 달라지게 된다. 물론, 새로운 코어 X-시리즈 프로세서들은 기존 제품들보다 동작 속도가 올라감으로써, 어떠한 상황에서나 높은 성능을 내지만, ‘X-시리즈’ 프로세서의 가치가 최대화되는 지점은 멀티쓰레드를 적극적으로 활용하는 메가태스킹 환경인 것도 분명하다.