아크로팬

산업 경제 테크 게임
사회 생활 자동차 미디어

리뷰 - 인텔 코어 i9-10980XE 익스트림 에디션 프로세서: 특징

  • 2019-12-04 21:37
  • ACROFAN=권용만
  • yongman.kwon@acrofan.com
컴퓨팅 성능에 대한 수요는 지속적으로 높아지고 있지만, 이런 수요를 완전히 충족시키는 것은 점점 어려워지고 있다. 특히 최근 몇 년간 반도체 제조 공정 미세화의 난이도는 더욱 높아지고 있으며, 반도체의 면적과 소비 전력, 발열 등에 대한 부분도 대응이 점점 까다로워지고 있는 것이다. 이에, 최근의 ‘고성능 컴퓨팅’ 수요를 충족시키기 위한 방법으로는, 모든 영역에서의 ‘범용적 성능’보다, 실제 사용하는 용도에 맞춘 ‘워크로드 최적화’에 더 집중해, 시스템 수준에서는 이를 위한 프로세서와 가속기의 조합을 활용하는 등으로 눈 앞에 있는 한계를 넘어 가고 있다.

컴퓨팅 성능 향상을 위한 방법에서, 기존 체계에서의 범용적 성능을 끌어올리는 건 그리 효율적이라고는 할 수 없는 방법이기도 하다. 그리고 더 높은 동작 속도, 더 많은 코어 수에서 어느 정도 한계에 봉착하고 있다면, 그 다음의 단계로는 기존의 ‘체계’를 바꿀 필요가 있다. 프로세서에서는 더욱 효율적인 연산이 가능한 새로운 명령어 체계를 갖추고, 이를 적극적으로 활용할 수 있는 소프트웨어가 함께 조합된다면 가장 이상적이고, 효과적인 성능 향상이 가능해지는 것이다. 이러한 변화는 특히, 인공지능 등 기존의 전통적인 체계에서는 고려되지 않은 워크로드에서 특히 각별한 의미를 가진다.

현재 인텔의 프로세서에서는 클라이언트와 서버용 프로세서에서 서로 다른 마이크로아키텍처를 사용하고 있다. 그리고 PC 등의 클라이언트를 위한 프로세서에서, ‘하이엔드 데스크톱’ 프로세서 제품군인 ‘코어 X-시리즈’는, 서버용 ‘제온 스케일러블 프로세서’와 기술적 기반을 공유하는 독특한 위치에 있다. 이러한 코어 X-시리즈 프로세서의 최신 제품군인 코어 i9-10900 시리즈의 플래그십 모델인 ‘코어 i9-10980XE X-시리즈 프로세서’는 메인스트림 급 PC에서는 쉽게 볼 수 없었던 18코어 36쓰레드 구성을 제공하지만, 메인스트림 급 프로세서와는 단지 이런 ‘숫자’만의 차이만으로 끝나지 않는다.

▲ 2세대 ‘코어 X-시리즈 프로세서’는 이제 메인스트림 급 프로세서와는 다른 길을 가고 있다

메인스트림 급 코어 프로세서는 ‘세대’가 브랜드화 되어 있지만, 하이엔드 데스크톱용 프로세서인 ‘X-시리즈’ 프로세서는 메인스트림 급 코어 프로세서와 비슷한 모델명을 가지고 있지만 세대가 정확히 연결되지는 않는다. ‘스카이레이크-X’ 로 알려진 X-시리즈 프로세서가 처음 선보였을 때는 주로 코어 i7-7800X, i9-7900X 시리즈의 모델명을 사용했고, 이후 리프레시 모델에서는 코어 i7-9800X, i9-9900X 모델명을 사용했던 바 있다. 언뜻 보면, 첫 X-시리즈 프로세서는 7세대 코어 프로세서와, 리프레시 모델에서는 9세대 코어 프로세서와 연관이 있을 것 같지만, 사실 연관이 있는 것은 시장에 선보인 시점 정도로, 제품 구성과 플랫폼 뿐 아니라, 프로세서에 담긴 기술 기반 자체도 크게 달랐다.

코어 i9-10900X X-시리즈 프로세서는 이 X-시리즈 프로세서 제품군의 2세대 모델로, 2세대 제온 스케일러블 프로세서가 사용하는 ‘캐스케이드 레이크(Cascade Lake)’ 마이크로아키텍처를 기반으로 한다. 1세대 제온 스케일러블 프로세서는 ‘스카이레이크(Skylake)’ 마이크로아키텍처를 사용했는데, 사실 이는 6세대 코어 프로세서의 그 ‘스카이레이크’이기도 하지만, 기술적 구성에서 많은 차이가 있었다. 제온 스케일러블 프로세서는 스카이레이크 마이크로아키텍처를 기반으로 했지만, 코어 영역에서는 AVX-512를 위한 추가 연산기, 새로운 캐시 구성으로 변화를 주었고, 코어간 연결은 링버스가 아닌 메시 아키텍처를 활용하는 등, 같은 코드명이지만 절대 같다고 볼 수 없을 변화가 있었다.

‘캐스케이드 레이크’는 이 제온 스케일러블 프로세서의 ‘스카이레이크’와 소켓과 기반 플랫폼을 공유하는 ‘2세대’ 모델이다. 하지만 변화의 폭은 기대 이상으로 큰데, 공정은 14nm 기반을 그대로 활용하지만 프로세서의 명령어 셋, 메모리 컨트롤러 등에 주목할 만한 변화가 생겼다. 이 중 가장 큰 변화는 ‘명렁어 셋’으로, 기존의 ‘AVX-512’에 인공지능 추론 워크로드의 성능 향상을 위한 ‘DL Boost’가 추가된 것이다. 또한 메모리 컨트롤러에서는 인식 가능한 메모리 용량이 두 배가 되었으며, DDR4-2933을 지원한다는 것과 함께, ‘옵테인 퍼시스턴트 메모리(Optane DC Persistent Memory)’의 공식 지원이 있는데, 이 부분은 코어 i9-10900X X-시리즈 프로세서에서 지원 여부가 명확하지 않다.

한편, 현재 메인스트림 급 PC용 프로세서는 ‘스카이레이크’ 이후 카비 레이크, 커피 레이크, 코멧 레이크와 아이스 레이크에 이르고 있으며, 서버용 프로세서에서는 스카이레이크 이후 캐스케이드 레이크, 쿠퍼 레이크를 거쳐 아이스 레이크로 가는 로드맵이 발표된 바 있다. 이에, ‘스카이레이크’ 이후 사뭇 다른 길을 가던 PC와 서버용 프로세서의 아키텍처 코드명의 여정도 10nm 공정 기반의 ‘아이스 레이크’에 이르면 몇 세대 만에 다시금 만나지만, 예전처럼 기술적인 부분이 동일한 모습은 보이지 않을 것으로 예상된다.

▲ 새로운 코어 X-시리즈 프로세서 제품군의 주요 특징 (자료제공: Intel.com)

코어 i9-10900 X-시리즈 프로세서 제품군은 10코어부터 12, 14, 18코어 구성까지 총 네 가지 모델이 함께 선보였으며, 이 중 18코어 36쓰레드의 코어 i9-10980XE 익스트림 에디션 프로세서는 이번 세대의 X-시리즈 프로세서 중 최고 사양을 갖춘 플래그십 모델이다. 18코어 36쓰레드의 구성에서도 기본 동작 속도 3GHz, 터보 부스트 2.0의 최대 동작 속도는 4.6GHz, 싱글 코어의 터보 부스트 맥스 3.0 최대 동작 속도는 4.8GHz로, 하위 라인업들보다 터보 부스트 동작 속도는 높게 설정되어 있다. L2 캐시는 코어당 1MB, L3 캐시는 코어당 1.375MB로 총 24.75MB다. TDP는 165W이고, 기존의 LGA 2066 소켓 기반, X299 칩셋을 사용한 메인보드에서 그대로 사용할 수 있다.

코어 i9-10980XE 프로세서는 18코어 36쓰레드와 최대 4.8GHz의 동작 속도로 순발력과 멀티쓰레드 성능을 동시에 양립하기 위해, 동작 속도 조건이 꽤 세밀하게 만들어져 있다. 먼저, AVX를 사용하지 않는 경우에는 상황에 따라 2코어 사용까지 최대 4.8GHz, 12코어까지도 최대 4.3GHz, 18코어 전체를 활용할 때는 최대 3.8GHz로 동작할 수 있다. 하지만 AVX2를 사용시에는 최대 4GHz, 18코어 전체 사용시에는 3.3GHz로 동작하며, AVX-512 사용시에는 최대 3.8GHz, 18코어 전체 사용시 2.8GHz로 동작한다. 한편, 터보 부스트 맥스 3.0은 코어 X-시리즈 이후 메인보드에서 동작 모드 설정을 ‘OS Native’로 하면, 별도의 드라이버 등 없이도 최대 4.8GHz의 동작 속도를 누릴 수 있다.

메모리 컨트롤러에서는 지원 규격이 기존의 DDR4-2666보다 한 단계 높은 DDR4-2933으로 변경되었으며, 16Gb DDR4 메모리 지원으로 이전보다 지원 메모리 용량이 두 배 늘어났다. 또한 프로세서 내장 PCIe 컨트롤러 또한 기존의 44레인에서 4레인 늘어난 48레인 구성으로 바뀌었으며, 이에 따라 X299 칩셋과 함께 하는 플랫폼 레벨의 PCIe 3.0 레인 수는 최대 72레인이다. 한편, 이번 ‘X-시리즈’ 프로세서는 두 세대간의 플랫폼 호환성을 제공한다는 인텔의 정책에 따라, 이전 세대에서 사용한 X299 칩셋 기반의 메인보드를 그대로 활용할 수 있는데, 새로운 프로세서에 최적화된 디자인의 메인보드에서는 플랫폼에서 새롭게 제공하는 2.5Gbps NIC나 Wi-Fi 6 AX200 등의 새로운 기능도 기대할 수 있다.

▲ ‘DL Boost’는 AVX-512 기반에서 3사이클의 행렬곱을 한 사이클에 할 수 있게 한다

새로운 코어 i9-10900X X-시리즈 프로세서에서 가장 특별한 변화는 ‘DL Boost’다. 2세대 제온 스케일러블 프로세서에서 처음 선보인 이 ‘DL Boost’는, AVX-512 기반에서 이루어지는 AI 추론 워크로드의 수행 과정에서 많이 사용되는 INT8 값의 행렬곱(Matrix Multiply)을 위한 새로운 명령어 VNNI(Vector Neural Network Instructions)를 추가한 것이 핵심이다. 이를 통해 기존에는 INT8 값을 받아 INT32로 결과를 내기까지 총 3사이클이 필요한 연산을 1사이클에 끝낼 수 있어, 이론적으로는 3배의 성능 향상을 제공한다. 현재 이 기술은 AVX-512를 지원하는 프로세서 중 ‘캐스케이드 레이크’와 ‘아이스 레이크’ 프로세서에서 제공되고 있다.

이전 세대의 제온 스케일러블 프로세서나 ‘X-시리즈’ 프로세서에서도 제공된 512비트 폭의 AVX-512 또한 높은 연산 성능이 필요한 AI나 모델링, 데이터 분석, 이미지나 비디오 편집, 암호화, 데이터 압축 등 다양한 워크로드에서 기존의 256비트 폭의 AVX2보다 코어 당 두 배 가량 높은 성능을 제공한다. 그리고 새로운 프로세서에서 제공하는 이러한 AVX-512와 DL Boost 등의 새로운 명령어 셋을 소프트웨어에서 적극적으로 활용함으로써, 높은 컴퓨팅 성능이 필요한 워크로드에서 프로세서의 능력을 더욱 효율적으로 활용해, AVX2 기술 기반의 이전 세대 플랫폼이나 메인스트림 급 PC 프로세서 대비 큰 폭의 성능 향상을 기대할 수 있게 된다.

최근 수요가 늘고 있는 개인 크리에이터들의 작업 환경에서도, 새로운 코어 X-시리즈 프로세서는 특별한 고성능의 작업 환경을 제공할 수 있다. 메인스트림 급 플랫폼과 프로세서보다 더 많은 코어와 쓰레드를 통한 성능 차이는 물론이고, AVX-512와 DL Boost의 존재는 코어당 성능 측면에서도 메인스트림 급 프로세서와 완전히 차별화되는 성능을 낼 수 있는 차별점이기도 하다. 특히 이미지나 영상 등을 다루는 환경에서, 생산성을 높일 수 있는 최신 작업 환경들이 AVX-512와 DL Boost 등 새로운 프로세서의 특징을 지원하는 경우, 기대할 수 있는 생산성의 차이는 단순이 코어와 쓰레드 수의 차이에서 오는 예상을 훨씬 뛰어넘게 된다.

▲ 기존 ‘X-시리즈’ 플랫폼과 호환 가능하지만 몇 가지 변화는 새로운 메인보드가 필요하다

코어 i9-10900X X-시리즈 프로세서 제품군은 기존 ‘X-시리즈’ 프로세서가 사용하던 LGA 2066 소켓 기반, X299 칩셋을 사용한 메인보드를 그대로 활용할 수 있으며, TDP 또한 이전 세대와 마찬가지로 165W 정도로 정의되어 있다. 하지만 새로운 프로세서에서는 PCIe 컨트롤러가 44레인에서 48레인으로 확장된 만큼, 기존의 프로세서에 따라 디자인된 메인보드에서는 늘어난 PCIe 레인 구성을 제대로 활용하지 못할 수도 있다. 또한 인텔은 새로운 X-시리즈 프로세서를 위한 플랫폼 디자인에 새로운 2.5Gbps NIC나 Wi-Fi 6 지원 등을 적용한 만큼, 이를 반영한 새로운 메인보드 또한 시장에서 찾아볼 수 있을 것으로 기대된다.

메인스트림 급 플랫폼과 비교할 때, ‘하이엔드 데스크톱’ 플랫폼인 코어 X-시리즈 프로세서와 플랫폼이 제공하는 가장 큰 특징은 ‘확장성’이다. 일단 메모리 구성부터 메인스트림 플랫폼의 듀얼 채널, 최대 4개 소켓과 차별화되는 쿼드 채널, 최대 8개 메모리 소켓을 통해, 최대 256GB의 메모리를 장착할 수 있다. 또한 PCIe 구성에서도 큰 차이가 나는데, 프로세서에 내장된 PCIe 레인 수부터 메인스트림과는 3배 차이가 나고, 플랫폼 수준에서도 두 배 가까운 차이가 난다. 그리고 이러한 차이는 고성능 그래픽카드와 다양한 주변 장치, 다수의 NVMe SSD를 통한 고성능 스토리지 구성 등을 활용할 때 그 진가를 만날 수 있다.

한편, 코어 X-시리즈와 따로 생각할 수 없는 제품군으로는 ‘제온 W-2200’ 시리즈가 있다. 이 두 제품군은 같은 ‘캐스케이드 레이크’ 기반의 제품이자, 대부분의 기술적 구성과 특징을 공유하는, 형제뻘 되는 제품군이다. 그리고 이 두 제품군간의 차이는, 코어 X-시리즈에서 오버클록킹이 지원된다는 점, 그리고 제온 W-2200 시리즈에서 ECC 메모리와 RAS 기능으로 작업 환경에서 더 높은 안정성을 지원한다는 점이 꼽힌다. 물론 코어 X-시리즈 또한 오버클록킹을 하지 않은 상황이라면 충분히 높은 수준의 안정성을 지원하고 있어, 개인이나 프리랜서 수준의 작업 환경에서는 코어 X-시리즈가, 기업 환경의 중요한 작업을 위한 워크스테이션 환경에서는 제온 W-2200 시리즈가 추천된다.

한편, 이번 세대의 ‘코어 X-시리즈’ 에서는 ‘가격’ 또한 중요한 화두 중 하나다. 이전 세대와 비교할 때, 이번 세대의 코어 X-시리즈는 코어당 가격이 거의 절반 수준으로 내려간 모습이며, 이에 따라 최상위 모델의 가격 역시 몇 년만에 1,000달러 이하로 내려갔다. 이에 따라, 프로세서 가격만 놓고 보면 9세대 코어 i9에서 자연스럽게 코어 i9 X-시리즈로 넘어올 수 있는 가격대의 배치가 만들어져, 하이엔드 데스크톱으로의 접근성도 높아졌다. 이는 현재 시장에서의 제품 경쟁력 뿐 아니라, 멀티코어 활용 환경의 확산, AVX-512와 DL Boost의 생태계 확장에 있어서도 꽤 긍정적인 영향으로 평가할 만 하다.