아크로팬

산업 경제 테크 게임
사회 생활 자동차 미디어

리뷰 - 인텔 코어 i9-10940X X-시리즈 프로세서: 특징

  • 2019-11-25 19:58
  • ACROFAN=권용만
  • yongman.kwon@acrofan.com
흔히 말하는 ‘PC’와 ‘워크스테이션’을 구분하는 기준에서 가장 먼저 꼽히는 것은 사실 ‘용도’다. 물론 용도가 개인 수준이냐 회사의 중요 업무를 다루는 수준이냐에 따라 지출할 수 있는 비용과 요구 사항들의 까다로움이 달라지고, 이에 따라 성능과 가격 또한 차원이 다른 수준으로 넘어가는 경우를 흔히 볼 수 있지만, 결국 PC와 워크스테이션의 가장 큰 차이는 ‘용도’가 될 것이다. 이 덕분에, 워크스테이션이라고 해서 모두가 큰 덩치와 강력한 성능, 높은 가격을 갖춘 건 아니고, 엔트리급에서 메인스트림 급 정도의 1소켓 워크스테이션은 PC용 플랫폼과 주요 기술을 공유하는, 비슷한 성능을 가지는 경우도 많다.

덕분에 PC와 워크스테이션 간 ‘성능’ 차이는 이제 모호해졌으며, PC의 신뢰성도 대부분의 업무를 충분히 감당할 수 있을 정도로 올라오면서, 상당한 고수준의 전문 업무를 위해 하이엔드 데스크톱 급 PC를 찾는 수요도 꽤 꾸준히 이어지고 있다. 그리고 이에 따라, 현재 인텔의 데스크톱 PC용 플랫폼은 개인 사용자를 위한 ‘메인스트림’ 급과, 복잡한 시스템 구성과 전문 작업 환경까지 어느 정도 소화할 수 있는 ‘하이엔드 데스크톱’으로 나뉘어 있으며, 지금은 플랫폼에 따른 프로세서 라인업은 물론, 프로세서의 마이크로아키텍처까지도 서로 다른 길을 가는 모습을 보여 주고 있다.

PC 애호가와 크리에이터를 위한 ‘하이엔드 데스크톱’ 라인업인 ‘코어 X-시리즈’ 제품군에 속한 인텔 코어 i9-10940X X-시리즈 프로세서는 메인스트림 급과 달리 세대가 붙지 않고, 메인스트림 급과는 다른 마이크로아키텍처를 사용한다. 이 프로세서는 2세대 제온 스케일러블 프로세서 계열에 사용된 ‘캐스케이드 레이크(Cascade Lake)’ 기반의 제품이며, 제온 W-2200 시리즈 프로세서와 대부분의 기술적 특징을 공유한다. 10코어에서 최대 18코어까지의 제품군이 준비된 이번 코어 i9-10900 X-시리즈 프로세서들은 다양한 기술적인 변화를 가지고 있으면서도 기존의 코어 X-시리즈 프로세서를 지원하는 X299 메인보드에서 그대로 사용할 수 있다.

▲ ‘코어 i9-10940X’ 프로세서와 메인스트림 급 프로세서의 차이는 단지 코어 수만이 아니다

초대 코어 프로세서의 등장 이후, 인텔의 데스크톱 PC를 위한 플랫폼은 일반적인 PC 사용자를 위한 높은 비용 효율을 갖춘 ‘메인스트림’ 급과, 전문가급 PC 사용자들을 위한 ‘하이엔드 데스크톱’ 라인으로 나뉘어 있다. 그리고 메인스트림과 하이엔드 데스크톱 플랫폼간 차이로는 소켓 규격과 함께 지원 메모리 채널, PCIe 확장성 등이 있으며, 프로세서 라인업에서도 하이엔드 데스크톱 플랫폼용 프로세서는 메인스트림 플랫폼용 최상위 프로세서 수준의 구성부터 라인업이 시작하는 모습을 보였다. 당연히, 하이엔드 데스크톱 플랫폼의 가격적인 진입 장벽 또한 만만치 않으며, 최근 몇 년간 일반적인 PC의 구성이 점점 간소화되는 추세와 함께 하이엔드 데스크톱에 대한 관심도 다소 줄어드는 모습이었다.

하지만 초대 ‘제온 스케일러블 프로세서’와, 이를 기반으로 한 첫 ‘코어 X-시리즈 프로세서’는 인텔의 프로세서 역사에서도 꽤 특별한 위치에 있다. 초대 제온 스케일러블 프로세서의 경우, 6세대 코어 프로세서와 마찬가지로 ‘스카이레이크(Skylake)’ 마이크로아키텍처를 기반으로 하지만, 세부적인 기술적 특징은 전혀 다른, 같은 코드명을 가지지만 AVX-512 명령어 셋과 코어간 연결을 위한 메시 인터커넥트의 사용, 새로운 캐시 메모리 구조 등, 전혀 다른 마이크로아키텍처라고 봐도 될 정도의 차이가 있다. 그리고 이런 프로세서의 기술적 차이는, 그 이전까지의 인텔 프로세서가 PC부터 서버용 프로세서까지 코어 부는 모두 비슷한 기술적 특징을 공유하던 것에 비해, 처음 나타난 모습이기도 하다.

그리고 ‘스카이레이크’ 이후, PC용과 서버용 프로세서의 코드명은 몇 세대 동안 전혀 다른 길을 가고 있으며, 당연히 기술적 특징도 다른 모습을 보여주고 있다. PC용 프로세서는 스카이레이크 이후 카비 레이크, 커피 레이크에 이어 현재 10세대 코어 프로세서의 코멧 레이크, 아이스 레이크에 이르고 있으며, 서버용 프로세서는 스카이레이크 이후 캐스케이드 레이크, 쿠퍼 레이크를 거쳐 아이스 레이크로 옮겨갈 예정으로 알려져 있다. 10nm 기반의 ‘아이스 레이크’에 이르면 몇 세대만에 PC와 서버용 프로세서의 아키텍처 코드명이 다시금 만나게 되지만, 같은 코드명을 기반으로 하는 프로세서 간에도 예전처럼 기술적인 부분이 완전히 동일하지는 않을 것이다.

이렇게 PC와 서버용 프로세서 간의 기술적 특징이 달라진 상황에서, 서버용 프로세서 라인업의 기술적 특징을 공유하는 ‘코어 X-시리즈’는 이제 예전의 하이엔드 데스크톱 프로세서가 가지던 ‘고성능 PC’의 의미로만 볼 수도 없게 되었다. 특히 이번 ‘캐스케이드 레이크’와 클라이언트용 ‘아이스 레이크’ 기반 10세대 코어 프로세서의 가장 큰 특징 중 하나인 ‘DL Boost’를 활용하는 데 있어, 코어 X-시리즈 프로세서나 제온 W-2200 시리즈 프로세서 기반의 시스템은 AI 기능을 활용하는 애플리케이션을 통한 높은 생산성을 기대할 수 있는 것뿐 아니라, 새로운 기술을 활용하는 AI 애플리케이션 개발을 위한 입문급 환경으로도 중요한 의미를 가질 것이다.

▲ 코어 i9-10900 X시리즈 프로세서 제품군은 기존 플랫폼 위에서 몇 가지 변화를 담았다

코어 i9-10900 X-시리즈 프로세서 제품군은 실질적으로 ‘2세대’ 코어 X-시리즈 프로세서라고 할 수 있을 것이다. 이는 ‘캐스케이드 레이크’가 2세대 제온 스케일러블 프로세서로 등장한 점, 코어 i9-9900 X-시리즈가 실질적으로 스카이레이크 기반의 리프레시였기도 했던 것이 이유다. 제품 라인업은 10, 12, 14, 18코어의 네 개 모델이며, 기본 동작 속도는 10코어의 i9-10900X가 3.7GHz, 14코어의 10940X는 3.3GHz, 18코어의 i9-10980XE가 3GHz로, 같은 코어 수의 직전 세대 모델들과 비교하면 거의 비슷한 동작 속도를 갖추고 있다. TDP는 전 모델에서 165W이고, 기존의 X299 메인보드들에서 그대로 사용할 수 있다.

이 중 코어 i9-10940X X-시리즈 프로세서는 14코어 28쓰레드 구성과, 기본 동작 속도 3.3GHz, 터보 부스트 2.0 최대 동작 속도 4.6GHz, 터보 부스트 맥스 3.0 기술에서는 최대 4.8GHz의 동작 속도를 가져, 싱글쓰레드와 멀티쓰레드 양쪽에서 높은 성능을 기대할 수 있다. L3 캐시는 이전 세대와 동일하게 코어당 1.375MB로 총 19.25MB를 갖추고 있다. 명령어 셋은 기존 X-시리즈 프로세서들에서 지원되던 AVX-512와 함께 새롭게 DL Boost(Deep Learning Boost)를 지원하며, DL Boost를 활용하면 AI 추론 성능을 이전 세대 대비 이론상 3배까지 끌어올릴 수 있다. AVX-512 FMA 유닛은 제온 골드 6000 시리즈에 준하는 두 개를 갖추고 있다.

14nm 기반 공정에서 14코어 28쓰레드 구성과 TDP 165W를 가지는 이 프로세서는 예상 이상으로 높은 동작 속도를 보여 주고 있지만, 상황에 따른 동작 속도 변화도 크다. 이 프로세서는 1~2코어만 활용하는 가벼운 워크로드에서는 4.6~4.8GHz의 동작 속도를 가지며, AVX를 사용하지 않는 경우 14코어 전체가 최대 4.1GHz로 동작할 수 있다. 하지만 AVX2를 사용하는 경우 1~2코어까지 최대 동작 속도는 4GHz, 올코어 터보는 3.6GHz 정도까지 떨어지고, AVX-512에서는 2코어까지 3.8GHz, 14코어 전체 활성화시에는 3.2GHz까지 내려가는 설정을 가진다.

프로세서에 내장된 메모리 컨트롤러는 4채널 DDR4-2933, 프로세서의 PCIe 컨트롤러는 48레인의 PCIe 3.0 규격으로, 이전 세대 대비 메모리 동작 속도나 PCIe 컨트롤러의 레인 수가 조금 늘었다. 물론 PCIe 레인 증가는 기존 44레인 프로세서를 기반으로 설계한 메인보드에서는 제대로 활용하기 쉽지 않을 수 있다. 플랫폼은 두 세대 간의 플랫폼 호환성을 제공한다는 정책에 따라, 이전 세대와 같은 X299 칩셋 기반의 메인보드를 그대로 사용할 수 있는데, 새로운 프로세서와 함께 나오는 메인보드에서는 플랫폼 차원에서 제공하는 2.5Gbps NIC나 Wi-Fi 6 AX200 지원 등의 새로운 기능도 활용할 수 있을 것이다.

▲ 2세대 제온 스케일러블 프로세서에서 선보인 ‘DL Boost’를 이제 PC 레벨에서도 볼 수 있다

▲ 지난 세대 대비 절반 가까이 낮아진 가격 또한 이번 세대의 특별한 변화다 (자료제공: Intel.com)

코드명 ‘캐스케이드 레이크’인 2세대 제온 스케일러블 프로세서에서 처음 선보인 ‘DL Boost’는, AVX-512 기반에서 이루어지는 AI 추론 워크로드의 수행 과정에서 많이 이루어지는 INT8 값의 행렬곱(Matrix Multiply)을 위한 새로운 명령어 VNNI(Vector Neural Network Instructions)를 추가한 것이 핵심이다. 이를 통해, 기존에는 INT8 값을 받아 INT32로 결과를 내기까지 총 3사이클이 걸리던 연산을 1사이클에 끝낼 수 있게 되어, 이론적으로는 추론 성능에서 3배 향상을 기대할 수 있다. 또한 AVX-512는 기존 256비트 폭의 AVX2 대비 두 배의 처리량을 제공할 수 있는 만큼, AVX-512의 지원 여부 또한 중요한 부분이 된다.

현재 이 ‘DL Boost’는 AVX-512를 지원하는 프로세서 중 서버에서는 ‘캐스케이드 레이크’ 기반의 2세대 제온 스케일러블 프로세서가, 모바일에서는 ‘아이스 레이크’ 기반의 10세대 코어 프로세서만이 지원하고 있다. 물론 이 양 플랫폼간의 성격이 크게 다른 만큼, 양 플랫폼에서 ‘DL Boost’가 가지는 의미 또한 사뭇 다르다. 이에, 새로운 코어 X-시리즈 프로세서나 제온 W-2200 시리즈 프로세서 기반 시스템은 전통적으로 고성능이 필요한 미디어 콘텐츠 제작 등의 전문 작업 환경 이외에도, ‘DL Boost’를 활용하는 AI 애플리케이션의 개발 등에 사용할 수 있는, 특별한 위치에 있는 프로세서와 플랫폼이기도 하다.

최근 수요가 늘고 있는 개인 크리에이터들의 작업 환경에서도, 새로운 코어 X-시리즈 프로세서는 특별한 고성능의 작업 환경을 제공할 수 있다. 메인스트림 급 플랫폼과 프로세서보다 더 많은 코어와 쓰레드를 통한 성능 차이는 물론이고, AVX-512와 DL Boost의 존재는 코어당 성능 측면에서도 메인스트림 급 프로세서와 완전히 차별화되는 성능을 낼 수 있는 핵심 기술이기도 하다. 특히 최근 이미지나 영상 작업 등에 AI 기술들이 접목되어 작업자의 능률을 크게 올리는 상황에서, 이들 도구들이 AVX-512와 DL Boost를 지원한다면 기존의 메인스트림 급 플랫폼으로는 따라잡을 수 없을 수준의 생산성 차이가 날 수도 있을 정도다.

한편, 이번 세대의 ‘코어 X-시리즈’에서 특별한 점 중 하나로는 ‘가격’ 또한 빼놓을 수 없다. 이전 세대와 비교할 때, 이번 세대의 코어 X-시리즈는 코어당 가격과 제품 가격이 거의 절반 수준으로 내려간 모습이며, 최상위 모델의 가격 역시 몇 년만에 1,000달러 이하로 내려갔다. 이에 따라, 프로세서 가격만 놓고 보면 9세대 코어 i9에서 자연스럽게 코어 i9 X-시리즈로 넘어올 수 있는 가격대 배치가 만들어지고, 하이엔드 데스크톱으로의 접근성도 높아졌다. 이는 현재 시장에서의 경쟁 분위기 뿐만 아니라, AVX-512와 DL Boost의 생태계 확장에 있어서도 꽤 긍정적인 영향으로 평가할 만 하다.