JoJun Blog


 

 

AMD의 차기 APU 인 '카베리(kaveri)' 를 미국 캘리포니아주 산호세에서 개발자 회의인 APU13을 (11월 11~13일에) 개최하였습니다. 이 제품은 인텔의 최고사양 CPU 보다 성능이 높다고 AMD는 강조했습니다.

 

카베리는 올해(2013년)에 출시하며 노트북, 데스크탑, 서버, 임베디드 등의 전 분야에 제공되고 “FM2+ 데스크톱PC용 카베리 APU는 내년(2014년) 1월 14일부터 공식 판매하며, 자세한 사항은 자세한 사항은 내년 1월 CES(Consumer Electronics Show)에서 공개됩니다.

 

 

카베리는 32나노 공정에서 한 단계 진화한 28나노 공정으로 생산되며, 4코어 2모듈의 스팀롤러 코어에 8 CU(Compute Unit) 512코어(FMAD)의 GCN(Graphics Core Next) GPU 코어를 갖추고 있습니다.

 

이번에 공개된 버전의 카베리는 총 856GFLOPS.HSA(Heterogeneous System Architecture)의 연산 성능을 내며 핵심 기술로 hUMA 메모리 아키텍처와 hQ 디스패치를 지원합니다. 또한 AMD의 하드웨어 오디오 기술 트루 오디오를 쓸 수 있으며 AMD의 새로운 그래픽 API인 맨틀도 지원합니다.

 

 

 

 

 

 

이날 AMD는 카베리 APU를 탑재한 PC와 Intel Core i7-4770K + NVIDIA GeForce GT 630 시스템의 게임 벤치마크 테스트 결과도 공개했습니다.

 

배틀필드4를 풀HD 해상도(1920x1080), 중간 품질로 설정하여(조명은 낮음) 실행해본 결과 카베리 APU의 프레임은(frame rate) 25~30fps로 인텔 시스템(10~15fps)보다 높아 매끄럽고 부드럽게 플레이가 가능했습니다.

 

그리고 이 테스트는 다이렉트 3D 버전를 이용하였고 맨틀 버전을 사용하면 성능이 더 높다고 합니다.

 


이 같은 성능 차이가 나는 이유는 GPU의 자원을 최대한 끌어와서 사용하기 때문이고, 인텔 하스웰 시스템에서 GPU가 연산을 진행하는 비중은 31%지만 카베리는 절반에 가까운 47%로 높다고 합니다.

 

 

카베리의 CPU 코어인 스팀롤러는 불도저 계열 아키텍처를 대폭 확장한 것입니다. 가장 큰 특징은 명령 디코더를 병렬로 2개 갖췄다는 것입니다. 그래서 불도저에서 성능의 병목 현상을 일으킨 프론트 엔드의 문제를 해결하고 싱글 스레드 성능을 높일 수 있었습니다.

 

스팀롤러는 2스레드가 각각 전용 4웨이 며령 디코더를 갖춥니다. 1 사이클 당 내부 명령의 처리 수는 최대 25% 늘릴 수 있습니다. 스팀롤러는 실행 유닛이나 메모리 하부 시스템도 강화되지만 성능의 핵심은 스레드당 IPC(Instruction-per-Clock)의 향상에 있습니다.

 

 

 

 

 

 

 

 

 

 

카베리가 hUMA(heterogeneous Uniform Memory Access)를 지원하는 아키텍처임을 다시 강조했습니다. hUMA는 CPU와 GPU의 메모리 어드레스 스페이스를 통일하는 아키텍처입니다.

 

CPU 코어와 GPU 코어가 멀티 코어 CPU 코어처럼 메모리 일관성을 최대한 취해 단일 메모리 어드레스 스페이스에 자유롭게 접속 가능하도록 하는 것이 특징입니다. hUMA는 헤테로지니어스(Heterogeneous 이종 혼합)컴퓨팅 프레임워크 HSA의 핵심 요소입니다.

 

 

 

 

hUMA는 양방향 메모리 일관성, CPU와 GPU 사이의 통합 메모리 스페이스를 실현합니다.

 

메모리 일관성의 특징은 하드웨어 지워. 페이지 폴트를 GPU가 지원하 메모리 전체에 자유로운 접근이 가능하며, 그 결과 CPU와 GPU가 최대한 가상 메모리 공간을 공유할 수 있게 됩니다.

 

 

 

hUMA의 장점은 CPU와 GPU 사이의 연계가 쉬워지는 것입니다. CPU와 GPU가 같은 가상 메모리 어드레스를 공유하는 hUMA에서는 CPU의 메모리에 있는 데이터 구조를 그대로 GPU가 액세스 할 수 있습니다. 그저 포인터만 전달하면 되기에 프로그래밍이 아주 쉽습니다.

 

 

또 카베리는 HSA 태스크 큐잉&디스패치 모델인 hQ도 지원합니다. hQ를 사용하면 GPU 코어에도 CPU 코어처럼 낮은 레이턴시의 태스크 전달을 쉽게 할 수 있습니다. HSA의 핵심 특징 2개를 모두 카베리가 지원하는 것입니다

 

 

 

 

 

 

 

또한 AMD는 카베리에 하드웨어 오디오 프로세서인 AMD 트루 오디오(AMD TRUEAUDIO)도 구현했습니다. 그 핵심 기술은 EDA(Electronic Design Automation) 제조사 중 가장 큰 곳인 Cadence Design Systems가 인수한 프로세서 IP 회사 Tensilica의 오디오 DSP입니다. 오디오 처리를 CPU 코어나 GPU 코어가 아닌 전용 DSP에 넘겨, CPU에 과부하를 주지 않고 고품질, 다기능 오디오를 실현하는 것입니다.

 

 

 

 

 

또 GCN 기반이기에 AMD의 그래픽 API&런타임인 맨틀(MANTEL)도 카베리에서 쓸 수 있습니다. 맨틀은 미들웨어처럼 상위의 소프트웨어층이 아니라 다이렉트 X 같은 하위 그래픽 API와 드라이버 소프트웨어층입니다.

 

맨틀 API는 GPU 코어의 병렬 연산을 활용해 그래픽 랜더링 작업을 할 수 있도록 도와 게임 실행 시 CPU로 전가되는 작업량을 크게 줄일 수 있습니다. 한마디로 게임기처럼 얇은 구성의 소프트웨어층을 써서 GPU 코어의 제 성능을 낼 수 있습니다.

 

 

 

 

 

 

 

 


댓글(Comment) +2