News

엔비디아 GPU보다 2배 성능… KAIST 'AI 가속기' 개발 | 비맥스테크놀로지

Author
newbemax
Date
2024-07-08 09:46
Views
594

안녕하세요!

Digital 시대를 만들어가는 Embedded System 산업용컴퓨터Display Solution 전문 기업 비맥스테크놀로지입니다!




엔비디아의 GPU 성능을 넘어서는 고용량·고성능 AI 가속기가 개발됐습니다.

이 기술을 개발한 KAIST 정명수 전기및전자공학부 교수는 “대규모 AI 서비스를 운영하는 빅테크 기업의 메모리 확장 비용을 획기적으로 낮추는 데 기여할 것"이라고 말했습니다.

KAIST(총장 이광형)는 차세대 GPU 간 연결 기술인 CXL(Compute Express Link)를 새로 설계해 고용량 GPU 장치의 메모리 읽기/쓰기 성능을 최적화하는 데 성공했다고 8일 밝혔습니다.
17c133456079e724ebae69f7132852e4.jpg
KAIST 연구진. 왼쪽 위부터 시계방향으로 전기및전자공학부 김동평 석사과정, 유어진 석사과정,
이상원 박사, 국동현 박사과정, 정명수 교수, 강승관 박사과정, 장준혁 박사과정, 배한여름 박사과정(사진=KAIST)
GPU 내부 메모리 용량은 수십 기가바이트(GB, 10의9승)에 불과해 단일 GPU만으로는 모델을 추론·학습하는 것이 불가능합니다.

업계에서는 대안으로 GPU 여러 대를 연결하는 방식을 채택하지만, 이 방법은 최신 GPU 가격이 비싸 총소유비용(TCO·Total Cost of Ownership)을 과도하게 높입니다.

이에 따라 산업계에서는 차세대 인터페이스 기술인 CXL를 활용해 대용량 메모리를 GPU 장치에 직접 연결하는‘CXL-GPU’구조 기술이 활발히 검토되고 있습니다.

CXL-GPU는 CXL을 통해 연결된 메모리 확장 장치들의 메모리 공간을 GPU 메모리 공간에 통합시켜 고용량을 지원합니다. CXL-GPU는 GPU에 메모리 자원만 선택적으로 추가할 수 있어 시스템 구축 비용을 획기적으로 절감할 수 있습니다.

그러나 여기에도 근본적인 한계가 있습니다. 기존 GPU 성능 대비 CXL-GPU의 읽기 및 쓰기 성능이 떨어진다는 점입니다. 아무리 GPU가 연산 처리를 빨리 해도 CXL-GPU가 이를 같은 속도로 처리하지 못합니다.
d1351ea6af9df74f47fdf445e117fc1e.jpg
KAIST가 개발한 CXL-GPU 그림.(사진=KAIST)
연구팀이 이 문제를 해결했습니다.

메모리 확장 장치가 메모리 쓰기 타이밍을 스스로 결정할 수 있는 기술을 개발했습니다. GPU 장치가 메모리 확장 장치에 메모리 쓰기를 요청하면서 동시에 GPU 로컬 메모리에도 쓰기를 수행하도록 시스템을 설계했습니다.

메모리 확장 장치가 내부 작업을 수행 상태에 따라 작업하도록 했습니다. GPU는 메모리 쓰기 작업의 완료 여부가 확인될 때까지 기다릴 필요가 없습니다.

연구팀은 또 메모리 확장 장치가 사전에 메모리 읽기를 수행할 수 있도록 GPU 장치 측에서 미리 힌트를 주는 기술을 개발했습니다. 이 기술을 활용하면 메모리 확장 장치가 메모리 읽기를 더 빨리 시작합니다.

GPU 장치가 실제 데이터를 필요로 할 때는 캐시(작지만 빠른 임시 데이터 저장공간)에서 데이터를 읽어 더욱 빠른 메모리 읽기 성능을 달성할 수 있습니다.

이 연구는 반도체 팹리스 스타트업인 파네시아(Panmnesia)의 초고속 CXL 컨트롤러와 CXL-GPU 프로토타입을 활용해 진행됐습니다.

테스트 결과 기존 GPU 메모리 확장 기술보다 2.36배 빠르게 AI 서비스를 실행할 수 있음을 확인했습니다.


192a0e810e851d07c7c770f8bed7cea8.jpg
CXL-GPU의 구조.
6029a4bc990e4060c80c345575b41c70.jpg
CXL-GPU 실행 시간 평가 결과. 기존 방식보다 월등히 빠르다.


파네시아는 업계 최초로 CXL 메모리 관리 동작에 소요되는 왕복 지연 시간을 두 자리 나노초(10의 9승분의 1초) 이하로 줄인 순수 국내 기술의 자체 CXL 컨트롤러를 보유하고 있습니다.
이는 전 세계 최신 CXL 컨트롤러 등 대비 3배 이상 빠른 속도입니다. 파네시아는 고속 CXL 컨트롤러를 활용해 여러 개의 메모리 확장 장치를 GPU에 바로 연결함으로써 단일 GPU가 테라바이트 수준의 대규모 메모리 공간을 형성할 수 있도록 했습니다.

출처 : 지디넷코리아

비맥스테크놀로지는 원하시는 사양으로 완성 후 철저한 검사를 통해 최적의 PC를 고객님들께 제공해 드리고 있습니다.

*넓은 온도 범위 및 견고한 임베디드 팬리스 컴퓨터

*다중 GigE / PoE 포트가 있는 머신 비전 플랫폼

*GPU 엣지 AI Computing(컴퓨팅) 차내 팬리스 PC

*초소형 팬리스 컨트롤러

*감시 / 비디오 분석 컴퓨터 시스템

*확장 PCIe 슬롯 / 고성능 Server PC

혹시나 더 궁금하신 점이나 문의사항이 있으시면 비맥스테크놀로지로 문의해 주세요!

오늘도 비맥스테크놀로지의 공식 블로그에 방문해 주셔서 감사합니다:)

메뉴 닫기