제작후기

AI 데이터센터에 사용 되는 2 CPU, 8 GPU 서버시스템 BMS 4029GP | 비맥스테크놀로지

작성자
비맥스테크놀로지
작성일
2022-07-19 09:51
조회
355

Digital 시대를 만들어가는 Embedded System IPCDisplay Solution 기업 비맥스테크놀로지입니다

H대학교 AI(인공지능) 데이터센터에 장착 되는 슈퍼마이크로 서버시스템 BMS 4029GP 제작후기에 대해 알려 드리겠습니다 !

이번에 제작된 BMS 4029GP GPU서버 시스템은 AI(인공지능) 데이터센터에 장착되었지만 아래와 같은 애플리케이션에도 적합합니다.

- AI/ML, 딥러닝 교육 및 추론

- 고성능 컴퓨팅(HPC)

- 빅데이터 분석

- 천체물리학 시뮬레이션

- 화학 시뮬레이션

- 연구소/국립연구소

 

 

BMS 4029GP GPU Server System (GPU 서버 시스템) 제작후기

 



 

BMS 4029GP System에 장착되는 슈퍼마이크로 SBC보드입니다.

해당 보드에는 Intel® Xeon® 확장 프로세서, 듀얼 소켓 LGA-3647, CPU 지원 최대 205W TDP의 CPU를 장착 할 수 있으며 Intel® C622 칩셋이 장착 되어 있습니다. 최대 6TB DIMM, DDR4-2933MHz, 6TB의 메모리를 지원 합니다.

 

 



 

8개의 GPU를 장착 할 수 있는 백플레인보드가 있습니다.

 

 



 

고객사의 요청에 따라 Intel Server CPU, Xeon GOLD 6226R 2개를 장착 해 주었습니다.


* Intel Xeon GOLD
더 빠른 메모리 속도 및 향상된 메모리 용량을 지원하는 Intel Xeon Gold 프로세서는 상당한 성능 향상, 뛰어난 신뢰성 및 하드웨어로 강화된 보안 기능을 제공합니다. 이 제품군은 주요 고사양 데이터 센터, 멀티 클라우드 컴퓨팅, 네트워크 및 스토리지 워크로드에 최적화되어 있습니다. 최대 4소켓으로 확장 가능해 다양한 워크로드에 알맞습니다.
 

 



 

효과적인 열 방출을 위해 CPU 위에 장착되는 쿨러 (Cooler) 입니다.

 

 



 

보드에 장착 되어 있는 모습입니다.

위에 쿨러 후면에 달려있는 작은 팬을 통해 새로운 공기가 유입되어 CPU에서 나는 열을 효과적으로 방출 해 줍니다.

 

 



 

고객사에 요청에 따라 메모리Samsung의 DDR4 64GB ECC/REG 8개, 총 512GB를 장착 하였습니다.

사진에는 CPU에 가려져서 안보이지만 CPU 옆에 추가적으로 2개씩 더 꽃혀져 있습니다.


* 메모리 종류
DIMM : 아무기능 없는 메모리
UDIMM : ECC 기능 (Unbefferd or Unregistered DIMM)
RDIMM : ECC 기능 + REG기능 (Registered DIMM)
LRDIMM : ECC 기능 + REG기능 + 데이터신호 제어 (Load Reduced DIMM)
NVDIMM : ECC 기능 + REG기능 + 데이터신호 제어 + SSD기능
* ECC 메모리란?
Error Correcting Code의 약자로, 오류 정정 코드 메모리, 즉 가장 일반적인 종류의 내부 데이터 손상을 감지하고 수정하는 기억 장치의 일종으로 ECC 메모리는 계산과학, 금융 컴퓨팅 등 모든 상황에서 데이터 손상에 대처해야 하는 대부분의 컴퓨터에 사용된다.
* REG란?
다수의 메모리 구성시, RAM 슬롯거리차이로 RAM 모듈간에 이동속도 차이로 발생할 수 있는 신호왜곡을 방지하는 기술
출처: https://systemdesigner.tistory.com/12 [System Designer]
 

 



 

위의 표는 2CPU에서 메모리를 장착하는 방법입니다. 장착되는 메모리의 갯수에 따라 꽂는 슬롯을 확인하여 장착해야합니다.

 

 



 

GPU(그래픽카드)는 고객사의 요청에 맞춰 RTX 3090 Blower 타입으로 8개 장착 해 주었습니다.

 

 



 

위에서 설명드렸던 백플레인보드에 RTX 3090 Blower 타입으로 8개를 장착 해 준 모습입니다.

1개의 CPU에서 4개의 GPU(그래픽카드)를 컨트롤 할 수 있도록 설계 되어 있습니다.

추가로 파워는 2000W 총 4개를 장착하였으며, 리던던트(Redundant) 구성이 되어있습니다.


* 리던던트(Redundant)파워란
리던던트(Redundant) 파워는 일반적인 파워서플라이와는 다르게 2개의 전원모듈이 있는 이중 전원공급장치. 정상적인 상황에서는 자동으로 두개의 모듈을 최적의 효율로 출력을 공유하지만 하나의 모듈이 고장이 나면 즉시 다른 모듈이 전체출력을 담당.
 

 

이렇게 완성이 되었습니다!










비맥스테크놀로지는 다음과 같은 범주의 애플리케이션을 중심으로 플랫폼을 제공합니다.

*넓은 온도 범위 및 견고한 임베디드 팬리스 컴퓨터

*다중 GigE / PoE 포트가 있는 머신 비전 플랫폼

*GPU 엣지 AI Computing(컴퓨팅) 차내 팬리스 PC

*초소형 팬리스 컨트롤러

*감시 / 비디오 분석 컴퓨터 시스템

*넓은 확장 PCIe 슬롯 / 고성능 Server PC

혹시나 더 궁금하신 점이나 문의사항이 있으시면 비맥스테크놀로지로 문의해 주세요!

오늘도 비맥스테크놀로지의 공식 블로그에 방문 해 주셔서 감사합니다:)

▶견적요청◀

https://bemax.co.kr/supports/inquiry

* 홈페이지에서 실시간으로 문의하실 수 있도록 오른쪽 하단에 온라인 상담 있습니다.



▶더욱 다양한 정보를 원하시면 ↓↓아래 블로그링크↓↓를 참조하세요!◀

https://blog.naver.com/bemax00/222818339026

메뉴 닫기