"업계 첫 수냉 방식"…HPE, AI 모델 학습·HPC 서버 출시
HPE가 고성능컴퓨팅(HPC) 솔루션과 통합 시스템 출시를 통해 갈수록 늘어나는 기업의 인공지능(AI) 도입 가속화를 지원한다.
HPE는 리더십급 'HPE 크레이 슈퍼컴퓨팅 EX'와 거대언어모델(LLM) 학습과 자연어처리(NLP), 멀티모달 모델 학습에 최적화된 시스템 2종을 포함한 새로운 HPC·인공지능(AI) 인프라 포트폴리오를 15일 발표했다.
HPE 크레이 슈퍼컴퓨팅 EX 시스템 기반으로 작동하는 HPC 포트폴리오 신제품은 세계 난제 해결을 맡은 연구 기관과 소버린 AI 이니셔티브를 개발하는 정부 기관을 위해 설계됐다. 이 제품군은 업계에서 처음으로 100% 팬리스 직접 수냉 방식 시스템 아키텍처 기반으로 작동한다. 컴퓨팅 노드와 네트워킹, 스토리지를 포함한 HPE 슈퍼컴퓨팅 솔루션의 모든 레이어에 걸쳐 새 소프트웨어(SW) 오퍼링으로 보완된다.
HPE 크레이 슈퍼컴퓨팅 EX4252 2세대 컴퓨팅 블레이드는 단일 캐비닛에서 최대 9만8천304개 코어를 제공할 수 있는 HPE 크레이 슈퍼컴퓨팅 EX4252 2세대 컴퓨팅 블레이드다. 슈퍼컴퓨팅을 위한 가장 강력한 원랙 유닛 시스템을 구현하는 제품이다. 8개의 5세대 AMD EPYC 프로세서를 탑재했다. 중앙처리장치(CPU) 집적도 이점을 제공함으로써 고객이 동일한 공간 내에서 더 높은 성능의 컴퓨팅을 실현할 수 있도록 지원한다. HPE Cray 슈퍼컴퓨팅 EX4252 2세대 컴퓨팅 블레이드는 내년 봄 출시 예정이다.
HPE 크레이 슈퍼컴퓨팅 EX154n 가속기 블레이드는 슈퍼컴퓨팅 워크로드를 완료하는 데 걸리는 시간을 획기적으로 단축한다. 단일 캐비닛에 최대 224개 엔비디아 블랙웰(NVIDIA Blackwell) 그래픽터리장치(GPU)를 탑재할 수 있다. 각 가속기 블레이드는 엔비디아 GB200 그레이스 블랙웰 NVL4 슈퍼칩을 탑재했다. 엔비디아 NV링크-C2C를 통해 2개의 엔비디아 그레이스 CPU와 통합된 4개의 엔비디아 NV링크 연결 블랙웰 GPU를 보유하고 있다. HPE 크레이 슈퍼컴퓨팅 EX154n 가속기 블레이드는 2025년 말에 공급 예정이다.
HPE 슬링샷 인터커넥트 400는 차세대 엑사스케일 지원 HPE 인터커넥트 포트폴리오다. 초당 400기가바이트(GB) 속도의 네트워크 인터페이스 컨트롤러(NIC), 케이블 및 스위치를 제공한다. 기존 버전보다 2배 빠른 회선 속도를 제공한다. 자동화된 혼잡 관리 및 초저 테일 레이턴시를 위한 어댑티브 라우팅과 같은 기능을 제공한다. 이를 통해 고객이 훨씬 적은 네트워크 인프라로 대규모 워크로드를 실행할 수 있도록 돕는다. 이 버전의 HPE 슬링샷은 내년 하반기부터 HPE 크레이(Cray) 슈퍼컴퓨팅 EX 시스템 기반 클러스터에 적용된다
HPE 크레이 슈퍼컴퓨팅 스토리지 시스템 E2000은 대규모 슈퍼컴퓨터용으로 설계된 고성능 스토리지 시스템이다. 이전 세대2 대비 입출력(I/O) 성능이 두 배 이상 올랐다. HPE 크레이 슈퍼컴퓨팅 스토리지 시스템 E2000은 오픈 소스 러스터 파일 시스템을 기반으로 한다. I/O 작업 중 유휴 시간을 줄여 CPU와 GPU 기반 컴퓨팅 노드의 활용도를 모두 높일 수 있다. 이 HPC 스토리지 시스템은 내년 초에 HPE 크레이 슈퍼컴퓨팅 EX 시스템에서 일반적으로 제공될 예정이다.
HPE 크레이 슈퍼컴퓨팅 사용자 서비스 SW는 컴퓨팅 집약적 워크로드 실행의 사용자 경험을 개선하는 새 SW다. 고객이 시스템 효율성을 최적화하고 전력 소비를 조절하며 슈퍼컴퓨팅 인프라에서 다양한 워크로드를 유연하게 실행하도록 돕는다.
HPE는 고객이 대규모 고성능 AI 클러스터를 간소화할 수 있도록 지원하는 새로운 카테고리 서버를 선보인다.
특히 자체 AI 모델을 학습하는 SP와 대기업을 위해 설계된 HPE 프로라이언트 컴퓨트 XD 서버는 대규모 AI 시스템 설치와 배포를 돕는다. HPE의 최첨단 제조 시설 내에서 솔루션 구축부터 맞춤화, 통합, 검증, 전체 테스트를 지원하는 HPE 서비스 옵션을 활용하면 신속한 온사이트 배포가 가능하다고 평가받고 있다.
HPE 프로라이언트 컴퓨트 서버에서만 사용 가능한 HPE iLO 관리 기술을 사용하면 일부 권한이 있는 직원이 서버에 대한 대역 외 원격 제어 액세스를 허용함으로써 표준 대역 내 네트워크 액세스보다 보안을 강화할 수 있다.
HPE 프로라이언트 컴퓨트 XD680는 복잡한 AI 학습과 튜닝, 추론 워크로드를 처리하도록 설계됐다. HPE가 설계한 섀시에는 단일 컴팩트 노드에 8개의 인텔 가우디 3 AI 가속기가 탑재됐다. 인텔 가우디 3가 탑재된 HPE 프로라이언트 컴퓨트 XD680 서버는 올 12월에 출시될 예정이다.
HPE 프로라이언트 컴퓨트 XD685 서버는 성능부터 경쟁 우위, 에너지 효율성을 우선시하는 고객을 위해 대규모의 복잡한 AI 모델에 대한 학습을 가속화할 수 있다. 향후 엔비디아 GPU가 탑재된 새로운 버전의 HPE 프로라이언트 컴퓨트 XD685 서버가 출시될 예정이다. 이 서버는 5개의 랙 유닛 섀시에 8개의 엔비디아 H200 SXM 텐서 코어 GPU 또는 엔비디아 블랙웰 GPU로 구동된다. 수냉식 냉각 분야에서 수십 년간 쌓아온 HPE의 전문성을 활용해 GPU와 CPU, 스위치를 효율적으로 냉각시킨다. HPE 프로라이언트 컴퓨트 XD685 서버의 엔비디아 HGX H200 8-GPU 버전은 내년 초 출시 예정이다. 엔비디아 블랙웰 GPU 버전은 출시에 맞춰 선보일 계획이다.
앞서 지난 10월에 8개의 AMD 인스팅트 MI325X 가속기와 2개의 AMD EPYC™ CPU가 탑재된 HPE 프로라이언트 컴퓨트 XD685 서버 버전이 발표된 바 있다. HPE 프로라이언트 컴퓨트 XD 서버는 HPE 프라이빗 클라우드 AI 및 HPE 프로라이언트 컴퓨트 DL 서버를 포함한 HPE의 포괄적인 AI 제품군 일부다.
HPE는 시장 요구를 충족하고 과학 연구 성과를 올리기 위해 AI 모델을 사용하는 기존 슈퍼컴퓨팅 고객의 증가 수요를 지원하기 위해 많은 노력을 기울이고 있다. 이달 17일부터 22일까지 미국 애틀랜타에서 열리는 슈퍼컴퓨터 기술 전시회인 슈퍼컴퓨팅24(SC24)에서 차세대 HPC·대규모 AI 시스템 정보를 확인할 수 있는 HPE 솔루션을 선보일 예정이다.
HPE 트리시 댐크로거 HPC·AI 인프라 솔루션 부문 수석 부사장 겸 총괄은 "소버린 AI 이니셔티브에 투자하는 서비스 제공업체(SP)와 국가들은 발견과 혁신을 가속화하기 위한 대규모 AI 학습을 가능하게 하는 중요한 백본으로 HPC를 점점 더 많이 고려하고 있다"며 "고객은 세계 최고의 HPC 솔루션과 완전 통합형 시스템 제공, 배포 및 서비스 분야에서 수십 년간 쌓아온 경험을 활용해 더 빠르고 효율적으로 가치를 실현하면서 AI 시스템 배포를 빠르게 진행할 것"이라고 밝혔다.