▶ 젠슨 황 “내년까지 AI 칩 매출 1조 달러 예상”…차세대 ‘로자파인만’ 칩도 소개
엔비디아가 추론 전용 칩과 새 중앙처리장치(CPU)를 내놓으며 본격적인 인공지능(AI) 에이전트 시대에 필수적인 빠른 연산 능력과 지휘 능력 구축에 나섰다.
젠슨 황 최고경영자(CEO)는 16일 캘리포니아주 새너제이 소재 SAP센터에서 진행한 엔비디아의 연례 개발자 회의 'GTC 2026'의 기조연설을 통해 '그록(Groq)3 언어처리장치(LPU)'를 차세대 AI 슈퍼컴퓨터 '베라 루빈'에 통합한다고 밝혔다.
이를 통해 '루빈' 그래픽처리장치(GPU)와 LPU의 역할을 나눠 방대한 데이터를 다루는 대규모 연산은 GPU가 맡고, 속도가 매우 빠른 LPU는 AI의 답변을 처리하도록 효율을 높인다는 구상이다.
황 CEO는 이와 같은 역할 분담을 통해 파라미터(매개변수)가 조 단위인 최고급 AI 모델의 추론 처리량을 35배 향상하고, 저지연(low latency) 추론 능력을 높일 수 있다고 설명했다.
엔비디아는 LPU 256개를 하나로 구성한 LPX 랙을 베라 루빈에 통합했다.
이에 따라 베라 루빈 슈퍼컴퓨터의 부품은 지난 1월 CES에서 발표했을 당시의 6종에서 LPU를 포함한 7종으로 늘었다.
황 CEO는 또 기존 x86 방식의 CPU 대비 성능을 1.5배로 끌어올리고, 에너지 효율이 2배인 새 CPU '베라'와, 이를 256개 탑재한 CPU 랙을 선보였다.
베라 CPU에는 엔비디아가 AI 실행을 위해 직접 설계한 '올림퍼스'(Olympus) 코어가 장착돼 x86 CPU 대비 3배의 메모리 대역폭을 제공한다.
엔비디아가 이와 같은 추론 전용 칩과 새 CPU를 선보인 것은 일반적인 AI 챗봇과 달리 AI 에이전트를 구동하는 데는 보다 빠른 속도와 함께 모든 과정을 매끄럽게 조율하는 지휘 능력이 필요하기 때문으로 풀이된다.
GPU가 시스템의 데이터를 처리하는 핵심 역할을 담당하되, 그 결과를 바탕으로 에이전트들에게 막힘 없이 할 일을 구체적으로 지시하는 역할은 LPU가 분담하고 이들에게 필요에 따라 권한을 부여하는 조율은 CPU가 맡는 구조다.
황 CEO는 이어 '루빈'의 다음 세대 GPU인 '파인만'도 소개했다. 파인만은 '로자'라는 새 CPU와 함께 구동되며, LP40 LPU를 탑재할 예정이다.
황 CEO는 "내년까지 엔비디아의 AI 칩 매출 기회가 최소 1조 달러(약 1천500조원)에 달할 것"이라고 내다봤다.
<연합뉴스>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x