AWS가 엔비디아 없이 AI 칩 만드는 진짜 이유

AI 모델이 세상을 바꾸고 있지만, 그 동력인 AI 반도체 시장은 엔비디아라는 거대한 이름 아래 종속되어 있습니다.

이러한 상황 속에서 아마존웹서비스(AWS)는 조용하지만 강력하게 자신만의 길을 개척하고 있습니다.

단순한 비용 절감을 넘어, 클라우드 제국의 생존과 미래 AI 시장의 패권을 건 AWS의 자체 칩 개발 전략은 왜 지금 가장 주목해야 할 움직임일까요?

엔비디아 의존 탈피, 클라우드 거인의 생존 전략

AI 열풍은 엔비디아를 시장의 ‘킹메이커’로 만들었습니다.

하지만 이는 클라우드 서비스 제공업체(CSP)에게 막대한 비용 부담과 공급망 리스크를 안겨주었습니다.

AWS가 2015년 반도체 설계 회사 아나푸르나 랩스(Annapurna Labs)를 인수하며 자체 칩 개발에 뛰어든 것은 바로 이 미래를 내다본 전략적 포석이었습니다.

목표는 명확했습니다.

범용 칩에 의존하는 대신, AWS 클라우드 환경에 완벽하게 최적화된 칩을 직접 설계하는 것입니다.

이를 통해 더 뛰어난 성능을 더 낮은 비용과 전력으로 구현하고, 궁극적으로는 기술적 종속에서 벗어나 서비스의 운전대를 직접 잡겠다는 의지입니다.

현재 이 전략은 ‘트레이니움(Trainium)’과 ‘그래비톤(Graviton)’이라는 두 개의 핵심적인 칩 제품군으로 구체화되었습니다.

CPU, GPU, 그리고 AI 가속기의 차이를 간단한 비유로 설명할 수 있습니다.

CPU가 어떤 작업이든 순서대로 처리하는 숙련된 장인이라면, GPU는 수천 개의 단순 반복 작업을 동시에 처리하는 공장 조립 라인입니다.

그리고 트레이니움과 같은 AI 가속기는 AI 모델 훈련이라는 특정 제품만을 생산하기 위해 맞춤 설계된 최첨단 자동화 공장과 같습니다.

트레이니움은 처음부터 대규모 언어 모델(LLM)과 같은 AI 워크로드의 훈련 및 추론을 위해 태어났습니다.

범용성을 일부 포기하는 대신 AI 연산에 필요한 병렬 처리 능력을 극대화하여, 범용 GPU 대비 월등한 성능과 효율성을 제공합니다.

최근 공개된 ‘트레이니움3’는 이전 세대보다 4배 이상 향상된 성능을 자랑하며, 앤트로픽(Anthropic)이나 OpenAI와 같은 최정상 AI 연구소들이 자신들의 모델 훈련에 트레이니움을 채택했다는 사실은 그 성능을 입증하는 강력한 증거입니다.

트레이니움이 AI 모델 훈련이라는 특수 임무를 수행한다면, 그래비톤은 웹사이트, 애플리케이션, 데이터베이스 등 클라우드를 움직이는 거의 모든 일반적인 컴퓨팅 작업을 처리하는 심장부 역할을 합니다.

ARM 아키텍처를 기반으로 설계된 그래비톤 프로세서는 기존 x86 프로세서 대비 최대 40% 뛰어난 가격 대비 성능을 제공하며, 이미 10만 개 이상의 고객사가 그래비톤 기반 서버를 사용하고 있습니다.

최근 그래비톤의 역할은 더욱 중요해지고 있습니다.

바로 ‘에이전틱 AI(Agentic AI)’ 시대의 도래 때문입니다.

에이전틱 AI는 단순히 질문에 답하는 것을 넘어, 사용자를 대신해 데이터베이스를 조회하고, 다른 서비스를 호출하며, 실제 행동을 수행합니다.

이러한 복잡한 논리 처리와 다중 작업 실행은 AI 모델의 병렬 연산보다 CPU의 순차 처리 능력에 더 크게 의존합니다.

메타(Meta)가 에이전틱 AI 워크로드를 위해 수천만 개의 그래비톤 코어를 도입하기로 한 것은 그래비톤이 이 새로운 AI 패러다임의 핵심 인프라로 자리 잡고 있음을 보여줍니다.

AWS의 칩 전략은 ‘트레이니움이냐 그래비톤이냐’의 선택 문제가 아닙니다.

현대 클라우드 컴퓨팅은 두 프로세서가 각자의 강점을 발휘하며 긴밀하게 협력하는 구조로 진화하고 있습니다.

트레이니움: 수조 개의 파라미터를 가진 거대 AI 모델을 몇 주 만에 훈련시키고, 미세조정(Fine-tuning)하며, 대규모 추론 작업을 처리하는 ‘전문가’ 역할을 맡습니다.
그래비톤: 훈련된 AI 모델을 둘러싼 모든 서비스를 구동하는 ‘만능 일꾼’입니다. 실시간 추론 요청을 처리하고, 관련 데이터를 관리하는 데이터베이스를 운영하며, 애플리케이션 로직을 실행하는 등 시스템 전반의 안정적인 운영을 책임집니다.

이처럼 AWS는 AI 워크로드의 특성에 맞춰 가장 효율적인 하드웨어를 할당하는 이원화 전략을 통해, 고객에게는 최고의 성능을, 회사에는 최대의 수익성을 안겨주고 있습니다.