2026년 5~6월, 클라우드 업계에서 일어난 일들을 정리했습니다. 키워드는 세 가지입니다 — 멀티클라우드 LLM, 에이전트 런타임, 그리고 전력(電力).
들어가며
불과 1~2년 전만 해도 "어느 클라우드에 GPU가 더 많은가"가 화두였습니다. 그런데 2026년 상반기를 지나며 질문이 바뀌었습니다.
- 모델은 더 이상 한 클라우드에 묶여 있지 않습니다. (멀티클라우드 LLM)
- 클라우드가 파는 것은 '인스턴스'가 아니라 '에이전트가 돌아가는 런타임'이 되었습니다.
- 그리고 모두가 깨달았습니다 — 진짜 병목은 GPU가 아니라 전력과 냉각이라는 것을요.
하나씩 살펴보겠습니다.
1. 모델이 클라우드의 울타리를 넘기 시작했다
OpenAI가 AWS Bedrock에 올라갔습니다
가장 상징적인 사건입니다. 4월 말 OpenAI의 Microsoft Azure 독점 계약이 끝나자마자, AWS가 곧바로 움직였습니다.
5월 4일, AWS는 OpenAI와 약 $50B 규모의 확대 파트너십을 발표하고 GPT-5.5, GPT-5.4, Codex를 Amazon Bedrock에 한정 프리뷰로 투입했습니다. 그리고 6월에 정식 출시(GA)됐죠. 가격은 OpenAI 1st-party 요율과 동일하고, AWS 약정 사용량에 그대로 합산됩니다. "Bedrock Managed Agents powered by OpenAI"도 함께 공개됐습니다.
여기서 끝이 아닙니다. 6월 셋째 주에는 xAI의 Grok 4.3까지 Bedrock에 추가됐습니다(툴 콜링 지원). Bedrock이 사실상 '프론티어 모델 마켓플레이스'가 되어가고 있다는 신호입니다.
왜 중요한가 특정 모델을 쓰려고 특정 클라우드에 락인(lock-in)되던 시대가 저물고 있습니다. 이제 같은 클라우드 안에서 OpenAI·Anthropic·xAI 모델을 골라 쓰는 게 가능해졌습니다. 멀티클라우드·멀티모델 전략의 분기점입니다.
출처: AWS 공식 블로그 — GPT-5.5/5.4 & Codex on Bedrock, InfoQ, AWS Weekly Roundup (6/22)
Anthropic는 인프라를 '분산'합니다
같은 흐름이 공급자 쪽에서도 보입니다. 5월 8일, Akamai가 Anthropic과 7년 $1.8B 클라우드 컴퓨팅 계약을 맺은 것이 확인됐습니다(Akamai Q1 실적 + Bloomberg 보도). Akamai 역사상 최대 계약으로, 연평균 약 $257M, 풀 램프 시 Akamai 연매출의 약 6%에 달합니다. 발표 당일 Akamai 주가는 27% 급등했습니다(22년 만의 최대 상승폭).
CDN 사업자가 'AI 클라우드'로 변신하는 상징적 장면인 동시에, Anthropic이 Google Cloud·AWS·CoreWeave에 더해 인프라를 다변화하고 있다는 증거이기도 합니다.
출처: Forbes, Data Center Dynamics
2. 클라우드의 새 단위는 '에이전트 런타임'이다
2026년 상반기 하이퍼스케일러 3사의 메시지는 약속이나 한 듯 똑같았습니다. "에이전트를 1급 컴퓨트 인터페이스로 대접하라."
AWS — Bedrock AgentCore의 대규모 확장 (Summit NYC, 6/16~17)
- AgentCore 런타임 GA
- 관리형 웹 검색 도구: 고객 보안 환경 내 zero data egress, 인용 기반
- Managed Knowledge Base: 관리형 RAG
- Bedrock Guardrails ↔ AgentCore 통합: 프롬프트 인젝션·유해 콘텐츠·민감정보 탐지 (Check Point·Zscaler·Rubrik·Netskope·SentinelOne 등 보안 시그널 연동)
- AWS Context (신규): 조직의 기존 데이터 관계를 자동으로 지식그래프화하고, 거버넌스가 적용된 도메인 지식을 런타임에 에이전트가 에이전틱 검색으로 접근
AWS는 "지난 6개월간 AgentCore에서 에이전트가 수행한 작업이 15배 증가했다"고 밝혔습니다.
출처: AWS Summit NYC 2026 주요 발표, Bedrock AgentCore 업데이트
Microsoft — Agent 365 + Foundry (Build 2026, 6/2~3)
Microsoft는 에이전트를 조직 구성원처럼 다루기 시작했습니다.
- Agent 365: Entra·Defender·Purview를 단일 컨트롤 플레인으로 묶어, 호스팅 위치·프레임워크와 무관하게 에이전트를 관찰·거버넌스·보안
- Autopilot agents (퍼블릭 프리뷰): 에이전트에게 Entra Agent ID·이메일·Teams 프레즌스를 부여 — 말 그대로 '사번을 받은 에이전트'
- Microsoft Foundry: 프로덕션 에이전트용 런타임·메모리·그라운딩·관측·거버넌스 강화
출처: Microsoft Foundry — Build 2026, Microsoft Build 2026 블로그
에이전트가 '결제'까지 한다
5월 11일, AWS는 AgentCore에 관리형 결제(payments) 기능 프리뷰를 추가했습니다. AI 에이전트가 API·MCP 서버·웹 콘텐츠·다른 에이전트에 자율적으로 접근하고 결제까지 수행하는 기능으로, Coinbase·Stripe와 공동 구축했습니다. '에이전트 경제(agentic commerce)' 인프라의 첫 단추입니다.
왜 중요한가 클라우드가 파는 단위가 'VM·컨테이너·함수'에서 '거버넌스·메모리·결제가 내장된 에이전트 런타임'으로 올라갔습니다. 에이전트의 정체성(ID), 권한, 감사 로그, 비용 통제가 인프라 레이어의 핵심 과제로 떠올랐습니다.
3. 칩과 인스턴스 — Blackwell, Cobalt, 그리고 가격 인하
- AWS EC2 G7: NVIDIA RTX PRO 4500 Blackwell Server Edition GPU를 최초로 지원하는 메이저 클라우드. G6 대비 AI 추론 최대 4.6배, 그래픽 최대 2.1배. 같은 주에 S3 Vectors 쿼리 요금 최대 80% 인하, ECS Auto Scaling 스케일아웃 시간 76% 단축(363→86초)도 발표.
- Azure Cobalt 200 VM: Arm 기반, Cobalt 100 대비 세대 성능 최대 50% 향상. scale-out·클라우드 네이티브·Linux 기반 에이전틱 워크로드에 최적화, 이미 10개 이상 리전 배치. AKS는 자율 에이전트 오케스트레이션(서비스 메시 가드레일 내장) 지원.
출처: AWS Weekly Roundup (6/22), Azure Cobalt 200 발표
4. 진짜 전쟁터: 전력과 자본
Neocloud의 폭발, 그리고 'GPU 전쟁 → 전력 전쟁'
- CoreWeave Q1 매출 $20.78억(5/7), 2026 capex 가이던스 상단을 $35B로 상향, Meta와 $21B 신규 약정
- Nebius Q1 매출 YoY +684% ($3.99억, AI 매출 +841%), 흑자 전환, capex 가이던스 $20~25B
업계의 화두가 'NVIDIA GPU 물량 확보'에서 '전력·네트워킹·냉각'으로 옮겨갔습니다.
출처: DataCenterKnowledge — Neoclouds' shift from GPU race to power wars
하이퍼스케일러 2026 Capex: $635~725B, 그리고 '버블' 논쟁
MS·Amazon·Alphabet·Meta(+Oracle) 합산 2026 capex 가이던스가 $635~690B(전년比 +67~74%), 일부 집계로는 $725B에 달합니다. 이 중 약 75%가 AI 인프라(GPU·HBM·네트워킹·전력)입니다. 매출 대비 capex 비율이 45~57%로 거의 '유틸리티 기업' 수준이고, Amazon은 2026년 FCF 마이너스 전환이 전망됩니다.
자연히 논쟁이 붙었습니다. 인프라 슈퍼사이클이냐, 과잉투자 버블이냐. 6월 긱뉴스에서도 Ed Zitron의 비판(2030년까지 계획된 데이터센터 유지에 연 $2조+ 컴퓨트 매출이 필요한데, OpenAI+Anthropic 전망치로는 한참 부족하다)이 화제였습니다.
출처: Yahoo Finance, Futurum Group, GeekNews
정부도 들어왔다
Amazon은 美 연방정부용 AI·슈퍼컴퓨팅에 최대 $50B 투자를 발표했습니다. Top Secret/Secret/GovCloud 리전에 2026년 착공해 약 1.3GW의 용량을 추가하고, SageMaker·Bedrock·Nova·Anthropic Claude·Trainium·NVIDIA 인프라를 제공합니다. 정부·국방 영역의 클라우드 AI 도입이 가속되는 신호입니다.
출처: About Amazon, FedScoop
5. 국내 한 줄 — KT, KT클라우드 재흡수 추진
6월 25일, KT가 2022년 분사했던 KT클라우드를 4년 만에 재흡수하는 방안을 추진 중이라는 보도가 나왔습니다. "클라우드와 AI 인프라를 별개 사업으로 보지 않겠다"는 인식이 깔려 있습니다. 국내 통신·클라우드 사업자의 AI 인프라 재편 사례로 주목할 만합니다.
출처: 아시아경제
마치며 — 3줄 요약
- 모델 멀티클라우드화: OpenAI·Grok이 Bedrock에 올라가고, Anthropic은 Akamai까지 인프라를 분산. 모델-클라우드 락인이 풀리는 중.
- 에이전트 런타임 경쟁: AWS AgentCore, MS Agent 365/Foundry. 클라우드의 판매 단위가 '에이전트'로 상승. ID·거버넌스·결제가 인프라 과제로.
- 전력이 병목: capex $700B 시대, 화두는 GPU가 아니라 전력·냉각. 그리고 '버블이냐 슈퍼사이클이냐' 논쟁.
참고: 본 문서는 2026년 5~6월 발표 기준입니다. (Google Cloud Next 2026의 TPU·Gemini Enterprise·Cloud Run GPU 등은 4월 발표라 의도적으로 제외했습니다.) 수치는 매체별 편차가 있을 수 있어, 인용 시 1차 출처 교차 확인을 권합니다.