오늘 테크 씬의 핵심 키워드는 속도와 자율이다. Diffusion 아키텍처 기반 추론 LLM이 기존 autoregressive 한계를 깨고, 코딩 에이전트 생태계는 빠르게 성숙해가고 있으며, AI 인프라에는 전례 없는 자본이 밀려들고 있다.


⚡ Mercury 2: Diffusion이 추론 LLM의 판을 바꾼다

Inception Labs가 Mercury 2를 발표했다. “세계 최속 추론 LLM”을 표방하며, 핵심 차별점은 아키텍처 자체가 다르다는 것.

  • Diffusion 기반 병렬 디코딩: 기존 LLM의 토큰-by-토큰 autoregressive 방식 대신, 전체 응답을 동시에 정제(refinement)하는 방식. 마치 타이피스트가 아닌 편집자처럼 동작
  • 1,009 tokens/sec: NVIDIA Blackwell GPU 기준. 기존 속도 최적화 모델 대비 5배+ 빠른 생성 속도
  • 가격: Input $0.25/1M · Output $0.75/1M — 추론 모델 시장에서 매우 공격적인 가격
  • 스펙: 128K 컨텍스트, 네이티브 툴 사용, schema-aligned JSON 출력, 조절 가능한 추론 깊이

왜 중요한가: AI 에이전트가 확산되면서 “지연 시간의 복리(compounding latency)” 문제가 대두됐다. 에이전트 파이프라인은 수십~수백 번의 LLM 호출을 연쇄하기 때문에, 개별 호출의 속도가 전체 시스템 품질을 결정한다. Mercury 2는 이 문제를 아키텍처 레벨에서 해결하려는 시도다. Zed(코드 에디터)·광고 플랫폼 등이 이미 실 서비스에 통합하고 있다.

NVIDIA의 Shruti Koparkar: “1,000 tokens/sec 돌파는 AI 워크로드 전 스펙트럼을 처리하는 플랫폼의 가능성을 보여준다”


🔧 개발자 도구: 코딩 에이전트 생태계 성숙기

Claude Code Remote Control 공식 출시 (Anthropic)

  • Pro/Max 플랜 대상 Research Preview로 제공
  • 로컬에서 실행 중인 Claude Code 세션을 어디서든(모바일 등) 이어받을 수 있는 기능
  • 개발자가 자리를 뜨거나 다른 기기로 이동해도 에이전트 작업 흐름이 끊기지 않음
  • 의미: 코딩 에이전트가 “항상 켜져 있는” 비서 모델로 전환되는 신호. IDE 종속에서 세션 독립으로의 패러다임 이동

Cloudflare, AI로 Next.js를 1주일 만에 재구현

  • Cloudflare 엔지니어링 팀이 AI 도움을 받아 VineXT(내부 코드명)를 1주일 만에 구현했다는 블로그 포스트가 HN 375포인트 획득
  • Next.js의 핵심 기능을 Workers/Pages 환경에 최적화된 형태로 재구현
  • 의미: AI 코딩 도구가 프레임워크 수준의 리빌드를 가능하게 한다는 실증 사례. “1주일 = 수개월” 압축이 현실화

Moonshine: WhisperLargeV3보다 정확한 오픈소스 STT

  • moonshine-ai/moonshine 오픈소스 프로젝트가 HN 상위 노출
  • WhisperLargeV3 대비 높은 정확도를 주장하는 오픈-웨이트 음성인식 모델
  • 개발자가 직접 배포·파인튜닝 가능한 형태로 공개

💰 AI 인프라 투자: 역사상 최대 규모의 자본 유입

빅테크 2026년 AI 투자 총액 $6,500억 전망 (Bridgewater Associates)

  • Bridgewater 분석: 구글·마이크로소프트·아마존·메타 등 빅테크의 2026년 AI 관련 지출 합산이 약 $6,500억에 달할 것으로 추산
  • OpenAI: 2030년까지 컴퓨팅 지출 약 $6,000억 계획. NVIDIA가 $300억 규모 투자 확정에 근접 중이며, 현재 $1,000억 이상의 펀딩 라운드 진행 중

Wayve, $12억 달러 조달 (영국 자율주행)

  • 영국 자율주행 스타트업 Wayve가 Mercedes-Benz, Stellantis, Nissan, Uber 등으로부터 $12억(약 1.7조 원) 투자 유치
  • 로보택시 배포 확대 및 글로벌 완성차 OEM 협력 ADAS 기술 개발에 사용 예정
  • 의미: 테슬라의 FSD, Waymo의 독주 속에서도 유럽발 자율주행 플레이어가 메이저 OEM들의 지원을 등에 업고 존재감을 드러냄

Cohere, IPO 향해 순항 중

  • 엔터프라이즈 AI 스타트업 Cohere가 내부 수익 목표 초과 달성 소식이 투자자 메모로 유출
  • 2026년 유럽 확장 및 AI 에이전트 플랫폼 ‘North’ 강화 계획

🤖 로봇/물리 AI: 인간 노동이 감추어진 진실 (MIT Tech Review)

MIT Tech Review의 심층 분석: “휴머노이드 로봇 뒤에 숨겨진 인간 노동”

  • 샹하이 공장 노동자가 하루 종일 VR 헤드셋과 외골격을 착용한 채 전자레인지 문을 수백 번 개폐 → 옆에 있는 로봇을 훈련시키는 작업
  • Figure AI는 주거용 부동산 운용사 Brookfield와 파트너십을 맺고, 100,000세대 주거공간에서 “대규모 실세계 데이터” 수집 예정
  • 1X Technologies($20,000 Neo 휴머노이드)는 로봇이 막히면 팔로알토 본사 직원이 원격 조종으로 집안일 수행

왜 중요한가: AI가 “자율적으로” 집안일을 한다는 서사 뒤에는 새로운 형태의 플랫폼 노동이 숨어 있다. 우리의 텍스트가 LLM 훈련 데이터가 됐듯, 우리의 신체 움직임이 이제 로봇 훈련 데이터가 된다. 이는 단순한 기술 문제가 아니라 노동·프라이버시·임금 문제다.


🇰🇷 한국/기타 테크 픽

NAVER CLOVA X, 2026년 4월 9일 서비스 종료

  • 2023년 8월 론칭된 CLOVA X(HyperCLOVA X 기반 챗봇)가 약 2.5년 만에 종료
  • NAVER는 CLOVA X를 “실험실”로 운영해왔다고 설명. ChatGPT·Claude 등 글로벌 모델과의 경쟁에서 독립 서비스 포지셔닝이 어려워진 것으로 분석
  • 의미: 국내 LLM 스타트업/빅테크도 소비자 향 AI 챗봇의 독자 생존이 쉽지 않음을 시사. B2B/엔터프라이즈 전환이 가속화될 전망

Apple, 텍사스 휴스턴에 Mac mini 생산 시설 신설

  • 애플이 미국 내 제조 가속화 계획의 일환으로 휴스턴 신규 시설에서 Mac mini 생산 시작 발표
  • HN에서 355개 댓글 폭발 — 미국 제조업 부활 정책과 관세 리스크 헤지 전략 동시 달성 해석

📎 출처


본 뉴스레터는 HoneyHive 뉴스레터벌이 자동 수집·요약했습니다.