AI가 AI를 만드는 시대: 앤스로픽, '재귀적 자기 개선'과 AI 개발 자동화 현황 공개

Key Points
- 1앤스로픽 내부 코드의 80% 이상이 클로드에 의해 작성되며, 엔지니어 생산성이 2024년 대비 8배 증가함.
- 2AI 모델이 자율적으로 수행 가능한 작업의 길이가 4개월마다 2배씩 늘어나는 가속 추세가 지속됨.
- 3클로드 Mythos Preview는 코드 최적화 실험에서 인간 연구자보다 월등한 '슈퍼휴먼' 성능을 기록함.
- 4자동화된 코드 리뷰 시스템이 기존 프로덕션 버그의 약 1/3을 사전에 탐지할 수 있는 수준에 도달함.
- 5'재귀적 자기 개선'이 가시화됨에 따라 인간의 역할은 '실행'에서 '목표 설정 및 검증'으로 좁혀질 전망임.
앤스로픽(Anthropic)이 AI가 스스로를 개선하고 다음 세대 모델을 개발하는 '재귀적 자기 개선(Recursive Self-improvement)'의 현황과 그에 따른 기술적 임플리케이션을 담은 보고서를 발표했습니다. 과거 인간이 주도하던 AI 개발 사이클의 상당 부분이 현재 AI 시스템으로 이관되고 있으며, 이는 단순히 보조적인 역할을 넘어 모델 훈련, 실험 설계, 코드 리뷰 등 핵심 연구 영역으로 확장되고 있습니다.
앤스로픽의 내부 데이터에 따르면, 2026년 5월 기준 자사 코드베이스에 머지되는 코드의 80% 이상이 클로드(Claude)에 의해 작성되었습니다. 특히 2025년 2월 '클로드 코드(Claude Code)' 출시 이후 엔지니어 1인당 일평균 머지 코드 라인 수는 가파르게 상승하여, 2024년 대비 약 8배의 생산성 향상을 기록했습니다. 이는 AI가 복잡한 환경에서 자율적으로 코드를 실행하고 디버깅하는 능력이 비약적으로 발전했음을 시사합니다.
연구 역량 측면에서도 괄목할만한 성과가 확인되었습니다. AI 안전 연구 과제를 수행하도록 설정된 클로드 에이전트는 가설 수립부터 실험 실행, 결과 분석까지 전 과정을 자율적으로 수행하며 인간 연구자의 성과를 97% 수준까지 재현했습니다. 또한, 실험 최적화 루프에서 클로드 Mythos Preview 모델은 인간보다 수십 배 빠른 속도로 코드 성능을 개선하는 등 '슈퍼휴먼(Superhuman)' 수준의 효율성을 입증했습니다.
앤스로픽은 이러한 가속화가 계속될 경우, 2027년에는 AI가 수 주일이 소요되는 복잡한 과업을 수행할 수 있게 될 것으로 전망합니다. 하지만 이러한 급격한 발전은 인간의 통제 상실이라는 리스크를 수반합니다. 보고서는 AI가 스스로를 구축하는 시대에 대응하기 위해 모니터링, 보안 시스템, 그리고 모델 정렬(Alignment) 연구가 더욱 중요해질 것이라고 강조하며, 필요시 프론티어 AI 개발을 일시 중단하거나 속도를 조절할 수 있는 글로벌 조정 기구의 필요성을 제안했습니다.
텍스트 대신 '레이아웃'으로: 정밀 제어와 SOTA 성능 달성한 이미지 생성 모델 'Reve 2.0' 출시
Reve가 텍스트 프롬프트의 한계를 극복하기 위해 객체의 위치와 크기를 지정하는 '레이아웃' 기반의 이미지 생성 모델 'Reve 2.0'을 출시했습니다. Qwen 모델을 파인튜닝하여 공간 추론 능력을 부여했으며, 10배 적은 연산량으로 벤치마크 최상위권 성능을 기록했습니다.
기업들의 AI 투자 수익률이 기대에 못 미치는 이유 (Bain & Company 분석)
Bain & Company의 2026년 설문조사에 따르면, 다수의 기업이 AI 투자 예산을 늘리고 있으나 실제 비용 절감 효과는 목표치에 미치지 못하고 있습니다. 보고서는 그 원인으로 실제 프로덕션 환경 내 자율형 에이전트의 한계(7%만 완전 자율), 고질적인 데이터 통합 문제, 그리고 기존 워크플로우 부채를 지적하며 조직적 차원의 운영 모델 재설계가 필수적이라고 강조합니다.
AI 예산 증대에도 수익 정체... 베인앤컴퍼니, "데이터·조직 혁신 없는 AI는 실패"
기업들의 AI 투자가 급증하고 있으나 실제 비용 절감 효과는 목표치에 크게 못 미치는 것으로 나타났습니다. 베인앤컴퍼니는 성공적인 AI 전환을 위해 워크플로우 부채 해결과 데이터 접근성 강화를 최우선 과제로 꼽았습니다.
