KirinNews

Zhipu AI, 최신 다국어 LLM 'GLM-5.1' 출시: Llama 3 400B급 성능 및 1M 컨텍스트 지원

Key Points

  • 1GLM-5.1은 Llama 3 400B와 대등하거나 이를 능가하는 벤치마크 성능을 기록했습니다.
  • 2최대 100만 토큰(1M)의 초장문 컨텍스트를 지원하여 대규모 데이터 처리에 최적화되었습니다.
  • 3한국어를 포함한 26개 이상의 다국어 환경에서 추론 및 이해 능력이 대폭 강화되었습니다.
  • 4기존 모델 대비 API 비용을 낮추고 추론 효율을 높여 경제적인 배포가 가능해졌습니다.
  • 5BigModel.ai 플랫폼을 통해 API로 즉시 사용 가능하며 엔지니어링 활용도가 높습니다.
Zhipu AI가 성능과 효율성을 극대화한 GLM-5.1 시리즈를 공개하며, Llama 3 400B와 대등한 벤치마크 성능을 입증했습니다. 특히 100만 토큰에 달하는 초장문 컨텍스트 처리 능력과 한국어를 포함한 다국어 성능에서 압도적인 향상을 보였습니다.

Zhipu AI가 자사의 주력 대형언어모델(LLM)의 최신 버전인 GLM-5.1을 정식 출시하며 AI 엔지니어링 커뮤니티의 주목을 받고 있습니다. 이번 업데이트는 모델 아키텍처의 최적화와 데이터 품질 개선을 통해 기존 모델 대비 추론 속도와 정확도를 동시에 잡았다는 평가를 받습니다. 특히 오픈 소스 진영의 강자인 Llama 3 400B 모델과 대등한 성능을 보이면서도, 특정 벤치마크에서는 이를 상회하는 결과를 보여주어 고성능 LLM 시장의 경쟁을 가속화하고 있습니다.

기술적으로 가장 주목할 만한 점은 1M(100만) 토큰에 달하는 초장문 컨텍스트 윈도우 지원입니다. 이는 수천 페이지의 문서를 한 번에 입력으로 처리할 수 있는 수준으로, 복잡한 문서 분석이나 대규모 코드 베이스에 대한 RAG(검색 증강 생성) 시스템 구축 시 강력한 이점을 제공합니다. 또한 'Needle In A Haystack' 테스트에서 99% 이상의 높은 회수율을 기록하며, 방대한 데이터 내에서 특정 정보를 정확히 찾아내는 능력을 검증받았습니다.

다국어 처리 능력의 비약적인 발전도 눈에 띕니다. GLM-5.1은 한국어를 포함한 26개 이상의 언어에서 인간 수준의 이해력을 목표로 튜닝되었습니다. 이는 단순 번역을 넘어 각 언어의 문화적 맥락과 뉘앙스를 반영하는 추론 능력을 갖추었음을 의미하며, 글로벌 서비스를 개발하는 엔지니어들에게 매력적인 옵션이 될 것으로 보입니다. 또한, API 사용 비용을 기존 대비 대폭 절감하여 고성능 모델의 도입 장벽을 낮춘 점도 특징입니다.

현재 GLM-5.1은 Zhipu AI의 공식 플랫폼인 BigModel.ai를 통해 API 형태로 즉시 사용 가능합니다. 개발자들은 자신의 워크플로우에 맞춰 모델의 규모(Size)를 선택할 수 있으며, 특히 한국어 환경에서의 최적화 성능을 직접 테스트해 볼 수 있는 환경이 조성되었습니다. 이번 출시는 중국 내 로컬 모델의 한계를 넘어 글로벌 수준의 범용 모델로서의 입지를 굳히려는 전략으로 풀이됩니다.

다른 소식들

CIA, 양자 자기계와 AI 결합한 '고스트 머머' 실전 투입… 이란 내 조종사 정밀 추적 및 구조 성공

CIA가 양자 자기계(Quantum Magnetometry)와 AI 신호 처리 기술을 결합한 신기술 '고스트 머머(Ghost Murmur)'를 활용해 이란에 추락한 미 공군 조종사를 구조했습니다. 이 기술은 인간 심장박동의 미세한 전자기 지문을 탐지하고 AI로 배경 소음을 제거하여 수십 마일 밖에서도 위치를 특정할 수 있습니다.

Implementation & EvalModels & ResearchQuantum Computing

바이트댄스 캡컷, 차세대 비디오 생성 AI ‘드리미나 시댄스 2.0’ 미국 시장 전격 출시

바이트댄스의 동영상 편집 플랫폼 캡컷(CapCut)이 고도화된 비디오 생성 모델 ‘드리미나 시댄스 2.0(Dreamina Seedance 2.0)’을 미국 시장에 출시했습니다. 이번 업데이트는 모바일, 데스크톱, 웹을 아우르는 전방위적 통합과 함께 AI 기반의 창작 워크플로우를 대폭 강화한 것이 특징입니다.

Multi-ModalReleaseImage Generation

인텔, 일론 머스크의 '테라팹(Terafab)' AI 칩 프로젝트 합류… 차세대 로보틱스 및 데이터센터 가속화

인텔이 일론 머스크의 SpaceX 및 테슬라와 협력하여 AI 칩 생산 단지인 '테라팹' 프로젝트에 공식 합류했습니다. 이번 파트너십을 통해 인텔은 연간 1테라와트 규모의 컴퓨팅 파워 생산을 목표로 하며, 인텔의 18A 공정 기술이 핵심 역할을 할 것으로 기대됩니다.

GPUInfrastructure & OpsRobotics