미드저니, 첫 AI 하드웨어 출시 예고… 초대장 발송 시작
Key Points
- 1미드저니 창립자 데이비드 홀츠가 첫 번째 하드웨어 출시 행사를 위한 초대장 발송을 공식화했습니다.
- 2소프트웨어 중심의 이미지 생성 서비스에서 물리적 하드웨어 시장으로의 사업 영역 확장을 의미합니다.
- 3구체적인 제품 사양은 공개되지 않았으나 AI 창작 워크플로우를 혁신할 전용 디바이스로 추측됩니다.
- 4AI 에이전트 및 전용 하드웨어 열풍 속에서 미드저니만의 독자적인 사용자 경험 제공이 기대됩니다.
- 5이번 런칭은 미드저니 생태계를 온디바이스 및 물리적 인터페이스로 확장하는 중요한 분기점이 될 전망입니다.
이미지 생성 인공지능(AI) 분야의 선구적인 기업 미드저니(Midjourney)가 가상 세계를 넘어 물리적 디바이스 시장으로의 진출을 본격화합니다. 미드저니의 창립자 데이비드 홀츠(David Holz)는 최근 자신의 SNS를 통해 첫 번째 하드웨어 런칭 행사를 위한 초대장 발송을 시작했다고 밝혔습니다.
이번 하드웨어 출시는 미드저니가 소프트웨어 서비스를 넘어 독자적인 생태계를 구축하려는 전략의 일환으로 풀이됩니다. 현재까지 해당 디바이스의 구체적인 형태나 기능, 하드웨어 사양에 대해서는 철저히 베일에 싸여 있으나, 업계에서는 미드저니의 강력한 이미지 생성 역량을 극대화할 수 있는 전용 컨트롤러나 디스플레이 장치, 혹은 온디바이스 추론에 최적화된 하드웨어일 가능성을 제기하고 있습니다.
데이비드 홀츠는 "첫 하드웨어 출시를 위한 초대장을 보내기 시작했으며, 아직 초대받지 못한 주요 관계자들은 연락을 달라"고 언급하며 출시가 임박했음을 시사했습니다. 이는 AI 모델 개발사들이 최근 휴메인(Humane)의 AI 핀이나 래빗(Rabbit) R1과 같이 전용 하드웨어를 통해 사용자 경험을 혁신하려는 흐름과 궤를 같이하는 행보로 보입니다.
미드저니의 하드웨어 진출은 AI 엔지니어들에게도 시사하는 바가 큽니다. 모델의 경량화 및 하드웨어 최적화 기술이 어떻게 실제 제품에 구현될지, 그리고 미드저니의 생성 워크플로우가 물리적 인터페이스와 어떻게 결합될지가 향후 관전 포인트가 될 전망입니다. 행사의 구체적인 일정과 제품 상세 정보는 초대장을 받은 관계자들을 중심으로 순차적으로 공개될 것으로 보입니다.
구글, 70개 이상 언어 지원하는 실시간 음성 번역 오디오 모델 'Gemini 3.5 Live Translate' 출시
구글이 70개 이상의 언어를 지원하는 실시간 음성-음성 번역 모델 'Gemini 3.5 Live Translate'를 출시했습니다. 화자의 억양과 속도를 유지하며 지속적으로 음성을 생성해 지연 시간을 최소화한 것이 특징입니다. 개발자는 Gemini Live API를 통해, 기업은 Google Meet을 통해 워크플로우에 통합할 수 있습니다.
앤스로픽, 차세대 SOTA 모델 '클로드 페이블 5' 및 '미토스 5' 전격 출시
앤스로픽이 기존 오퍼스(Opus) 클래스를 뛰어넘는 최상위 모델 '클로드 페이블 5'와 전문가용 '미토스 5'를 출시했습니다. 에이전트 코딩, 비전, 긴 문맥 처리에서 압도적인 SOTA 성능을 달성했으며, 민감한 프롬프트를 기존 모델(오퍼스 4.8)로 우회 처리하는 강력한 자체 안전 분류기를 도입했습니다.
구글, 실시간 음성 통역 모델 '제미나이 3.5 라이브 트랜슬레이트' 전격 출시
구글이 70개 이상의 언어를 실시간으로 지원하며 화자의 억양과 감정까지 보존하는 차세대 음성 번역 모델 '제미나이 3.5 라이브 트랜슬레이트'를 공개했습니다. 개발자들은 제미나이 라이브 API를 통해 이 기술을 즉시 활용할 수 있습니다.
