경제

구글, 온디바이스 AI 확장하며 오픈 웨이트 모델 '젬마4' 공개

신은성 기자
입력

구글이 클라우드에서 디바이스로 AI 실행 환경을 확장하며 오픈 웨이트 인공지능 모델 '젬마4'를 공개했다. 

 

스마트폰부터 워크스테이션까지 다양한 하드웨어에서 복잡한 추론과 자율형 에이전트 구현이 가능해지면서 온디바이스 AI 확산과 오픈 모델 생태계 변화에 큰 영향을 줄 것으로 예상된다.

 

구글 딥마인드는 2일(현지시간) 공식 블로그를 통해 '젬마4'를 공개했다. 이번 모델은 '제미나이3'와 동일 계열의 연구 및 기술을 기반으로 개발됐으며 로컬 환경에서 고급 AI 기능을 수행할 수 있도록 설계했다.

 

'젬마4'는 이펙티브 2B(E2B), 이펙티브 4B(E4B), 26B 전문가 혼합(Mixture of Experts, MoE), 31B 덴스(Dense) 등 4종으로 구성된다. 

 

E2B와 E4B 모델은 안드로이드 스마트폰과 라즈베리파이 등 경량 디바이스에 최적화됐으며 배터리와 메모리 제약 환경에서도 AI를 실행할 수 있도록 설계했다. 

 

반면 26B MoE와 31B 덴스 모델은 워크스테이션급 환경에서 고성능 추론을 수행하도록 설계해 디바이스부터 고성능 컴퓨팅 환경까지 폭넓은 계층을 아우른다.

 

26B MoE 모델은 추론 과정에서 약 38억 개의 파라미터만 활성화하는 구조를 통해 처리 속도를 높이면서도 대형 모델 수준의 성능을 유지하도록 설계했다. 31B 모델은 품질 중심 구조로 고도화된 추론 능력을 제공한다.

 

'젬마4'는 단순 대화형 모델을 넘어 실제 작업 수행을 지원하는 '에이전트형 AI' 구현을 핵심 방향으로 제시했다. 

 

이 모델은 함수 호출과 구조화된 JSON(Javascript Object Notation) 출력 기능을 네이티브로 지원해 외부 도구 및 API와 연동한 다단계 작업 수행이 가능하다고 한다. 이는 AI가 정보 생성에서 실행 중심으로 진화하고 있음을 보여주는 변화다.

 

또한 모든 모델이 이미지와 비디오 입력을 처리할 수 있으며 E2B와 E4B 모델은 오디오 입력을 지원해 기기 내 음성 이해 기능을 제공한다.

 

구글은 개발자 생태계를 제한 없이 지원하기 위해 상업적으로 자유로운 아파치(Apache) 2.0 라이선스로 공개했다며 데이터와 인프라, 모델에 대한 통제권을 개발자에게 제공하는 것이 목표라고 밝혔다.

 

'젬마4'는 모델 가중치를 공개하는 오픈 웨이트 형태로 제공되면서 기업과 개발자가 자체 인프라에서 AI를 직접 구축·운영할 수 있는 기반을 제공한다. 이에 따라 클라우드 의존도를 낮추고 비용 구조를 재편하는 한편, 기업 맞춤형 AI 개발과 데이터 통제 요구가 높은 산업을 중심으로 활용이 확대될 가능성이 제기된다. 모델은 구글 클라우드를 비롯해 허깅페이스, 캐글, 올라마 등 다양한 플랫폼에서 제공된다.

 

'젬마4'의 출시는 오픈 모델 경쟁 구도에도 변화를 예고한다. 기존 메타 '라마(Llama)' 시리즈에 더해 알리바바 '큐웬(Qwen)', 즈푸AI 'GLM', 문샷AI '키미(Kimi)' 등 중국 기업 모델이 빠르게 부상하는 가운데 구글은 성능 대비 효율성과 온디바이스 실행을 결합한 전략으로 차별화를 시도했다.

 

'젬마4'는 구글의 기존 대형 모델 '제미나이'와 병행되는 전략적 포지션을 갖는다는 점도 눈여겨볼 요소다. '제미나이'가 클라우드 기반 초대형 모델 역할을 담당하는 반면, '젬마'는 로컬 및 경량 환경을 맡는 식이다. 구글은 이를 통해 클라우드와 디바이스를 아우르는 AI 플랫폼 전략을 구축하고 있다.

 

'젬마4'는 오픈모델의 성능 고도화와 온디바이스 AI 확산, 에이전트 기반 자동화를 동시에 겨냥한 모델로 평가된다. 이는 AI 활용 방식이 중앙 서버 중심에서 분산형 구조로 이동하고 있음을 보여주는 흐름으로, 향후 기업의 AI 도입 전략과 비용 구조에도 변화를 가져올 가능성이 제기된다.

 

업계 전문가는 고성능 AI를 클라우드 밖으로 확장해 디바이스까지 끌어내린 모델이라며 손바닥 크기의 컴퓨터에서도 복잡한 추론이 가능한 수준까지 발전했다는 점에서 앞으로 AI 경쟁은 성능뿐 아니라 어디에서 실행되느냐가 핵심 변수로 작용할 것이라고 말했다.

신은성 기자
share-band
밴드
URL복사