Data Commons MCP 서버 공개: AI 애플리케이션을 위한 새로운 데이터 엔진

2025-09-24
Data Commons MCP 서버 공개: AI 애플리케이션을 위한 새로운 데이터 엔진

Google의 Data Commons는 AI 에이전트가 Data Commons의 방대한 공개 데이터 세트에 직접 액세스할 수 있도록 하는 표준화된 인터페이스인 MCP 서버를 공개했습니다. 이를 통해 데이터 액세스가 간소화되고 데이터가 풍부한 AI 애플리케이션의 개발이 가속화되며 대규모 언어 모델의 환각을 줄이는 데 도움이 됩니다. ONE Campaign과의 파트너십을 통해 개발된 ONE Data Agent는 성공적인 사례이며, MCP 서버를 사용하여 수천만 개의 의료 자금 조달 데이터 지점을 신속하게 검색하여 글로벌 헬스 옹호를 강화합니다. MCP 서버는 Google Cloud Platform의 ADK 및 Gemini CLI와 같은 다양한 AI 개발 워크플로우에 원활하게 통합됩니다.

더 보기
AI

Gemini 2.5 Flash Image: Google의 AI 이미지 생성 돌파구

2025-08-26
Gemini 2.5 Flash Image: Google의 AI 이미지 생성 돌파구

Google은 최첨단 이미지 생성 및 편집 모델인 Gemini 2.5 Flash Image를 공개했습니다. 여러 이미지를 결합하거나, 풍부한 스토리텔링을 위해 캐릭터 일관성을 유지하거나, 자연어를 사용하여 정확한 변환을 수행하거나, Gemini의 세계 지식을 활용하여 이미지를 생성 및 편집할 수 있습니다. 가격은 100만 출력 토큰당 30달러(이미지당 약 0.039달러)이며, 개발자는 Gemini API 및 Google AI Studio를 통해, 기업은 Vertex AI를 통해 액세스할 수 있습니다. Google AI Studio의 '빌드 모드'도 크게 업데이트되어 앱 생성이 간소화되었습니다. 주요 기능으로는 캐릭터 일관성, 프롬프트 기반 이미지 편집, 네이티브 세계 지식 등이 있으며, 이미지 생성 및 조작에 새로운 가능성을 열어줍니다.

더 보기
AI

Gemma 3 270M: 소형이지만 강력한 AI 모델, 맞춤형 애플리케이션을 위해

2025-08-14
Gemma 3 270M: 소형이지만 강력한 AI 모델, 맞춤형 애플리케이션을 위해

Gemma 제품군에 새로운 구성원이 추가되었습니다. 바로 특정 작업에 맞는 미세 조정을 위해 설계된 2억 7천만 매개변수의 소형 AI 모델 Gemma 3 270M입니다. Gemma 3 시리즈의 고급 아키텍처를 계승하여 강력한 지시 사항 준수 및 텍스트 구조화 기능을 갖추고 있으며, 전력 소비량이 놀라울 정도로 낮아 Pixel 9 Pro SoC에서 25번의 대화에 불과 0.75%의 배터리만 사용합니다. IFEval 벤치마크에서 뛰어난 지시 사항 준수 능력이 두드러지며, 기기 및 연구 애플리케이션에 대한 고급 AI 기능 접근성을 높입니다. Gemma 3 270M은 감정 분석, 개체 추출 등과 같이 대량의 명확하게 정의된 작업에 탁월하며, 빠른 반복 및 배포가 필요한 시나리오에 이상적입니다. 개발자는 소형 크기를 활용하여 신속한 미세 조정 실험을 수행하고 여러 전문 모델을 생성하여 효율적이고 비용 효과적인 생산 시스템을 구축할 수 있습니다.

더 보기

Gemini Embedding: 차세대 AI 에이전트를 위한 힘

2025-08-01
Gemini Embedding: 차세대 AI 에이전트를 위한 힘

Google의 Gemini Embedding 텍스트 모델은 출시 이후 고급 AI 애플리케이션을 구축하는 개발자들에 의해 빠르게 채택되었습니다. 분류 및 의미 검색과 같은 기존 용도 외에도 '컨텍스트 엔지니어링'에서 중요한 역할을 하며, AI 에이전트에 완벽한 운영 컨텍스트를 제공합니다. Box, re:cap, Everlaw, Roo Code, Mindlid, Interaction Co.와 같은 회사는 이미 제품의 정확성, 속도, 컨텍스트 인식을 개선하기 위해 이 기능을 활용하고 있습니다. 금융 데이터 분석 개선부터 법적 발견 강화, AI 어시스턴트 개선에 이르기까지 Gemini Embedding의 고성능과 다국어 지원은 차세대 지능형 에이전트의 기반을 마련하고 있습니다.

더 보기
AI

Gemini API의 배치 모드: 고처리량 워크로드 지원

2025-07-11
Gemini API의 배치 모드: 고처리량 워크로드 지원

Google의 Gemini API에 배치 모드가 추가되었습니다. 지연 시간이 중요하지 않은 고처리량 작업에 이상적인 비동기 엔드포인트입니다. 대량의 작업을 제출하고 시스템이 처리하도록 하며, 동기 API와 비교하여 50% 할인된 가격으로 24시간 이내에 결과를 가져올 수 있습니다. 미리 준비된 데이터로 즉각적인 응답이 필요 없는 작업에 적합하며, 비용 절감, 처리량 증가, API 호출 간소화를 제공합니다. Reforged Labs는 이를 사용하여 대량의 동영상 광고를 처리하여 효율성을 크게 높이고 비용을 절감했습니다. Google GenAI Python SDK를 사용하면 쉽게 시작할 수 있습니다.

더 보기

Google DeepMind, GenAI Processors 오픈 소스 공개: LLM 애플리케이션 개발 간소화

2025-07-11
Google DeepMind, GenAI Processors 오픈 소스 공개: LLM 애플리케이션 개발 간소화

Google DeepMind는 복잡한 대규모 언어 모델(LLM) 애플리케이션 개발을 간소화하도록 설계된 오픈소스 Python 라이브러리인 GenAI Processors를 출시했습니다. 이 라이브러리는 Processor 인터페이스를 사용하여 다양한 데이터 처리 단계를 추상화하고 비동기 스트림 처리를 통해 다중 모달 입력을 처리하여 동시 실행을 가능하게 하여 응답성과 효율성을 향상시킵니다. GenAI Processors는 Gemini API와 통합되며 라이브 트랜스크립션 및 대화형 에이전트와 같은 실시간 애플리케이션을 구축하기 위한 예제를 제공합니다.

더 보기
개발

Gemma 3n: 강력한 모바일 우선 AI 모델 출시

2025-06-27
Gemma 3n: 강력한 모바일 우선 AI 모델 출시

혁신적인 MatFormer 아키텍처 기반의 강력한 모바일 우선 다중 모드 AI 모델 Gemma 3n이 공식 출시되었습니다! 이미지, 오디오, 비디오, 텍스트 입력을 지원하며, 매우 적은 메모리 공간으로 작동합니다(E2B는 2GB, E4B는 3GB). Gemma 3n은 텍스트 처리에 140개 언어, 다중 모드 이해에 35개 언어를 지원하며, LMArena 점수에서 1300점을 넘는 성과를 달성했습니다. 효율적인 아키텍처와 Per-Layer Embeddings 기술을 통해 다양한 작업에서 뛰어난 성능을 제공하며, 개발자에게 전례 없는 편리성을 제공합니다. 모바일 AI의 새로운 시대를 열었습니다.

더 보기
AI

Google AI Studio: Gemini 2.5 Pro 기반 AI 앱 개발 강화

2025-05-21
Google AI Studio: Gemini 2.5 Pro 기반 AI 앱 개발 강화

Google AI Studio가 주요 업데이트를 통해 Gemini 2.5 Pro 모델을 통합하여 코드 생성 능력이 크게 향상되었습니다. 개발자는 간단한 텍스트, 이미지 또는 비디오 프롬프트를 사용하여 AI 기반 웹 앱을 빠르게 구축하고 배포할 수 있습니다. 새로운 버전에는 Imagen, Lyria RealTime, Veo와 같은 다중 모드 모델이 통합되어 Cloud Run으로의 원클릭 배포, 코드 버전 비교 및 롤백 기능을 제공합니다. 또한 네이티브 오디오 지원 및 URL 컨텍스트 도구가 추가되어 앱의 상호 작용 및 정보 검색 기능이 향상되었습니다.

더 보기

Google, 모바일용 경량 멀티모달 AI 모델 Gemma 3n 공개

2025-05-20
Google, 모바일용 경량 멀티모달 AI 모델 Gemma 3n 공개

Google은 강력한 AI 기능을 모바일 기기에 제공하기 위해 설계된 획기적인 아키텍처 기반의 새로운 오픈 모델 Gemma 3n을 출시했습니다. Gemma 3n은 메모리 사용량 감소 및 빠른 응답 시간을 특징으로 하며, 멀티모달 이해(텍스트, 이미지, 오디오)와 강력한 다국어 기능을 지원합니다. 개발자는 Google AI Studio 및 Google AI Edge를 통해 미리 보기에 액세스하여 실시간 음성 변환, 번역, 이미지 이해 등 Gemma 3n의 기능을 활용한 애플리케이션을 구축할 수 있습니다. 이 모델은 개인 정보 보호를 중시하며 오프라인에서도 작동합니다.

더 보기

Gemini 2.5 Pro 미리보기(I/O 에디션) 조기 출시: 향상된 코딩 기능

2025-05-06
Gemini 2.5 Pro 미리보기(I/O 에디션) 조기 출시: 향상된 코딩 기능

Google은 Gemini 2.5 Pro(I/O 에디션)의 조기 미리보기 버전을 출시했습니다. 특히 프런트엔드 및 UI 개발에서 코딩 기능이 크게 향상되었습니다. WebDev Arena 순위에서 1위를 차지하며, 아름답고 기능적인 웹 앱을 생성할 수 있습니다. 주요 개선 사항으로는 비디오를 코드로 변환하는 기능, 더욱 쉬운 기능 개발, 아이디어에서 작동하는 앱으로의 더욱 빠른 워크플로우 등이 있습니다. 개발자는 Google AI Studio의 Gemini API 또는 엔터프라이즈 사용자를 위한 Vertex AI를 통해 액세스할 수 있습니다. 이 업데이트에서는 이전 버그 수정 및 함수 호출 신뢰성 향상도 포함됩니다.

더 보기
AI

Gemma 3: 최첨단 AI를 당신의 데스크탑으로

2025-04-20
Gemma 3: 최첨단 AI를 당신의 데스크탑으로

최첨단 오픈소스 AI 모델인 Gemma 3는 처음에는 하이엔드 GPU가 필요했습니다. 접근성을 높이기 위해, 양자화 인식 학습(QAT)으로 최적화된 새로운 버전이 출시되었습니다. QAT를 통해 메모리 요구 사항이 크게 줄어들면서 고품질이 유지됩니다. 이를 통해 NVIDIA RTX 3090과 같은 소비자용 GPU에서 Gemma 3 27B와 같은 강력한 모델을 실행할 수 있습니다. 이러한 최적화된 모델은 Hugging Face와 Kaggle에서 제공되며, 다양한 워크플로우에 쉽게 통합할 수 있습니다.

더 보기

Google, 제어 가능한 추론 기능을 갖춘 새로운 AI 모델 Gemini 2.5 Flash 공개

2025-04-17
Google, 제어 가능한 추론 기능을 갖춘 새로운 AI 모델 Gemini 2.5 Flash 공개

Google은 제어 가능한 추론 기능을 갖춘 새로운 대규모 언어 모델 Gemini 2.5 Flash를 공개했습니다. 인기 있는 2.0 Flash를 기반으로 속도와 비용 효율성을 우선시하면서 추론 능력을 크게 향상시켰습니다. 개발자는 '생각 예산'을 설정하여 품질, 비용, 대기 시간의 균형을 맞출 수 있습니다. 이 모델은 프롬프트의 복잡성에 따라 생각 과정을 자동으로 조정하며, 생각 없음부터 집중적인 추론까지 다양한 모드를 제공합니다. Gemini 2.5 Flash는 LMArena의 Hard Prompts에서 뛰어난 성능을 보였으며, 가격 대비 성능이 뛰어나 가장 비용 효율적인 생각 모델 중 하나입니다.

더 보기

Agent2Agent (A2A): AI 에이전트 상호 운용성의 새로운 시대

2025-04-09
Agent2Agent (A2A): AI 에이전트 상호 운용성의 새로운 시대

Google은 서로 다른 공급업체에서 구축하거나 서로 다른 프레임워크를 사용하는 AI 에이전트 간의 원활한 협업을 가능하게 하는 개방형 프로토콜 Agent2Agent(A2A)를 출시했습니다. 50개 이상의 기술 파트너와 서비스 제공업체의 지원을 받는 A2A는 안전한 정보 교환과 조정된 작업을 가능하게 하여 생산성을 높이고 비용을 절감합니다. 기존 표준을 기반으로 구축된 A2A는 여러 모달리티를 지원하고, 보안을 우선시하며, 장기 실행 작업을 처리합니다. 사용 사례는 채용 프로세스(예: 후보자 소싱 및 면접 일정 설정) 자동화에서 다양한 엔터프라이즈 애플리케이션 전반의 복잡한 워크플로 최적화까지 다양합니다. 오픈소스 특성으로 인해 협업적인 AI 에이전트의 번창하는 생태계를 조성합니다.

더 보기

Gemini 2.0 Flash: 구글의 네이티브 이미지 생성 모델, 개발자 실험 단계 진입

2025-03-12
Gemini 2.0 Flash: 구글의 네이티브 이미지 생성 모델, 개발자 실험 단계 진입

구글이 향상된 추론 및 자연어 이해 기능을 갖춘 멀티모달 AI 모델인 Gemini 2.0 Flash를 출시했습니다. 텍스트로부터 이미지를 생성하고, 일러스트가 포함된 스토리를 만들며, 대화형 이미지 편집을 지원하고, 긴 텍스트 시퀀스도 선명하게 렌더링합니다. Google AI Studio 및 Gemini API를 통해 사용 가능하며, AI 에이전트 및 시각적으로 풍부한 애플리케이션 개발에 흥미로운 가능성을 제공합니다.

더 보기
AI