Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

Data Commons MCP 服务器公开发布：AI 应用的新数据引擎

2025-09-24

Data Commons MCP 服务器公开发布：AI 应用的新数据引擎

谷歌Data Commons发布了MCP服务器，这是一个标准化的接口，允许AI代理直接访问Data Commons的大型公共数据集。这简化了数据访问，加速了数据密集型AI应用的开发，并有助于减少大型语言模型的幻觉。通过与ONE Campaign合作开发的ONE Data Agent就是一个成功案例，它利用MCP服务器快速搜索数千万个健康融资数据点，为全球健康倡导提供了有力工具。MCP服务器易于集成到各种AI开发工作流程中，例如Google Cloud Platform的ADK和Gemini CLI。

(developers.googleblog.com)

AI

Gemini 2.5 Flash Image：谷歌AI图像生成新突破

2025-08-26

Gemini 2.5 Flash Image：谷歌AI图像生成新突破

谷歌发布了Gemini 2.5 Flash Image，一款先进的图像生成和编辑模型。它能够融合多张图片、保持角色一致性、通过自然语言进行精准变换，并利用Gemini的世界知识进行图像生成和编辑。该模型价格为每百万输出token 30美元，每个图像约为1290个输出token。开发者可以通过Gemini API和Google AI Studio，企业用户则可以通过Vertex AI访问该模型。Google AI Studio的“构建模式”也进行了重大更新，方便用户快速测试和构建自定义AI应用。Gemini 2.5 Flash Image 具有角色一致性保持、基于提示的图像编辑和本地世界知识等功能，为图像生成和编辑带来了新的可能性。

(developers.googleblog.com)

AI

Gemma 3 270M：小巧高效的AI模型，助力开发者构建定制化应用

2025-08-14

Gemma 3 270M：小巧高效的AI模型，助力开发者构建定制化应用

Gemma家族迎来新成员——Gemma 3 270M，这是一个仅有2.7亿参数的小型AI模型，专为特定任务微调而设计。它继承了Gemma 3系列的先进架构，具备强大的指令遵循和文本结构化能力，同时拥有极低的功耗，在Pixel 9 Pro SoC上进行25次对话仅消耗0.75%的电池电量。其强大的指令遵循能力使其在IFEval基准测试中表现出色，为边缘设备和研究应用带来了更便捷的先进AI能力。Gemma 3 270M非常适合高容量、明确定义的任务，如情感分析、实体提取等，也适用于需要快速迭代和部署的场景。开发者可以利用其快速进行微调实验，创建一系列小型专用模型，高效且经济地构建生产系统。

(developers.googleblog.com)

AI

Gemini Embedding：赋能下一代AI智能体

2025-08-01

Gemini Embedding：赋能下一代AI智能体

谷歌Gemini Embedding文本模型自发布以来，已被广泛应用于构建各种AI应用。它不仅用于传统的分类、语义搜索和检索增强生成等任务，更在“上下文工程”中发挥关键作用，帮助AI智能体理解完整操作上下文。Box、re:cap、Everlaw、Roo Code、Mindlid和Interaction Co.等公司已将其用于提升各自产品的性能，例如提高信息检索准确率、加快处理速度、增强AI助手的情境感知能力等。Gemini Embedding凭借其高性能和多语言支持，正成为构建下一代AI智能体的基石。

(developers.googleblog.com)

AI Gemini Embedding

Google URL Shortener 将于 2025 年 8 月 25 日关闭

2025-07-25

Google URL Shortener 将于 2025 年 8 月 25 日关闭

Google 宣布将于 2025 年 8 月 25 日关闭其 URL Shortener 服务 (goo.gl)。从 2024 年 8 月 23 日起，部分 goo.gl 链接将显示通知页面，提示用户该链接将在 2025 年 8 月 25 日后失效。Google 建议开发者迁移到其他 URL 短链接服务。通过 Google 应用生成的 goo.gl 链接将继续有效。

(developers.googleblog.com)

开发 URL Shortener

Gemini API批量模式：高效处理大规模任务

2025-07-11

Gemini API批量模式：高效处理大规模任务

Google Gemini API推出批量模式，以异步方式处理高吞吐量、非延迟关键型工作负载。此模式允许提交大型作业，并以标准价格5折的优惠价格在24小时内检索结果。它适用于预先准备好数据且无需立即响应的任务，可降低成本、提高吞吐量并简化API调用。Reforged Labs利用此模式处理海量视频广告，显著降低成本并提高效率。开发者可通过Google GenAI Python SDK轻松使用该功能。

(developers.googleblog.com)

开发异步处理

Google DeepMind开源GenAI Processors：简化大型语言模型应用开发

2025-07-11

Google DeepMind开源GenAI Processors：简化大型语言模型应用开发

Google DeepMind发布了开源Python库GenAI Processors，旨在简化构建复杂的大型语言模型（LLM）应用。该库使用Processor接口抽象了各种数据处理步骤，并通过异步流处理方式处理多模态输入，支持并发执行，从而提高响应速度和效率。GenAI Processors与Gemini API集成，并提供构建实时应用的示例，例如实时语音转录和问答系统。

(developers.googleblog.com)

开发

Gemma 3n：强大的移动端AI模型全面发布

2025-06-27

Gemma 3n：强大的移动端AI模型全面发布

Gemma 3n，一款面向移动端的强大多模态AI模型正式发布！它基于创新的MatFormer架构，支持图像、音频、视频和文本等多种输入，并能以极低的内存占用运行（E2B仅需2GB，E4B仅需3GB）。Gemma 3n支持140种语言的文本处理和35种语言的多模态理解，并在LMArena上取得了超过1300的成绩。其高效的架构和Per-Layer Embeddings技术，使其在各种任务中表现出色，为开发者提供了前所未有的便利，并开启了移动端AI的新纪元。

(developers.googleblog.com)

AI

Google AI Studio：Gemini 2.5 Pro赋能的AI应用开发利器

2025-05-21

Google AI Studio：Gemini 2.5 Pro赋能的AI应用开发利器

Google AI Studio迎来重大更新，集成Gemini 2.5 Pro模型，显著提升代码生成能力。开发者可通过简单的文本、图片或视频提示，快速构建和部署AI驱动型网页应用。新版本还整合了Imagen、Lyria RealTime和Veo等多模态模型，支持一键部署至Cloud Run，并提供便捷的代码版本比较和回滚功能。此外，新增原生音频支持和URL Context工具，进一步增强了应用的交互性和信息获取能力。

(developers.googleblog.com)

开发 Google AI Studio

谷歌发布Gemma 3n：轻量级、多模态的移动端AI模型

2025-05-20

谷歌发布Gemma 3n：轻量级、多模态的移动端AI模型

谷歌发布了新的开放模型Gemma 3n，它基于一种全新的架构，旨在将强大的AI能力带到移动设备上。Gemma 3n 拥有更低的内存占用和更快的响应速度，支持多模态理解（文本、图像、音频），并具备强大的多语言能力。开发者可以通过Google AI Studio和Google AI Edge访问预览版，并开始构建基于Gemma 3n的应用，例如实时语音转录、翻译和图像理解等。该模型注重隐私保护，可以在离线状态下运行。

(developers.googleblog.com)

AI 移动端AI

Gemini 2.5 Pro预览版震撼发布：AI代码能力再升级

2025-05-06

Gemini 2.5 Pro预览版震撼发布：AI代码能力再升级

谷歌提前发布了Gemini 2.5 Pro预览版（I/O版），该版本在编码能力上有了显著提升，尤其在前端和UI开发方面表现突出。它在WebDev Arena排行榜上排名第一，能够生成美观且功能强大的网页应用。Gemini 2.5 Pro可以将视频转换成代码，简化特性开发，快速将概念转化为可工作的应用程序。开发者可以使用Google AI Studio中的Gemini API或企业客户使用的Vertex AI来构建应用。此次更新还修复了之前的错误，并提高了函数调用的触发率。

(developers.googleblog.com)

AI

Gemma 3：让高性能AI模型触手可及

2025-04-20

Gemma 3：让高性能AI模型触手可及

Gemma 3，一款先进的开放式AI模型，最初需要高端GPU才能运行。为了提升其易用性，研究人员推出了经过量化感知训练（QAT）优化的版本。QAT 通过降低模型精度来减少内存需求，使得Gemma 3 27B 可以在消费级GPU（如RTX 3090）上运行。这标志着高性能AI模型向大众普及迈出了重要一步，开发者可以使用Hugging Face、Kaggle等平台轻松获取并集成这些模型。

(developers.googleblog.com)

AI 量化感知训练

Gemini 2.5 Flash：谷歌推出具有可控推理能力的全新AI模型

2025-04-17

Gemini 2.5 Flash：谷歌推出具有可控推理能力的全新AI模型

谷歌发布了Gemini 2.5 Flash，一个具有可控推理能力的全新大型语言模型。它在Gemini 2.0 Flash的基础上大幅提升了推理能力，并允许开发者通过设置“思考预算”来平衡质量、成本和延迟。该模型能够根据提示的复杂性自动调整思考过程，并提供从关闭思考到高强度推理的不同模式。Gemini 2.5 Flash在LMArena的Hard Prompts测试中表现出色，性价比极高，是目前最具成本效益的思考型模型之一。

(developers.googleblog.com)

AI Gemini 2.5 Flash 可控推理

Agent2Agent (A2A) 协议：AI 代理互操作性新纪元

2025-04-09

Agent2Agent (A2A) 协议：AI 代理互操作性新纪元

谷歌推出开放协议 Agent2Agent (A2A)，旨在实现 AI 代理之间的互操作性。超过 50 家科技公司和服务提供商参与其中，A2A 允许不同厂商、不同框架构建的 AI 代理进行安全的信息交换和协同行动，从而提升效率并降低成本。A2A 基于现有标准，支持多种模式，并注重安全性和长期任务处理。其应用场景广泛，例如招聘流程自动化，通过协同多个 AI 代理，可以更高效地完成候选人筛选和面试安排等工作。A2A 的开源特性将促进 AI 代理生态系统的繁荣发展。

(developers.googleblog.com)

AI A2A 协议

Gemini 2.0 Flash：谷歌AI原生图像生成模型开放测试

2025-03-12

Gemini 2.0 Flash：谷歌AI原生图像生成模型开放测试

谷歌推出Gemini 2.0 Flash，一个具有多模态输入、增强推理和自然语言理解能力的AI模型，能生成图像。它可以根据文本创作图文结合的故事，进行多轮对话式图像编辑，并生成包含长文本且排版清晰的图像。目前已开放给开发者在Google AI Studio和Gemini API上进行实验性测试，期待开发者们利用其创造出更精彩的应用。

(developers.googleblog.com)

AI Gemini 2.0 Flash

PaliGemma 2：强大的视觉语言模型，简单的微调

2024-12-06

PaliGemma 2：强大的视觉语言模型，简单的微调

谷歌推出了PaliGemma 2，这是Gemma系列中新一代可调视觉语言模型。它在Gemma 2模型的基础上增加了视觉能力，并简化了微调过程以获得最佳性能。PaliGemma 2具有可扩展的性能，提供多种模型尺寸和分辨率，可生成详细的图像描述，并扩展到化学公式识别、乐谱识别、空间推理和胸部X光报告生成等新领域。现有PaliGemma用户可以轻松升级，因为它设计为直接替代品。Hugging Face、Kaggle和官方文档提供了预训练模型、代码和示例笔记本。

(developers.googleblog.com)

11

未分类 Gemma

Keras 创建者 Francois Chollet 告别谷歌，开启职业生涯新篇章

2024-11-14

Keras 创建者 Francois Chollet 告别谷歌，开启职业生涯新篇章

Keras 创建者 Francois Chollet 即将离开谷歌，开启新的职业旅程。Chollet 的离开令谷歌感到惋惜，但谷歌也为他在公司期间的贡献感到自豪，并对他的未来充满期待。Keras 已成为人工智能开发的基石，拥有超过 200 万用户，广泛应用于谷歌内部及全球各种应用。Chollet 将继续致力于 Keras 的未来发展，并监督其发展路线图，谷歌 Keras 团队也将继续与他合作。谷歌将继续投资 Keras 3，并通过 Keras Hub 等工具致力于推动 AI 工具的普及化。

(developers.googleblog.com)

29

未分类 Keras

Project Gameface登陆安卓系统

2024-05-15

Project Gameface登陆安卓系统

在2023年谷歌I/O大会上，谷歌推出了开源的免手动游戏“鼠标”Project Gameface，允许用户通过头部运动和面部表情控制电脑光标。现在，谷歌将更多Project Gameface代码开源，帮助开发者构建安卓应用，使每个安卓设备更易于访问。用户可以通过设备摄像头无缝跟踪面部表情和头部运动，将其转化为直观、个性化的控制方式。

(developers.googleblog.com)

47

未分类