AI赋能引力波探测:Deep Loop Shaping技术突破

2025-09-05
AI赋能引力波探测:Deep Loop Shaping技术突破

科学家们利用深度学习技术Deep Loop Shaping,显著提升了激光干涉引力波天文台(LIGO)的控制精度,减少了高达100倍的噪声。该技术通过强化学习,优化了LIGO的反馈控制系统,使其能够更稳定地测量引力波,从而帮助天文学家更深入地研究宇宙的动力学和形成过程,例如探测更多中等质量黑洞,并更详细地研究中子星碰撞等事件。这项突破有望推动未来引力波天文台的设计,并进一步扩展我们对宇宙的认知。

阅读更多
科技

怀旧复古:60年代录音室的蓝色精灵

2025-08-26
怀旧复古:60年代录音室的蓝色精灵

一张泛黄的老照片,展现了60年代录音室的场景:两个蓝色的小精灵在控制室里忙碌。大的那个戴着歪斜的耳机,透过隔音玻璃平静地注视着录音棚里的乐手;小的那个则戴着圆形眼镜,坐在凳子上认真地调整磁带录音机的旋钮。温暖的真空管灯光,复杂的调音台,以及照片本身的颗粒感、柔和的焦距和褪色的暖色调,共同营造出浓厚的复古氛围,仿佛带你穿越时空,回到那个充满音乐灵感的年代。

阅读更多

Genie 3:感谢名单与幕后英雄

2025-08-06
Genie 3:感谢名单与幕后英雄

大型语言模型Genie 3的成功离不开众多研究人员和工程师的辛勤付出。这份冗长的感谢名单,致敬了从核心研发到视频制作的各个环节的贡献者,展现了团队合作的巨大力量,也体现了AI项目成功的背后往往需要一个庞大的支持网络。

阅读更多
AI

Gemini Deep Think:攻克国际数学奥林匹克竞赛难题

2025-07-22
Gemini Deep Think:攻克国际数学奥林匹克竞赛难题

谷歌DeepMind团队利用先进的Gemini Deep Think模型成功解决了国际数学奥林匹克竞赛(IMO)的难题。该项目由众多工程师和数学专家共同完成,历经模型训练、推理优化等多个阶段。团队感谢IMO组织、众多贡献者以及谷歌内部团队的支持,并强调IMO仅验证了答案的正确性,而非系统的有效性。

阅读更多
AI

AlphaGenome:AI 解锁基因组奥秘

2025-06-27
AlphaGenome:AI 解锁基因组奥秘

Google DeepMind 推出 AlphaGenome,一款利用 AI 预测人类 DNA 变异对基因调控影响的工具。该模型能够处理长达百万碱基对的 DNA 序列,并预测多种分子特性,包括基因起始和终止位置、剪接位点、RNA 产量以及 DNA 碱基可及性等。AlphaGenome 在多个基准测试中取得了最先进的性能,能够高效地评估基因变异的影响,并为研究人员提供更全面的基因调控信息。目前 AlphaGenome API 已开放供非商业研究使用,有望推动基因组学和医疗保健领域的重大发现。

阅读更多
AI

大型语言模型能力评估:价格与表现分析

2025-06-05
大型语言模型能力评估:价格与表现分析

这份报告评估了大型语言模型在多个领域的性能,包括推理、科学、数学、代码生成、多语言能力等。结果显示,模型在不同任务上的表现差异巨大,例如在科学和数学推理方面表现出色,但在代码生成和长文本处理方面则相对较弱。此外,报告还分析了不同模型的定价策略,并指出模型的性能与其价格之间并非简单的线性关系。

阅读更多

Google DeepMind发布Music AI Sandbox和Lyria 2:AI音乐创作的里程碑

2025-04-25
Google DeepMind发布Music AI Sandbox和Lyria 2:AI音乐创作的里程碑

Google DeepMind团队近日发布了两个重磅AI音乐项目:Music AI Sandbox和Lyria 2。这两个项目由数十位工程师和研究人员共同开发,汇集了来自DeepMind、Alphabet以及YouTube团队的智慧。Music AI Sandbox和Lyria 2代表着AI音乐创作领域的重大突破,将为音乐创作带来新的可能性,并为音乐产业带来新的变革。

阅读更多
AI

Google DeepMind发布Gemini Robotics:赋能下一代机器人

2025-03-12
Google DeepMind发布Gemini Robotics:赋能下一代机器人

Google DeepMind发布了基于Gemini 2.0的两个新AI模型:Gemini Robotics和Gemini Robotics-ER,它们能够让机器人执行更广泛的现实世界任务。Gemini Robotics是一个先进的视觉-语言-动作模型,能够直接控制机器人;Gemini Robotics-ER则具有先进的空间理解能力,允许机器人专家使用Gemini的具身推理能力运行他们自己的程序。这两个模型都具有通用性、交互性和灵活性,能够处理各种任务和环境,并与人类更好地协作。DeepMind还发布了一个新的数据集ASIMOV,用于评估和改进具身AI和机器人的语义安全性,并与Apptronik等公司合作开发下一代人形机器人。

阅读更多

Google DeepMind发布Veo 2:AI视频生成技术新突破

2024-12-16
Google DeepMind发布Veo 2:AI视频生成技术新突破

Google DeepMind近日发布了其最新AI视频生成模型Veo 2,该模型在逼真度、细节和运动表现方面取得了显著进步,能够根据复杂的指令生成高质量的4K视频。Veo 2超越了其他领先的AI视频生成模型,其生成视频的真实感和对指令的准确遵循能力都得到了提升。从极近景拍摄的DJ特写到展现细腻物理效果的美食场景,Veo 2展现了其在不同风格和场景下的强大能力,标志着AI视频生成技术迈入了新的里程碑。

阅读更多

Genie 2:谷歌DeepMind推出大规模基础世界模型

2024-12-05
Genie 2:谷歌DeepMind推出大规模基础世界模型

谷歌DeepMind发布了Genie 2,这是一个可以生成无限多样3D环境的基础世界模型,用于训练和评估具身代理。Genie 2基于单张图片提示,即可生成可由人类或AI代理通过键盘和鼠标进行交互的世界。该模型具有多种涌现能力,例如物体交互、角色动画、物理效果等,并能生成长达一分钟的连贯世界。Genie 2还可以用于快速原型设计,方便研究人员测试新的环境和训练AI代理。

阅读更多
未分类 3D环境

拓展音频生成技术前沿

2024-10-30
拓展音频生成技术前沿

谷歌DeepMind正在推进音频生成技术,开发出能够根据文本、节奏控制和特定声音等输入创建高质量自然语音的模型。该技术已应用于Gemini Live、Project Astra、Journey Voices和YouTube的自动配音等谷歌产品中,为用户带来更自然、更具对话性和直观性的数字助理和AI工具体验。最新研究成果可以生成2分钟的多人对话,音质更好,说话人一致性更强,且生成速度更快。此外,谷歌还开发了一种新的语音编解码器,在不影响输出质量的情况下,能将音频压缩成每秒低至600位的令牌序列,并结合Transformer架构和大量语音数据训练,实现了更长、更自然的对话生成。同时,SynthID技术也被用于水印AI生成的音频内容,以防止技术滥用。未来,谷歌将致力于提高模型的表现力、音质,并添加更多对韵律等特征的细粒度控制,探索如何将其与视频等其他模态结合。

阅读更多
未分类

AlphaChip 如何变革计算机芯片设计

2024-09-28
AlphaChip 如何变革计算机芯片设计

谷歌DeepMind的AlphaChip是一种强化学习方法,用于设计芯片布局,可以加速和优化芯片设计。AlphaChip已被用于设计谷歌定制AI加速器TPU的最新三代中的超人类芯片布局。AlphaChip的工作原理类似于AlphaGo和AlphaZero,它将芯片布局设计视为一种游戏,并通过放置电路组件并根据最终布局的质量获得奖励来学习。AlphaChip已被证明可以生成优于人类设计的布局,并已应用于各种芯片设计,包括谷歌的TPU、Axion处理器和MediaTek的Dimensity旗舰5G芯片。

阅读更多
未分类 AlphaChip

AlphaProteo:谷歌DeepMind发布用于生物和健康研究的新型蛋白质生成AI系统

2024-09-06
AlphaProteo:谷歌DeepMind发布用于生物和健康研究的新型蛋白质生成AI系统

谷歌DeepMind发布了AlphaProteo,这是一个用于设计新型蛋白质的AI系统,能够生成与目标分子成功结合的蛋白质,可用于药物设计、疾病理解等领域。AlphaProteo在七种目标蛋白质上取得了比现有方法高3到300倍的结合亲和力,并已成功设计出针对多种目标蛋白质的结合剂,包括与癌症和糖尿病并发症相关的VEGF-A。

阅读更多

AI 在解决国际数学奥林匹克竞赛问题上达到银牌水平

2024-07-25
AI 在解决国际数学奥林匹克竞赛问题上达到银牌水平

Google DeepMind 开发的新型人工智能系统 AlphaProof 和 AlphaGeometry 2 在解决高级数学推理问题方面取得了突破,在今年的国际数学奥林匹克竞赛(IMO)中解决了六道题中的四道,首次达到了银牌选手的水平。AlphaProof 擅长形式数学推理,而 AlphaGeometry 2 则专注于解决几何问题。这些系统经过大量训练数据的训练,能够理解和解决复杂的数学问题,标志着人工智能在数学推理领域的重大进步。

阅读更多
未分类 AlphaGeometry

谷歌 DeepMind 推出全新视频转音频技术 V2A

2024-06-21
谷歌 DeepMind 推出全新视频转音频技术 V2A

谷歌 DeepMind 团队研发了一种名为 V2A 的视频转音频技术,可以根据视频画面和文字提示生成与之匹配的音效、配乐和对话。该技术采用了扩散模型,能够理解原始像素并根据文字提示生成同步且逼真的音频。V2A 可应用于为无声电影、历史影像等生成音轨,并能根据用户需求进行调整。目前该技术仍在进一步研究中,以解决音频质量依赖视频质量、唇形同步等问题。

阅读更多
未分类

Gemini Flash:谷歌DeepMind推出的轻量级模型

2024-05-14
Gemini Flash:谷歌DeepMind推出的轻量级模型

Gemini Flash是谷歌DeepMind最新推出的轻量级AI模型,主打速度和效率。它拥有高达一百万个token的上下文窗口,能够处理一小时的视频、11小时的音频以及超过3万行代码。Flash在大多数常见任务上,能以更低的成本实现与大型模型相当的质量,并且平均首个token延迟低于一秒。

阅读更多
未分类 模型

Veo:谷歌 DeepMind 最强大的生成视频模型

2024-05-14
Veo:谷歌 DeepMind 最强大的生成视频模型

Veo是谷歌DeepMind迄今为止功能最强大的视频生成模型,能够生成高质量、1080p分辨率、时长超过一分钟的视频,并涵盖各种电影和视觉风格。它能够准确捕捉提示的细微差别和语气,并提供前所未有的创意控制水平,理解各种电影效果的提示,例如延时摄影或景观航拍。Veo将帮助创建让每个人都能制作视频的工具,为故事讲述、教育等领域开启新的可能性。

阅读更多
未分类 DeepMind