Proyecto Gemma: Agradecimientos y Contribuciones del Equipo

2025-09-12
Proyecto Gemma: Agradecimientos y Contribuciones del Equipo

El éxito del proyecto Gemma se debe a los esfuerzos colaborativos de los equipos de Gemma y Google Privacidad. Se agradece especialmente a Peter Kairouz, Brendan McMahan y Dan Ramage por los comentarios en la publicación del blog; a Mark Simborg y Kimberly Schwede por la ayuda con las visualizaciones; y a los equipos de Google que ayudaron con el diseño del algoritmo, la implementación de la infraestructura y el mantenimiento de la producción. La publicación también enumera a 20 personas que contribuyeron directamente al trabajo.

Leer más

Mejorando el ajuste fino de LLM mediante la curación iterativa de datos

2025-08-08
Mejorando el ajuste fino de LLM mediante la curación iterativa de datos

Los investigadores mejoraron significativamente el rendimiento de los modelos de lenguaje grandes (LLM) mediante la curación iterativa de sus datos de entrenamiento. Los experimentos incluyeron dos LLM de diferentes tamaños (Gemini Nano-1 y Nano-2) en tareas de diferente complejidad, utilizando ~100.000 anotaciones de crowdsourcing que inicialmente sufrían un grave desequilibrio de clases (95% benignas). Mediante la curación iterativa de expertos y el ajuste fino del modelo, el rendimiento aumentó sustancialmente. Los modelos alcanzaron aproximadamente el 40% de ejemplos positivos y un Kappa de Cohen de ~0,81 (menor complejidad) y ~0,78 (mayor complejidad), acercándose al rendimiento de nivel experto, lo que destaca el papel crucial de los datos de alta calidad en el entrenamiento de LLM.

Leer más

Alerta temprano de terremotos: la compensación entre velocidad y precisión en la estimación de la magnitud

2025-07-23
Alerta temprano de terremotos: la compensación entre velocidad y precisión en la estimación de la magnitud

Un gran desafío en los sistemas de alerta temprana de terremotos (EEW) es la estimación en tiempo real de la magnitud del terremoto. La magnitud determina el alcance del temblor y quién necesita una alerta. Subestimar el riesgo conlleva avisos perdidos, mientras que sobreestimarlo produce falsas alarmas y erosión de la confianza pública. El desafío clave radica en equilibrar velocidad y precisión; los datos iniciales son limitados, pero retrasar las alertas reduce el tiempo de aviso. En los últimos tres años, hemos mejorado significativamente la estimación de la magnitud, reduciendo el error absoluto mediano de 0,50 a 0,25. Nuestra precisión ahora rivaliza, y en algunos casos supera, a las redes sísmicas establecidas.

Leer más

MUVERA: Recuperación Multi-Vectorial Eficiente

2025-06-26
MUVERA: Recuperación Multi-Vectorial Eficiente

La recuperación de información moderna se basa en modelos de incrustación neuronal, pero si bien los modelos multi-vectoriales ofrecen mayor precisión, su complejidad computacional genera ineficiencia. Los investigadores presentan MUVERA, un nuevo algoritmo que transforma la compleja recuperación multi-vectorial en una búsqueda de producto interno máximo de vector único (MIPS) más simple mediante la construcción de codificaciones dimensionales fijas (FDE). Esto mejora significativamente la eficiencia sin sacrificar la precisión. La implementación de código abierto está disponible en GitHub.

Leer más

Veo Generación 3: Generalización de la Generación de Vídeo

2025-05-16
Veo Generación 3: Generalización de la Generación de Vídeo

El último avance de Google en generación de vídeo, Veo, ahora cuenta con una tercera generación capaz de generalizar en diversas tareas. Entrenado con millones de activos sintéticos 3D de alta calidad, Veo sobresale en la síntesis de nuevas vistas, transformando imágenes de productos en vídeos 360° consistentes. Es importante destacar que este enfoque se generaliza eficazmente en muebles, ropa, electrónica y más, capturando con precisión las complejas interacciones de iluminación y materiales — una mejora significativa con respecto a las generaciones anteriores.

Leer más
IA

Google aumenta la productividad de los desarrolladores con la finalización de código semántico híbrido de ML

2025-05-15
Google aumenta la productividad de los desarrolladores con la finalización de código semántico híbrido de ML

Investigadores de Google han desarrollado un nuevo sistema de finalización de código semántico híbrido basado en Transformer que combina el aprendizaje automático (ML) y los motores semánticos basados en reglas (SE) para mejorar significativamente la productividad de los desarrolladores. El sistema integra ML y SE de tres maneras: 1) reordenando las sugerencias de un solo token de SE usando ML; 2) aplicando finalizaciones de una y varias líneas usando ML y verificando la corrección con SE; y 3) usando la continuación de una y varias líneas por ML de sugerencias semánticas de un solo token. Un estudio de tres meses con más de 10,000 desarrolladores internos de Google mostró una reducción del 6% en el tiempo de iteración de codificación con la finalización de ML de una sola línea. Actualmente, más del 3% del nuevo código se genera al aceptar sugerencias de finalización de ML. El sistema admite ocho lenguajes de programación e incorpora comprobaciones semánticas para garantizar la corrección del código, lo que aumenta significativamente la confianza y la eficiencia del desarrollador.

Leer más

Las incrustaciones de Whisper se alinean sorprendentemente con la actividad cerebral humana durante el habla

2025-03-26
Las incrustaciones de Whisper se alinean sorprendentemente con la actividad cerebral humana durante el habla

Un estudio revela una sorprendente alineación entre el modelo de reconocimiento de voz Whisper de OpenAI y la actividad neuronal en el cerebro humano durante conversaciones naturales. Al comparar las incrustaciones de Whisper con la actividad cerebral en regiones como el giro frontal inferior (IFG) y el giro temporal superior (STG), los investigadores descubrieron que las incrustaciones del lenguaje alcanzaron su punto máximo antes que las incrustaciones del habla durante la producción del habla, y viceversa durante la comprensión. Esto sugiere que Whisper, a pesar de no haber sido diseñado teniendo en cuenta los mecanismos cerebrales, captura aspectos clave del procesamiento del lenguaje. Los hallazgos también destacan una 'jerarquía suave' en el procesamiento del lenguaje cerebral: las áreas de orden superior, como el IFG, priorizan la información semántica y sintáctica, pero también procesan características auditivas de bajo nivel, mientras que las áreas de orden inferior, como el STG, priorizan el procesamiento acústico y fonémico, pero también captan información a nivel de palabras.

Leer más
IA

Investigación innovadora: El equipo detrás del éxito

2025-03-03
Investigación innovadora: El equipo detrás del éxito

Este artículo es el resultado de una estrecha colaboración con Asaf Aharoni, Avinatan Hassidim y Danny Vainstein. El equipo también extiende su gratitud a docenas de individuos de Google Research, Google DeepMind y Google Search, incluyendo a YaGuang Li y Blake Hechtman, por sus revisiones, discusiones perspicaces, comentarios valiosos y apoyo. Sus contribuciones fueron cruciales para la finalización de esta investigación.

Leer más
IA

Avance de la IA de Google: Una lista de agradecimientos revela un esfuerzo de equipo gigante

2025-02-19
Avance de la IA de Google: Una lista de agradecimientos revela un esfuerzo de equipo gigante

Los agradecimientos de este artículo revelan un esfuerzo colaborativo masivo que involucra a numerosos investigadores de Google Research, Google DeepMind y Google Cloud AI, junto con colaboradores de Fleming Initiative, Imperial College London, Houston Methodist Hospital, Sequome y Stanford University. La extensa lista destaca la naturaleza colaborativa de la investigación y agradece a muchos científicos que proporcionaron retroalimentación técnica y experta, así como a numerosos equipos internos de Google que proporcionaron apoyo en productos, ingeniería y gestión. El mero tamaño de los agradecimientos subraya el esfuerzo de equipo masivo detrás de los proyectos de IA a gran escala.

Leer más

¡Impactante! Casi todas las búsquedas binarias y ordenaciones por fusión están rotas

2025-01-11
¡Impactante! Casi todas las búsquedas binarias y ordenaciones por fusión están rotas

El ingeniero de software de Google, Joshua Bloch, reveló un error de casi dos décadas oculto en algoritmos de búsqueda binaria, encontrado tanto en el JDK como en 'Perlas de programación' de Jon Bentley. El error se origina en la línea `int mid = (low + high) / 2;`, causando desbordamiento de enteros y excepciones de índice de matriz fuera de los límites cuando la suma de `low` y `high` excede el valor máximo de entero positivo. Este error solo se manifiesta con conjuntos de datos masivos, lo que lo hace particularmente peligroso en la era del big data. El artículo explora varias soluciones y enfatiza que los errores pueden persistir incluso con pruebas y demostraciones rigurosas, instando a los programadores a mantenerse cautelosos y humildes.

Leer más

Google expande la evaluación del potencial solar global usando imágenes satelitales y aprendizaje automático

2024-12-19
Google expande la evaluación del potencial solar global usando imágenes satelitales y aprendizaje automático

Investigadores de Google han expandido la cobertura de la API Solar de Google Maps Platform en el Sur Global aplicando modelos de aprendizaje automático a imágenes satelitales para generar modelos de superficie digital de alta resolución y mapas de segmentación de techos. Esta innovación supera las limitaciones de los métodos tradicionales de adquisición y procesamiento de datos, proporcionando datos de evaluación del potencial solar para 1250 millones de edificios en todo el mundo y acelerando la adopción de energía renovable a nivel mundial. El proyecto aprovecha los datos satelitales para aumentar la frecuencia de actualización de datos y reducir costos, lo que resulta particularmente beneficioso en regiones con escasez de datos.

Leer más