Webtagr - Résumé de news de technologie

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

Le serveur MCP de Data Commons est lancé publiquement : un nouveau moteur de données pour les applications d'IA

2025-09-24

Le serveur MCP de Data Commons est lancé publiquement : un nouveau moteur de données pour les applications d'IA

Data Commons de Google a publié son serveur MCP, une interface standardisée permettant aux agents d'IA d'accéder directement aux vastes ensembles de données publiques de Data Commons. Cela simplifie l'accès aux données, accélère le développement d'applications d'IA riches en données et contribue à réduire les hallucinations des grands modèles de langage. Un exemple réussi est l'agent ONE Data, développé en partenariat avec ONE Campaign, qui utilise le serveur MCP pour rechercher rapidement des dizaines de millions de points de données de financement de la santé, renforçant ainsi le plaidoyer pour la santé mondiale. Le serveur MCP s'intègre parfaitement aux différents workflows de développement d'IA, tels que l'ADK et le Gemini CLI de Google Cloud Platform.

(developers.googleblog.com)

IA

Gemini 2.5 Flash Image : La percée de Google en matière de génération d’images par IA

2025-08-26

Gemini 2.5 Flash Image : La percée de Google en matière de génération d’images par IA

Google a dévoilé Gemini 2.5 Flash Image, un modèle de pointe pour la génération et l’édition d’images. Il permet de fusionner plusieurs images, de maintenir la cohérence des personnages pour des récits plus riches, d’effectuer des transformations précises à l’aide du langage naturel et de tirer parti des connaissances du monde de Gemini pour générer et éditer des images. Au prix de 30 $ US pour 1 million de jetons de sortie (environ 0,039 $ US par image), il est accessible via l’API Gemini et Google AI Studio pour les développeurs, et Vertex AI pour les entreprises. Le « mode de construction » de Google AI Studio a également été considérablement amélioré pour simplifier la création d’applications. Les principales fonctionnalités incluent la cohérence des personnages, l’édition d’images basée sur des invites et la connaissance native du monde, ouvrant de nouvelles possibilités dans la génération et la manipulation d’images.

(developers.googleblog.com)

IA

Gemma 3 270M : Un modèle d'IA compact et puissant pour les applications personnalisées

2025-08-14

Gemma 3 270M : Un modèle d'IA compact et puissant pour les applications personnalisées

La famille Gemma accueille son nouveau membre : Gemma 3 270M, un modèle d'IA compact de 270 millions de paramètres, conçu pour l'ajustement fin spécifique aux tâches. Héritant de l'architecture avancée de la série Gemma 3, il possède de solides capacités de suivi des instructions et de structuration de texte, tout en consommant une puissance remarquablement faible : seulement 0,75 % de la batterie pour 25 conversations sur un SoC Pixel 9 Pro. Ses impressionnantes capacités de suivi des instructions brillent dans les benchmarks IFEval, rendant l'IA avancée plus accessible pour les applications embarquées et la recherche. Gemma 3 270M excelle dans les tâches à fort volume et bien définies, telles que l'analyse des sentiments et l'extraction d'entités, et est idéal pour les scénarios nécessitant une itération et un déploiement rapides. Les développeurs peuvent tirer parti de sa petite taille pour des expériences rapides d'ajustement fin, créant des flottes de modèles spécialisés pour construire des systèmes de production efficaces et rentables.

(developers.googleblog.com)

IA

Gemini Embedding : La puissance pour la prochaine génération d'agents IA

2025-08-01

Gemini Embedding : La puissance pour la prochaine génération d'agents IA

Depuis sa sortie, le modèle de texte Gemini Embedding de Google a été rapidement adopté par les développeurs créant des applications IA avancées. Au-delà des utilisations traditionnelles comme la classification et la recherche sémantique, il est crucial pour l'« ingénierie du contexte », fournissant aux agents IA un contexte opérationnel complet. Des entreprises comme Box, re:cap, Everlaw, Roo Code, Mindlid et Interaction Co. tirent déjà parti de sa puissance pour améliorer la précision, la vitesse et la conscience contextuelle de leurs produits. De l'amélioration de l'analyse des données financières à l'amélioration de la découverte juridique et à l'alimentation des assistants IA, les hautes performances et la prise en charge multilingue de Gemini Embedding jettent les bases de la prochaine génération d'agents intelligents.

(developers.googleblog.com)

IA ingénierie du contexte

Annonce de la fermeture de Google URL Shortener

2025-07-25

Annonce de la fermeture de Google URL Shortener

Google va fermer son service de raccourcissement d'URL, goo.gl, le 25 août 2025. À partir du 23 août 2024, certains liens goo.gl afficheront une page de notification avertissant les utilisateurs de la fermeture imminente. Les développeurs sont invités à migrer vers d'autres services de raccourcissement d'URL. Les liens goo.gl générés via les applications Google continueront de fonctionner.

(developers.googleblog.com)

Développement Raccourcisseur d'URL

Mode Batch pour l'API Gemini : Traitement Haut Débit

2025-07-11

Mode Batch pour l'API Gemini : Traitement Haut Débit

L'API Gemini de Google propose désormais un mode batch, un point de terminaison asynchrone idéal pour les tâches à haut débit où la latence n'est pas critique. Soumettez des tâches volumineuses, laissez le système gérer le traitement et récupérez les résultats sous 24 heures avec une réduction de 50 % par rapport aux API synchrones. Parfait pour les données préparées à l'avance ne nécessitant pas de réponse immédiate, il offre des économies de coûts, un débit accru et des appels d'API simplifiés. Reforged Labs l'utilise pour traiter d'énormes quantités de publicités vidéo, améliorant ainsi considérablement l'efficacité et réduisant les coûts. Commencez facilement avec le SDK Python Google GenAI.

(developers.googleblog.com)

Développement Traitement asynchrone

Google DeepMind publie GenAI Processors : simplification du développement d’applications LLM

2025-07-11

Google DeepMind publie GenAI Processors : simplification du développement d’applications LLM

Google DeepMind a publié GenAI Processors, une bibliothèque Python open source conçue pour simplifier le développement d’applications complexes de modèles linguistiques de grande taille (LLM). La bibliothèque utilise une interface Processor pour abstraire les différentes étapes de traitement des données et gère les entrées multimodales via le traitement de flux asynchrone, permettant une exécution concurrente pour une meilleure réactivité et une efficacité accrue. GenAI Processors s’intègre à l’API Gemini et fournit des exemples pour créer des applications en temps réel, telles que la transcription en direct et les agents conversationnels.

(developers.googleblog.com)

Développement

Gemma 3n : Lancement du puissant modèle d’IA pour appareils mobiles

2025-06-27

Gemma 3n : Lancement du puissant modèle d’IA pour appareils mobiles

Gemma 3n, un puissant modèle d’IA multimodale pour appareils mobiles, est désormais entièrement disponible ! Construit sur l’architecture innovante MatFormer, il prend en charge les entrées image, audio, vidéo et texte, fonctionnant avec des empreintes mémoire incroyablement faibles (2 Go pour E2B et 3 Go pour E4B). Gemma 3n prend en charge 140 langues pour le traitement du texte et 35 langues pour la compréhension multimodale, atteignant un score LMArena supérieur à 1300. Son architecture efficace et la technologie Per-Layer Embeddings permettent des performances exceptionnelles dans diverses tâches, offrant aux développeurs une commodité sans précédent et inaugurant une nouvelle ère pour l’IA mobile.

(developers.googleblog.com)

IA multimodale

Google AI Studio : Développement d'applications IA boosté par Gemini 2.5 Pro

2025-05-21

Google AI Studio : Développement d'applications IA boosté par Gemini 2.5 Pro

Google AI Studio a reçu une mise à jour majeure intégrant le modèle Gemini 2.5 Pro pour une génération de code considérablement améliorée. Les développeurs peuvent rapidement créer et déployer des applications web basées sur l'IA à l'aide de simples invites textuelles, images ou vidéos. La nouvelle version intègre également des modèles multimodaux tels que Imagen, Lyria RealTime et Veo, offrant un déploiement en un clic sur Cloud Run, ainsi qu'une comparaison et une restauration pratiques des versions de code. De plus, le nouveau support audio natif et un outil de contexte URL améliorent l'interactivité et la récupération d'informations.

(developers.googleblog.com)

Développement

Google dévoile Gemma 3n : un modèle d’IA léger et multimodal pour les mobiles

2025-05-20

Google dévoile Gemma 3n : un modèle d’IA léger et multimodal pour les mobiles

Google a lancé Gemma 3n, un nouveau modèle ouvert basé sur une architecture révolutionnaire conçue pour apporter de puissantes capacités d’IA aux appareils mobiles. Gemma 3n se caractérise par une consommation de mémoire réduite et des temps de réponse plus rapides, prenant en charge la compréhension multimodale (texte, image, audio) et de solides capacités multilingues. Les développeurs peuvent accéder à une préversion via Google AI Studio et Google AI Edge pour créer des applications exploitant les fonctionnalités de Gemma 3n, notamment la transcription vocale en temps réel, la traduction et la compréhension d’images. Le modèle privilégie la confidentialité et fonctionne hors ligne.

(developers.googleblog.com)

IA IA mobile

Aperçu de Gemini 2.5 Pro (édition I/O) publié plus tôt : capacités de codage améliorées

2025-05-06

Aperçu de Gemini 2.5 Pro (édition I/O) publié plus tôt : capacités de codage améliorées

Google a publié un aperçu anticipé de Gemini 2.5 Pro (édition I/O), doté de capacités de codage considérablement améliorées, notamment en développement front-end et UI. Il est classé n° 1 au classement WebDev Arena pour la génération d’applications web esthétiques et fonctionnelles. Les principales améliorations incluent la fonctionnalité vidéo-code, un développement de fonctionnalités plus facile et des flux de travail plus rapides du concept à l’application fonctionnelle. Les développeurs peuvent y accéder via l’API Gemini dans Google AI Studio ou Vertex AI pour les clients entreprises. Cette mise à jour corrige également les erreurs précédentes et améliore la fiabilité des appels de fonction.

(developers.googleblog.com)

IA

Gemma 3 : L'IA de pointe, désormais accessible sur votre ordinateur

2025-04-20

Gemma 3 : L'IA de pointe, désormais accessible sur votre ordinateur

Gemma 3, un modèle d'IA de pointe et open source, nécessitait initialement des GPU haut de gamme. Pour améliorer l'accessibilité, de nouvelles versions optimisées avec l'entraînement conscient de la quantification (QAT) réduisent considérablement les besoins en mémoire tout en maintenant une haute qualité. Cela permet d'exécuter des modèles puissants comme le Gemma 3 27B sur des GPU grand public tels que la NVIDIA RTX 3090. Ces modèles optimisés sont disponibles sur Hugging Face et Kaggle, facilitant leur intégration dans différents workflows.

(developers.googleblog.com)

IA entraînement conscient de la quantification

Google dévoile Gemini 2.5 Flash : un modèle d'IA avec raisonnement contrôlable

2025-04-17

Google dévoile Gemini 2.5 Flash : un modèle d'IA avec raisonnement contrôlable

Google a lancé Gemini 2.5 Flash, un nouveau modèle de langage large doté de capacités de raisonnement contrôlables. S'appuyant sur le populaire 2.0 Flash, il améliore considérablement le raisonnement tout en privilégiant la vitesse et la rentabilité. Les développeurs peuvent ajuster un « budget de pensée » pour trouver le bon compromis entre qualité, coût et latence. Le modèle ajuste automatiquement son processus de pensée en fonction de la complexité de l'invite, offrant des modes allant de l'absence de pensée à un raisonnement intensif. Gemini 2.5 Flash excelle dans les Hard Prompts de LMArena, offrant un excellent rapport qualité-prix, ce qui en fait l'un des modèles de pensée les plus économiques disponibles.

(developers.googleblog.com)

IA Modèle de Langage Large Raisonnement Contrôlable

Agent2Agent (A2A) : Une nouvelle ère d'interopérabilité des agents IA

2025-04-09

Agent2Agent (A2A) : Une nouvelle ère d'interopérabilité des agents IA

Google lance Agent2Agent (A2A), un protocole ouvert permettant une collaboration transparente entre les agents IA construits par différents fournisseurs ou utilisant différents frameworks. Soutenu par plus de 50 partenaires technologiques et fournisseurs de services, A2A permet un échange sécurisé d'informations et des actions coordonnées, augmentant ainsi la productivité et réduisant les coûts. Basé sur des standards existants, A2A supporte plusieurs modalités, privilégie la sécurité et gère les tâches de longue durée. Les cas d'utilisation vont de l'automatisation des processus de recrutement (par exemple, la recherche de candidats et la planification des entretiens) à l'optimisation des workflows complexes sur diverses applications d'entreprise. Sa nature open-source favorise un écosystème florissant d'agents IA collaboratifs.

(developers.googleblog.com)

IA protocole A2A

Gemini 2.0 Flash : Le modèle de génération d'images natif de Google est disponible pour les développeurs

2025-03-12

Gemini 2.0 Flash : Le modèle de génération d'images natif de Google est disponible pour les développeurs

Google a publié Gemini 2.0 Flash, un modèle d'IA multimodal doté d'un raisonnement amélioré et d'une compréhension du langage naturel, capable de générer des images. Il peut créer des histoires avec du texte et des images, permettre l'édition d'images par le biais de conversations et générer des images contenant de longues séquences de texte bien formatées. Disponible pour l'expérimentation des développeurs sur Google AI Studio et l'API Gemini, Gemini 2.0 Flash promet des possibilités passionnantes pour la création d'agents d'IA et d'applications visuellement riches.

(developers.googleblog.com)

IA Génération d'images IA