Deep Code Bench : Un nouveau jeu de données de référence pour la recherche de code

2025-09-11
Deep Code Bench : Un nouveau jeu de données de référence pour la recherche de code

Qodo a publié Deep Code Bench, un nouveau jeu de données de référence composé de questions réelles issues de grands référentiels de code complexes. Contrairement aux benchmarks existants, ces questions nécessitent une recherche sur plusieurs fichiers, ce qui reflète les scénarios réels des développeurs. Le jeu de données, généré à partir de données de pull requests à l'aide de modèles linguistiques de grande taille (LLM), fournit une évaluation robuste des systèmes de recherche de code. L'agent de recherche approfondie de Qodo surpasse les autres en matière de rappel de faits, atteignant environ 76 % de précision.

Lire plus

Qodo Command atteint un score impressionnant de 71,2 % sur SWE-bench Verified

2025-08-12
Qodo Command atteint un score impressionnant de 71,2 % sur SWE-bench Verified

Qodo Command, un agent de codage IA en ligne de commande, a obtenu un score impressionnant de 71,2 % sur le benchmark SWE-bench Verified, un test de référence pour évaluer les agents IA sur des tâches d'ingénierie logicielle réelles. Ce score a été obtenu en utilisant la version de production de Qodo Command sans ajustement spécifique au benchmark. Son succès repose sur des fonctionnalités telles que la summarisation du contexte, la planification de l'exécution, les mécanismes de réessai et de repli, et le framework LangGraph. Conçu pour prendre en charge plusieurs LLM, Qodo Command s'associe actuellement à Claude 4 d'Anthropic pour créer des agents de codage adaptatifs et axés sur l'apprentissage.

Lire plus
Développement

GPT-5 excelle dans le benchmark de révision de code de Qodo

2025-08-08
GPT-5 excelle dans le benchmark de révision de code de Qodo

Qodo a utilisé son benchmark PR privé, simulant les workflows de révision de code du monde réel, pour évaluer les modèles de langage de pointe, y compris GPT-5. Les résultats ont montré que GPT-5 excellait dans la compréhension des différences de code, l'identification des bogues et la suggestion d'améliorations. Sa variante « minimale » a équilibré vitesse et qualité de manière impressionnante. Bien que GPT-5 ait présenté quelques faiblesses, telles que les faux positifs et l'étiquetage incohérent, ses performances globales en matière de révision de code ont été étonnantes, marquant un progrès significatif dans la révision de code assistée par l'IA.

Lire plus
Développement Révision de Code

Qodo Gen CLI : Automatisez votre cycle de vie de développement logiciel avec des agents d'IA

2025-06-25
Qodo Gen CLI : Automatisez votre cycle de vie de développement logiciel avec des agents d'IA

Qodo Gen CLI est une puissante interface en ligne de commande pour construire, gérer et exécuter des agents d'IA. Les développeurs peuvent créer des agents personnalisés pour automatiser les flux de travail sur l'ensemble du cycle de vie de développement logiciel (SDLC), en intégrant les capacités de l'IA dans n'importe quel IDE. Prenant en charge les principaux LLMs et des options de déploiement flexibles, Qodo Gen CLI offre des interfaces basées sur le terminal et le navigateur. Automatisez des tâches telles que la revue de code, la génération de documentation et la couverture des tests, en augmentant l'efficacité et en permettant aux développeurs de se concentrer sur la construction de fonctionnalités.

Lire plus
Développement automatisation SDLC

Génération de code IA : précision et confiance sont essentielles

2025-06-12
Génération de code IA : précision et confiance sont essentielles

Seuls 3,8 % des développeurs déclarent avoir à la fois peu d’hallucinations et une grande confiance dans l’envoi de code généré par l’IA. Ce sont les équipes qui tirent le plus grand profit de l’IA en production. Elles font confiance aux suggestions, envoient plus rapidement et ferment la boucle avec un feedback de haute qualité. Parmi ce groupe à faible taux d’hallucinations, ceux qui ont également confiance en eux (17 %) déclarent : une probabilité 1,3 fois plus élevée de voir des gains en qualité de code (44 % contre 35 %) ; une confiance 2,5 fois plus grande dans l’envoi de code IA (24 % contre 9 %). C’est ce groupe que nous considérons comme le « point idéal » — et, au sein de celui-ci, plus de la moitié (53 %) signalent des améliorations claires de la qualité du code. Cela suggère un lien étroit entre la précision, la qualité et la confiance. Lorsque les développeurs constatent moins d’erreurs et une sortie de meilleure qualité, ils sont beaucoup plus susceptibles de faire confiance à l’IA et de l’utiliser en production. Nous constatons également que les faibles hallucinations rendent les développeurs 1,3 fois plus susceptibles de déclarer que l’IA a amélioré la qualité du code (44 % contre 35 % au total). Pourtant, la plupart des développeurs — même ceux dont la sortie est précise — restent hésitants. C’est là que les contrôles de qualité automatisés peuvent combler le fossé.

Lire plus

Débogage des erreurs de logique Java avec des tests unitaires

2025-05-07
Débogage des erreurs de logique Java avec des tests unitaires

Les erreurs de logique dans le développement Java sont notoirement difficiles à déboguer à l'aide de méthodes traditionnelles. Cet article présente une approche de débogage pilotée par les tests, utilisant des tests unitaires pour découvrir et identifier les erreurs de logique. Il détaille plusieurs techniques de test, notamment les tests d'hypothèse, les tests de progression d'état et les tests de régression, et explique comment tirer parti des résultats des tests pour comprendre le comportement du code et, finalement, améliorer la logique. L'article mentionne également des outils de test unitaire assistés par l'IA qui peuvent aider les développeurs à découvrir plus efficacement les vulnérabilités logiques potentielles.

Lire plus

LangGraph : construire un assistant de codage IA flexible et respectueux des meilleures pratiques

2025-03-24
LangGraph : construire un assistant de codage IA flexible et respectueux des meilleures pratiques

Qodo a construit un assistant de codage IA en utilisant le framework LangGraph, en équilibrant la flexibilité avec le respect des meilleures pratiques de codage. Initialement, ils utilisaient des flux prédéfinis pour les tâches de codage, mais avec l'arrivée de LLM plus puissants comme Claude Sonnet 3.5, ils sont passés à l'approche basée sur les graphes de LangGraph. LangGraph permet de construire des agents allant de totalement ouverts à des flux déterministes entièrement structurés, permettant à Qodo d'ajuster la structure de ses flux en fonction des capacités du LLM. L'API propre du framework, les composants réutilisables et la gestion d'état intégrée ont simplifié le développement et prennent en charge la persistance, les points de contrôle et les points de branchement. Bien que la documentation et les tests présentent quelques défis, LangGraph a fourni une base solide pour que Qodo construise un assistant de codage IA robuste.

Lire plus
Développement

Qodo Gen 1.0 : Codage IA agentique avec LangGraph et MCP

2025-03-18
Qodo Gen 1.0 : Codage IA agentique avec LangGraph et MCP

Qodo Gen 1.0 introduit des workflows agentiques dans son plugin IDE de codage et de test IA, permettant à l’IA de décider dynamiquement comment naviguer dans des tâches de codage complexes. Ceci a été réalisé en restructurant l’infrastructure en utilisant LangGraph pour des workflows structurés et le protocole de contexte de modèle (MCP) d’Anthropic pour une intégration d’outils externes standardisée. L’architecture prend en charge la communication asynchrone, la récupération de contexte à la demande et une gestion améliorée des erreurs et de la fiabilité, permettant à l’IA de fonctionner de manière autonome, de récupérer des données en temps réel et d’adapter les stratégies en fonction des résultats de l’exécution des outils. LangGraph offre flexibilité et contrôle, tandis que MCP simplifie l’intégration des outils externes. Le résultat est une automatisation plus intelligente, un système extensible et une approche structurée de l’autonomie de l’IA.

Lire plus
Développement

Qodo-Embed-1 : Une famille de modèles d’intégration de code efficaces et compacts

2025-03-03
Qodo-Embed-1 : Une famille de modèles d’intégration de code efficaces et compacts

Qodo a annoncé Qodo-Embed-1, une nouvelle famille de modèles d’intégration de code qui atteint des performances de pointe avec une empreinte significativement plus petite que les modèles existants. Le modèle de 1,5 milliard de paramètres a obtenu un score de 68,53 sur le benchmark CoIR, surpassant des modèles plus grands de 7 milliards de paramètres. Entraîné à l’aide de la génération de données synthétiques pour surmonter les limites des modèles existants dans la récupération précise d’extraits de code, Qodo-Embed-1 améliore considérablement la précision et l’efficacité de la récupération de code. Le modèle de 1,5 milliard de paramètres est open source, tandis que le modèle de 7 milliards de paramètres est disponible commercialement.

Lire plus

Construction d'un cadre d'évaluation robuste pour les systèmes RAG

2025-02-14
Construction d'un cadre d'évaluation robuste pour les systèmes RAG

Qodo a construit un assistant de codage IA basé sur la génération augmentée par la récupération (RAG) et a développé un cadre d'évaluation robuste pour garantir la précision et l'exhaustivité. Les défis comprenaient la vérification de l'exactitude des sorties RAG dérivées de grands corpus de données privés. Le cadre évalue les documents récupérés finaux et la sortie générée finale, en se concentrant sur la « correction de la réponse » et la « précision de la récupération ». Pour relever les défis des sorties de langage naturel, ils ont utilisé une approche « LLM comme juge » et ont construit un ensemble de données de vérité terrain avec des questions, des réponses et un contexte réels. Pour plus d'efficacité, ils ont utilisé des LLMs pour aider à la construction de l'ensemble de données et ont utilisé des LLMs et RAGAS pour évaluer l'exactitude de la réponse. Enfin, ils ont construit leur propre juge LLM et l'ont combiné avec RAGAS pour améliorer la fiabilité, l'intégrant à leur flux de travail avec des tests de régression, réduisant ainsi considérablement l'effort pour vérifier l'impact des modifications de code sur la qualité.

Lire plus
Développement Évaluation LLM

Qodo Merge 1.0 : L'évolution de la revue de code assistée par IA

2025-02-02
Qodo Merge 1.0 : L'évolution de la revue de code assistée par IA

Qodo Merge 1.0, un outil de revue de code piloté par l'IA, répond aux défis inhérents au codage assisté par IA après plus d'un an de développement. La nouvelle version propose un mode de focalisation sur les problèmes qui priorise les problèmes critiques tels que les bogues et les failles de sécurité ; un apprentissage dynamique qui affine les suggestions en fonction des modifications acceptées ; une intégration du contexte des tickets en temps réel ; et une commande `/implement` pour traduire les commentaires en modifications de code exploitables. Qodo Merge 1.0 rend la revue de code plus précise, plus adaptative et plus efficace.

Lire plus
Développement Revue de code IA

Suggestions de code IA efficaces : moins c’est plus

2025-01-29
Suggestions de code IA efficaces : moins c’est plus

Qodo (anciennement Codium) a découvert une leçon cruciale sur l’utilisation des LLM pour la revue de code avec son outil d’IA, Qodo Merge. Au départ, la priorité accordée à la détection des bogues plutôt qu’aux suggestions de style s’est avérée inefficace ; le modèle a été submergé par les problèmes de style plus faciles à trouver, ce qui a entraîné une fatigue des suggestions chez les développeurs. La percée est venue de la simplification de la tâche du modèle : se concentrer uniquement sur la recherche de bogues et de problèmes significatifs. Cette focalisation précise a augmenté les taux de détection des bogues et le rapport signal/bruit, entraînant une augmentation de 50 % du taux d’acceptation des suggestions et une augmentation de 11 % de l’impact global. La principale conclusion : parfois, éliminer les distractions est plus efficace qu’une priorisation complexe.

Lire plus
Développement Revue de code

Intégration du LLM open source DeepSeek-R1 dans Qodo Gen

2025-01-27
Intégration du LLM open source DeepSeek-R1 dans Qodo Gen

Qodo (anciennement Codium) a annoncé l'intégration de DeepSeek-R1, un puissant modèle linguistique large open source comparable à o1 d'OpenAI, dans son assistant de codage basé sur l'IA, Qodo Gen. Connu pour ses capacités de raisonnement élevées et son efficacité coût, DeepSeek-R1 gère les défis de codage complexes, générant des réponses plus rapidement et à moindre coût que de nombreux modèles propriétaires. Qodo Gen prend en charge plusieurs LLM haut de gamme, offrant aux développeurs une expérience de codage assistée par IA sécurisée et fiable.

Lire plus
Développement Assistant de Codage IA

Débogueur Python de VS Code : au-delà des instructions print

2025-01-10
Débogueur Python de VS Code : au-delà des instructions print

Fatigué de parsemer votre code Python d'instructions print ? Les puissantes fonctionnalités de débogage de Visual Studio Code révolutionneront votre flux de travail. Ce tutoriel couvre la configuration du débogueur Python de VS Code, la gestion des points d'arrêt, l'inspection des variables et des techniques avancées telles que la gestion des exceptions, le débogage à distance et l'analyse des performances. Apprenez à déboguer efficacement votre code Python, en laissant derrière vous l'ère inefficace des instructions print, et augmentez votre efficacité de développement.

Lire plus
Développement débogage Python