Deep Code Bench: Un nuevo conjunto de datos de referencia para la recuperación de código

2025-09-11
Deep Code Bench: Un nuevo conjunto de datos de referencia para la recuperación de código

Qodo ha lanzado Deep Code Bench, un nuevo conjunto de datos de referencia de preguntas del mundo real derivadas de grandes repositorios de código complejos. A diferencia de los benchmarks existentes, estas preguntas requieren la recuperación de varios archivos, lo que refleja escenarios reales de los desarrolladores. El conjunto de datos, generado utilizando LLMs a partir de datos de solicitud de extracción, proporciona una evaluación sólida de los sistemas de recuperación de código. El agente de investigación profunda de Qodo supera a los demás en la recuperación de hechos, logrando aproximadamente un 76% de precisión.

Leer más

Qodo Command alcanza un impresionante 71,2% en SWE-bench Verified

2025-08-12
Qodo Command alcanza un impresionante 71,2% en SWE-bench Verified

Qodo Command, un agente de codificación de IA de línea de comandos, logró una impresionante puntuación del 71,2% en el benchmark SWE-bench Verified, una prueba líder para evaluar agentes de IA en tareas de ingeniería de software del mundo real. Esta puntuación se logró utilizando la versión de producción de Qodo Command sin ajustes específicos para el benchmark. Su éxito se debe a características como el resumen de contexto, la planificación de la ejecución, los mecanismos de reintento y retroceso, y el framework LangGraph. Diseñado para admitir varios LLM, Qodo Command actualmente se asocia con Claude 4 de Anthropic para crear agentes de codificación adaptativos y orientados al aprendizaje.

Leer más
Desarrollo

GPT-5 destaca en el benchmark de revisión de código de Qodo

2025-08-08
GPT-5 destaca en el benchmark de revisión de código de Qodo

Qodo utilizó su benchmark PR privado, simulando flujos de trabajo de revisión de código del mundo real, para evaluar modelos de lenguaje de vanguardia, incluyendo GPT-5. Los resultados mostraron que GPT-5 sobresalió en la comprensión de diferencias de código, la identificación de errores y la sugerencia de mejoras. Su variante 'mínima' equilibró velocidad y calidad de forma impresionante. Si bien GPT-5 presentó algunas debilidades, como falsos positivos y etiquetado inconsistente, su rendimiento general en la revisión de código fue sorprendente, marcando un progreso significativo en la revisión de código asistida por IA.

Leer más
Desarrollo

Qodo Gen CLI: Automatiza tu SDLC con agentes de IA

2025-06-25
Qodo Gen CLI: Automatiza tu SDLC con agentes de IA

Qodo Gen CLI es una poderosa interfaz de línea de comandos para construir, gestionar y ejecutar agentes de IA. Los desarrolladores pueden crear agentes personalizados para automatizar flujos de trabajo en todo el ciclo de vida de desarrollo de software (SDLC), integrando capacidades de IA en cualquier IDE. Con soporte para LLMs líderes y opciones de implementación flexibles, Qodo Gen CLI ofrece interfaces basadas en terminal y navegador. Automatiza tareas como revisión de código, generación de documentación y cobertura de pruebas, aumentando la eficiencia y permitiendo que los desarrolladores se centren en la construcción de funciones.

Leer más

Generación de código de IA: la precisión y la confianza son clave

2025-06-12
Generación de código de IA: la precisión y la confianza son clave

Solo un 3,8% de los desarrolladores reportan experimentar tanto bajas alucinaciones como alta confianza en el envío de código generado por IA. Estos son los equipos que realmente se benefician de la IA en producción. Confían en las sugerencias, envían más rápido y cierran el ciclo con retroalimentación de alta calidad. Entre este grupo de baja alucinación, aquellos que también se sienten confiados (17%) reportan: 1,3 veces más probabilidades de ver mejoras en la calidad del código (44% vs. 35%); 2,5 veces más confianza en el envío de código de IA (24% vs. 9%). Este es el grupo que consideramos el “punto ideal”, y dentro de él, más de la mitad (53%) reporta mejoras claras en la calidad del código. Esto sugiere una fuerte relación entre precisión, calidad y confianza. Cuando los desarrolladores ven menos errores y una salida de mayor calidad, es mucho más probable que confíen en la IA y la usen en producción. También vemos que las bajas alucinaciones hacen que los desarrolladores sean 1,3 veces más propensos a decir que la IA ha mejorado la calidad del código (44% vs. 35% en general). Aun así, la mayoría de los desarrolladores, incluso aquellos con una salida precisa, siguen siendo reacios. Ahí es donde los controles de calidad automatizados pueden cerrar la brecha.

Leer más

Depuración de errores de lógica en Java con pruebas unitarias

2025-05-07
Depuración de errores de lógica en Java con pruebas unitarias

Los errores de lógica en el desarrollo de Java son notoriamente difíciles de depurar utilizando métodos tradicionales. Este artículo presenta un enfoque de depuración basado en pruebas, utilizando pruebas unitarias para descubrir e identificar errores de lógica. Se detallan varias técnicas de prueba, incluidas las pruebas de hipótesis, las pruebas de progresión de estado y las pruebas de regresión, y se explica cómo aprovechar los resultados de las pruebas para comprender el comportamiento del código y, finalmente, mejorar la lógica. El artículo también menciona herramientas de prueba unitaria asistidas por IA que pueden ayudar a los desarrolladores a descubrir de manera más eficaz posibles vulnerabilidades lógicas.

Leer más
Desarrollo Errores de Lógica

LangGraph: Creando un asistente de codificación de IA flexible y con las mejores prácticas

2025-03-24
LangGraph: Creando un asistente de codificación de IA flexible y con las mejores prácticas

Qodo creó un asistente de codificación de IA utilizando el framework LangGraph, equilibrando la flexibilidad con el cumplimiento de las mejores prácticas de codificación. Inicialmente, utilizaron flujos predefinidos para tareas de codificación, pero con la llegada de LLMs más potentes como Claude Sonnet 3.5, cambiaron al enfoque basado en grafos de LangGraph. LangGraph permite crear agentes que van desde totalmente abiertos hasta flujos determinísticos completamente estructurados, lo que permite a Qodo ajustar la estructura de sus flujos en función de las capacidades del LLM. La API limpia del framework, los componentes reutilizables y la administración de estado integrada simplificaron el desarrollo y admiten la persistencia, los puntos de control y los puntos de ramificación. Si bien la documentación y las pruebas presentan algunos desafíos, LangGraph proporcionó una base sólida para que Qodo creara un asistente de codificación de IA robusto.

Leer más
Desarrollo

Qodo Gen 1.0: Codificación con IA Agéntica usando LangGraph y MCP

2025-03-18
Qodo Gen 1.0: Codificación con IA Agéntica usando LangGraph y MCP

Qodo Gen 1.0 presenta flujos agénticos en su plugin de IDE de codificación y prueba de IA, permitiendo que la IA decida dinámicamente cómo navegar por tareas complejas de codificación. Esto se logró reestructurando la infraestructura utilizando LangGraph para flujos de trabajo estructurados y el Protocolo de Contexto del Modelo (MCP) de Anthropic para la integración de herramientas externas estandarizada. La arquitectura admite la comunicación asíncrona, la recuperación de contexto a demanda y el manejo mejorado de errores y confiabilidad, permitiendo que la IA opere de forma autónoma, recupere datos en tiempo real y adapte las estrategias según los resultados de la ejecución de la herramienta. LangGraph proporciona flexibilidad y control, mientras que MCP simplifica la integración de herramientas externas. El resultado es una automatización más inteligente, un sistema extensible y un enfoque estructurado para la autonomía de la IA.

Leer más
Desarrollo

Qodo-Embed-1: Una familia de modelos de incrustación de código eficientes y compactos

2025-03-03
Qodo-Embed-1: Una familia de modelos de incrustación de código eficientes y compactos

Qodo anunció Qodo-Embed-1, una nueva familia de modelos de incrustación de código que alcanza un rendimiento de vanguardia con una huella significativamente menor que los modelos existentes. El modelo de 1.5B de parámetros obtuvo una puntuación de 68.53 en el benchmark CoIR, superando a modelos más grandes de 7B de parámetros. Entrenado con generación de datos sintéticos para superar las limitaciones de los modelos existentes en la recuperación precisa de fragmentos de código, Qodo-Embed-1 mejora significativamente la precisión y la eficiencia de la recuperación de código. El modelo de 1.5B de parámetros es de código abierto, mientras que el modelo de 7B de parámetros está disponible comercialmente.

Leer más

Construyendo un marco de evaluación robusto para sistemas RAG

2025-02-14
Construyendo un marco de evaluación robusto para sistemas RAG

Qodo construyó un asistente de codificación de IA basado en generación aumentada por recuperación (RAG) y desarrolló un marco de evaluación robusto para asegurar la precisión y la exhaustividad. Los desafíos incluían verificar la corrección de las salidas RAG derivadas de grandes conjuntos de datos privados. El marco evalúa los documentos recuperados finales y la salida generada final, centrándose en la 'corrección de la respuesta' y la 'precisión de la recuperación'. Para abordar los desafíos de las salidas de lenguaje natural, emplearon un enfoque de 'LLM como juez' y construyeron un conjunto de datos de verdad fundamental con preguntas, respuestas y contexto reales. Para mayor eficiencia, utilizaron LLMs para ayudar en la construcción del conjunto de datos y usaron LLMs y RAGAS para evaluar la corrección de la respuesta. Finalmente, construyeron su propio juez LLM y lo combinaron con RAGAS para mejorar la fiabilidad, integrándolo en su flujo de trabajo con pruebas de regresión, reduciendo drásticamente el esfuerzo para verificar el impacto de los cambios de código en la calidad.

Leer más

Qodo Merge 1.0: La revisión de código con IA evoluciona

2025-02-02
Qodo Merge 1.0: La revisión de código con IA evoluciona

Qodo Merge 1.0, una herramienta de revisión de código impulsada por IA, aborda los desafíos inherentes a la codificación asistida por IA después de más de un año de desarrollo. La nueva versión presenta un modo de enfoque en problemas que prioriza problemas críticos como errores y fallas de seguridad; aprendizaje dinámico que refina sugerencias basadas en cambios aceptados; integración de contexto de ticket en tiempo real; y un comando `/implement` para traducir comentarios en cambios de código accionables. Qodo Merge 1.0 hace la revisión de código más precisa, adaptable y eficiente.

Leer más

Sugerencias de código de IA efectivas: menos es más

2025-01-29
Sugerencias de código de IA efectivas: menos es más

Qodo (anteriormente Codium), con su herramienta de IA para análisis y retroalimentación automatizados de solicitudes de extracción, Qodo Merge, descubrió una lección crucial sobre el uso de modelos de lenguaje grandes (LLM) para la revisión de código. Inicialmente, priorizar la detección de errores sobre las sugerencias de estilo resultó ineficaz; el modelo se vio abrumado por los problemas de estilo más fáciles de encontrar, lo que provocó fatiga por sugerencias entre los desarrolladores. El avance provino de simplificar la tarea del modelo: centrarse únicamente en encontrar errores y problemas significativos. Este enfoque preciso aumentó las tasas de detección de errores y la relación señal-ruido, lo que resultó en un aumento del 50% en las tasas de aceptación de sugerencias y un aumento del 11% en el impacto general. La conclusión principal: a veces, eliminar las distracciones es más eficaz que una priorización compleja.

Leer más
Desarrollo

LLM de código abierto DeepSeek-R1 integrado en Qodo Gen

2025-01-27
LLM de código abierto DeepSeek-R1 integrado en Qodo Gen

Qodo (anteriormente Codium) anunció la integración de DeepSeek-R1, un potente modelo de lenguaje grande de código abierto comparable al o1 de OpenAI, en su asistente de codificación con tecnología de IA, Qodo Gen. Conocido por sus sólidas capacidades de razonamiento y rentabilidad, DeepSeek-R1 maneja desafíos de codificación complejos, generando respuestas más rápido y a un costo menor que muchos modelos propietarios. Qodo Gen admite varios LLM de primer nivel, ofreciendo a los desarrolladores una experiencia de codificación asistida por IA segura y confiable.

Leer más

Depurador de Python de VS Code: Más allá de las instrucciones print

2025-01-10
Depurador de Python de VS Code: Más allá de las instrucciones print

¿Cansado de llenar tu código Python con instrucciones print? Las potentes funciones de depuración de Visual Studio Code revolucionarán tu flujo de trabajo. Este tutorial abarca la configuración del depurador de Python de VS Code, la gestión de puntos de interrupción, la inspección de variables y técnicas avanzadas como el manejo de excepciones, la depuración remota y el análisis de rendimiento. Aprende a depurar tu código Python de forma eficiente, dejando atrás la ineficiente era de las instrucciones print, y aumenta tu eficiencia de desarrollo.

Leer más