Deep Code Bench: مجموعة بيانات قياسية جديدة لاسترجاع التعليمات البرمجية

2025-09-11
Deep Code Bench: مجموعة بيانات قياسية جديدة لاسترجاع التعليمات البرمجية

أصدرت شركة Qodo مجموعة بيانات قياسية جديدة باسم Deep Code Bench، تتضمن أسئلة واقعية مستمدة من مستودعات أكواد كبيرة ومعقدة. وعلى عكس معايير القياس الموجودة، تتطلب هذه الأسئلة استرجاع المعلومات من ملفات متعددة، مما يعكس سيناريوهات المطورين في العالم الحقيقي. وقد تم إنشاء مجموعة البيانات هذه باستخدام نماذج لغوية ضخمة (LLMs) من بيانات طلبات السحب، مما يوفر تقييمًا قويًا لأنظمة استرجاع التعليمات البرمجية. وقد تفوقت وكالة البحث العميق من Qodo على غيرها في استدعاء الحقائق، محققة دقة تبلغ حوالي 76%.

اقرأ المزيد

قودو كوماند يحقق نتيجة مذهلة 71.2% في اختبار SWE-bench المعتمد

2025-08-12
قودو كوماند يحقق نتيجة مذهلة 71.2% في اختبار SWE-bench المعتمد

حقق قودو كوماند، وهو وكيل ترميز ذكاء اصطناعي من سطر الأوامر، نتيجة رائعة بلغت 71.2% في معيار SWE-bench المعتمد، وهو اختبار رائد لتقييم وكلاء الذكاء الاصطناعي في مهام هندسة البرمجيات الواقعية. تم تحقيق هذه النتيجة باستخدام إصدار الإنتاج من قودو كوماند بدون أي ضبط دقيق أو تعديلات خاصة بالمعيار. يأتي نجاحه من ميزات مثل تلخيص السياق، وتخطيط التنفيذ، وآليات إعادة المحاولة والرجوع الاحتياطي، وإطار عمل LangGraph. تم تصميمه لدعم نماذج اللغات الكبيرة المتعددة، ويتعاون قودو كوماند حاليًا مع نموذج Claude 4 من Anthropic لإنشاء وكلاء ترميز متكيفين ومركزين على التعلم.

اقرأ المزيد

GPT-5 يتفوق في معيار مراجعة التعليمات البرمجية من Qodo

2025-08-08
GPT-5 يتفوق في معيار مراجعة التعليمات البرمجية من Qodo

استخدمت شركة Qodo معيار PR الخاص بها، والذي يحاكي سير عمل مراجعة التعليمات البرمجية في العالم الحقيقي، لتقييم نماذج اللغات المتقدمة، بما في ذلك GPT-5. أظهرت النتائج تفوق GPT-5 في فهم اختلافات التعليمات البرمجية، وتحديد الأخطاء، واقتراح التحسينات. حقق متغيره "الحد الأدنى" توازنًا مثيرًا للإعجاب بين السرعة والجودة. على الرغم من أن GPT-5 كان لديه بعض نقاط الضعف، مثل الإيجابيات الكاذبة والتصنيف غير المتسق، إلا أن أدائه العام في مراجعة التعليمات البرمجية كان مذهلاً، مما يشير إلى تقدم كبير في مراجعة التعليمات البرمجية بمساعدة الذكاء الاصطناعي.

اقرأ المزيد
التطوير

واجهة سطر الأوامر Qodo Gen CLI: أتمتة دورة حياة تطوير البرامج باستخدام وكلاء الذكاء الاصطناعي

2025-06-25
واجهة سطر الأوامر Qodo Gen CLI: أتمتة دورة حياة تطوير البرامج باستخدام وكلاء الذكاء الاصطناعي

Qodo Gen CLI هي واجهة سطر أوامر قوية لبناء وإدارة وتشغيل وكلاء الذكاء الاصطناعي. يمكن للمطورين إنشاء وكلاء مخصصين لأتمتة سير العمل في جميع أنحاء دورة حياة تطوير البرامج (SDLC) ، ودمج قدرات الذكاء الاصطناعي في أي بيئة تطوير متكاملة (IDE). مع دعم نماذج اللغات الكبيرة الرائدة وخيارات النشر المرنة ، توفر Qodo Gen CLI واجهات تعتمد على كل من طرف المحطة والمتصفح. أتمتة المهام مثل مراجعة التعليمات البرمجية ، وإنشاء المستندات ، وتغطية الاختبارات ، مما يزيد من الكفاءة ويسمح للمطورين بالتركيز على بناء الميزات.

اقرأ المزيد

توليد الشفرة بواسطة الذكاء الاصطناعي: الدقة والثقة هما المفتاح

2025-06-12
توليد الشفرة بواسطة الذكاء الاصطناعي: الدقة والثقة هما المفتاح

أبلغ 3.8% فقط من المطورين عن تجربة انخفاض الهلوسة وثقة عالية في شحن الكود الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. هذه هي الفرق التي تستفيد حقًا من الذكاء الاصطناعي في الإنتاج. إنهم يثقون بالاقتراحات، ويشحنون بشكل أسرع، ويغلقون الحلقة من خلال ردود فعل عالية الجودة. من بين هذه المجموعة منخفضة الهلوسة، أولئك الذين يشعرون أيضًا بالثقة (17%) يبلغون عن ما يلي: احتمال أعلى بنسبة 1.3 مرة لرؤية مكاسب في جودة الكود (44% مقابل 35%)؛ ثقة أكبر بنسبة 2.5 مرة في شحن كود الذكاء الاصطناعي (24% مقابل 9%). هذه هي المجموعة التي نعتبرها "الوضع الأمثل" - وداخلها، يبلغ أكثر من نصف المشاركين (53%) عن تحسينات واضحة في جودة الكود. هذا يشير إلى وجود ارتباط قوي بين الدقة والجودة والثقة. عندما يرى المطورون عددًا أقل من الأخطاء ومخرجات ذات جودة أعلى، يكونون أكثر عرضة للثقة بالذكاء الاصطناعي واستخدامه في الإنتاج. نرى أيضًا أن انخفاض الهلوسة يجعل المطورين أكثر عرضة بنسبة 1.3 مرة للقول إن الذكاء الاصطناعي قد حسّن جودة الكود (44% مقابل 35% بشكل عام). ومع ذلك، فإن معظم المطورين - حتى أولئك الذين لديهم مخرجات دقيقة - لا يزالون مترددين. هذا هو المكان الذي يمكن أن تصل فيه عمليات التحقق من الجودة الآلية إلى الفجوة.

اقرأ المزيد
التطوير ثقة المطور

تصحيح أخطاء المنطق في جافا باستخدام اختبارات الوحدة

2025-05-07
تصحيح أخطاء المنطق في جافا باستخدام اختبارات الوحدة

تُعرف أخطاء المنطق في تطوير جافا بصعوبة تصحيحها باستخدام الطرق التقليدية. تُقدم هذه المقالة نهجًا لتصحيح الأخطاء مدفوعًا بالاختبار، باستخدام اختبارات الوحدة للكشف عن أخطاء المنطق وتحديد مواقعها. تُفصّل المقالة العديد من تقنيات الاختبار، بما في ذلك اختبارات الفرضيات، واختبارات تقدم الحالة، واختبارات الانحدار، وتُوضح كيفية الاستفادة من نتائج الاختبار لفهم سلوك التعليمات البرمجية، وتحسين المنطق في النهاية. كما تذكر المقالة أدوات اختبار الوحدة التي تعتمد على الذكاء الاصطناعي والتي يمكن أن تساعد المطورين على الكشف بفعالية أكبر عن نقاط الضعف المحتملة في المنطق.

اقرأ المزيد
التطوير أخطاء المنطق

LangGraph: بناء مساعد ترميز ذكاء اصطناعي مرن ومتوافق مع أفضل الممارسات

2025-03-24
LangGraph: بناء مساعد ترميز ذكاء اصطناعي مرن ومتوافق مع أفضل الممارسات

بنت شركة Qodo مساعد ترميز ذكاء اصطناعي باستخدام إطار عمل LangGraph، مع تحقيق التوازن بين المرونة والالتزام بأفضل ممارسات الترميز. في البداية، استخدموا تدفقات محددة مسبقًا لمهام الترميز، ولكن مع ظهور نماذج لغة كبيرة (LLMs) أكثر قوة مثل Claude Sonnet 3.5، تحولوا إلى نهج LangGraph القائم على الرسم البياني. يسمح LangGraph ببناء وكلاء يتراوحون من مفتوحين تمامًا إلى تدفقات حتمية منظمة بالكامل، مما يسمح لشركة Qodo بتعديل بنية تدفقاتها بناءً على قدرات LLM. لقد بسّطت واجهة برمجة التطبيقات (API) النظيفة للإطار، والمكونات القابلة لإعادة الاستخدام، وإدارة الحالة المدمجة عملية التطوير ودعمت الثبات، ونقاط التفتيش، ونقاط التفرع. على الرغم من أن الوثائق والاختبارات تمثل بعض التحديات، إلا أن LangGraph قدم أساسًا متينًا لشركة Qodo لبناء مساعد ترميز ذكاء اصطناعي قوي.

اقرأ المزيد
التطوير

Qodo Gen 1.0: ترميز الذكاء الاصطناعي الوكيل باستخدام LangGraph و MCP

2025-03-18
Qodo Gen 1.0: ترميز الذكاء الاصطناعي الوكيل باستخدام LangGraph و MCP

يقدم Qodo Gen 1.0 سير عمل وكيل في إضافة IDE الخاصة به لترميز واختبار الذكاء الاصطناعي، مما يتيح للذكاء الاصطناعي اتخاذ قرارات ديناميكية حول كيفية التنقل في مهام الترميز المعقدة. تم تحقيق ذلك من خلال إعادة هيكلة البنية التحتية باستخدام LangGraph لسير العمل المنظمة وبروتوكول سياق النموذج (MCP) من Anthropic لدمج الأدوات الخارجية الموحدة. تدعم هذه البنية التحتية الاتصال غير المتزامن، واسترجاع السياق عند الطلب، ومعالجة الأخطاء المحسنة والموثوقية، مما يسمح للذكاء الاصطناعي بالعمل بشكل مستقل، واسترداد البيانات في الوقت الفعلي، وتكييف الاستراتيجيات بناءً على نتائج تنفيذ الأداة. يوفر LangGraph المرونة والتحكم، بينما يبسط MCP دمج الأدوات الخارجية. والنتيجة هي أتمتة أكثر ذكاءً، ونظام قابل للتوسيع، ونهج منظم لاستقلالية الذكاء الاصطناعي.

اقرأ المزيد
التطوير

Qodo-Embed-1: عائلة من نماذج تضمين الكود فعالة وصغيرة الحجم

2025-03-03
Qodo-Embed-1: عائلة من نماذج تضمين الكود فعالة وصغيرة الحجم

أعلنت شركة Qodo عن Qodo-Embed-1، وهي عائلة جديدة من نماذج تضمين الكود التي تحقق أداءً متطورًا مع حجم أصغر بكثير من النماذج الحالية. حقق النموذج الذي يحتوي على 1.5 مليار معلمة درجة 68.53 في مقياس CoIR، متجاوزًا نماذج أكبر حجمًا تبلغ 7 مليارات معلمة. تم تدريب النموذج باستخدام توليد البيانات الاصطناعية للتغلب على قيود النماذج الحالية في استرجاع شظايا الكود بدقة، مما يحسن دقة وكفاءة استرجاع الكود بشكل كبير. النموذج الذي يحتوي على 1.5 مليار معلمة مفتوح المصدر، بينما النموذج الذي يحتوي على 7 مليارات معلمة متاح تجاريًا.

اقرأ المزيد
الذكاء الاصطناعي تضمين الكود النموذج

بناء إطار تقييم قوي لأنظمة RAG

2025-02-14
بناء إطار تقييم قوي لأنظمة RAG

بنت شركة Qodo مساعد ترميز ذكاء اصطناعي قائم على توليد التعزيز بالاسترجاع (RAG) ، ووضعت إطار تقييم قوي لضمان الدقة والشمولية. وتضمنت التحديات التحقق من صحة مخرجات RAG المستمدة من مجموعات بيانات خاصة ضخمة. يقيم الإطار المستندات المسترجعة النهائية والمخرجات النهائية المولدة ، مع التركيز على "صحة الإجابة" و "دقة الاسترجاع". ولمعالجة تحديات مخرجات اللغة الطبيعية ، استخدموا نهج "LLM كقاضي" ، وقاموا بإنشاء مجموعة بيانات حقيقية تحتوي على أسئلة وإجابات وسياق حقيقي. ولزيادة الكفاءة ، استخدموا LLMs للمساعدة في إنشاء مجموعة البيانات ، واستخدموا LLMs و RAGAS لتقييم صحة الإجابة. وفي النهاية ، قاموا بإنشاء قاضي LLM خاص بهم ودمجوه مع RAGAS لتحسين الموثوقية ، مع دمجه في سير العمل الخاص بهم مع اختبارات الانحدار ، مما قلل بشكل كبير من الجهد المبذول للتحقق من تأثير تغييرات التعليمات البرمجية على الجودة.

اقرأ المزيد
التطوير تقييم LLM

Qodo Merge 1.0: تطوير مراجعة التعليمات البرمجية المدعومة بالذكاء الاصطناعي

2025-02-02
Qodo Merge 1.0: تطوير مراجعة التعليمات البرمجية المدعومة بالذكاء الاصطناعي

يعالج Qodo Merge 1.0، وهو أداة مراجعة التعليمات البرمجية التي تعمل بالذكاء الاصطناعي، التحديات المتأصلة في الترميز بمساعدة الذكاء الاصطناعي بعد أكثر من عام من التطوير. تتضمن النسخة الجديدة وضع التركيز على المشكلات الذي يعطي الأولوية للمشكلات الحرجة مثل الأخطاء وثغرات الأمان؛ والتعلم الديناميكي الذي يُحسّن الاقتراحات بناءً على التغييرات المقبولة؛ ودمج سياق التذاكر في الوقت الفعلي؛ وأمر `/implement` لتحويل التعليقات إلى تغييرات قابلة للتطبيق في التعليمات البرمجية. يجعل Qodo Merge 1.0 مراجعة التعليمات البرمجية أكثر دقة، وقابلية للتكيف، وكفاءة.

اقرأ المزيد

اقتراحات فعّالة لرموز الذكاء الاصطناعي: القليل هو الأكثر

2025-01-29
اقتراحات فعّالة لرموز الذكاء الاصطناعي: القليل هو الأكثر

اكتشفت شركة كودو (سابقا كوديوم) درسًا بالغ الأهمية في استخدام نماذج اللغات الكبيرة (LLMs) لمراجعة الأكواد من خلال أداة الذكاء الاصطناعي الخاصة بها، كودو ميرج. في البداية، أثبتت إعطاء الأولوية لاكتشاف الأخطاء على اقتراحات الأسلوب أنها غير فعّالة؛ فقد غمر النموذج مشاكل الأسلوب الأسهل في العثور عليها، مما أدى إلى إرهاق الاقتراحات بين المطورين. جاء التقدم من تبسيط مهمة النموذج: التركيز فقط على العثور على الأخطاء والمشاكل ذات المغزى. وقد أدى هذا التركيز الدقيق إلى زيادة معدلات اكتشاف الأخطاء ونسبة الإشارة إلى الضوضاء، مما أسفر عن زيادة بنسبة 50٪ في معدلات قبول الاقتراحات وزيادة بنسبة 11٪ في التأثير الإجمالي. الاستنتاج الرئيسي: في بعض الأحيان، يكون القضاء على المشتتات أكثر فاعلية من إعطاء الأولوية المعقدة.

اقرأ المزيد

دمج نموذج اللغة الكبير مفتوح المصدر DeepSeek-R1 في Qodo Gen

2025-01-27
دمج نموذج اللغة الكبير مفتوح المصدر DeepSeek-R1 في Qodo Gen

أعلنت شركة Qodo (سابقا Codium) عن دمج نموذج اللغة الكبير مفتوح المصدر DeepSeek-R1، وهو نموذج قوي يُضاهي أداء نموذج o1 من OpenAI، في مساعد التكويد الذي يعمل بالذكاء الاصطناعي الخاص بها، Qodo Gen. يتميز DeepSeek-R1 بقدراته القوية في الاستنتاج وفعاليته من حيث التكلفة، حيث يتعامل مع تحديات التكويد المعقدة، ويُنتج الاستجابات بسرعة أكبر وتكلفة أقل من معظم النماذج المملوكة. يدعم Qodo Gen العديد من نماذج LLMs الرائدة، مما يوفر للمطورين تجربة تكويد آمنة وموثوقة بمساعدة الذكاء الاصطناعي.

اقرأ المزيد

مطوّر أخطاء بايثون في فيجوال ستوديو كود: ما هو أبعد من جمل الطباعة

2025-01-10
مطوّر أخطاء بايثون في فيجوال ستوديو كود: ما هو أبعد من جمل الطباعة

هل سئمت من ملء كود بايثون الخاص بك بجمل الطباعة؟ ستقوم ميزات تصحيح الأخطاء القوية في Visual Studio Code بثورة في سير عملك. يغطي هذا البرنامج التعليمي إعداد مُصحح أخطاء بايثون في VS Code، وإدارة نقاط التوقف، وفحص المتغيرات، وتقنيات متقدمة مثل معالجة الاستثناءات، و تصحيح الأخطاء عن بُعد، وتحليل الأداء. تعلم كيفية تصحيح أخطاء كود بايثون بكفاءة، تاركًا عصر جمل الطباعة غير الكفؤ وراءك، وزد من كفاءة تطويرك.

اقرأ المزيد