أعلنت مؤسسة OpenAGI عن إطلاق نموذج Lux، وهو نموذج أساسي قادر على تشغيل أجهزة الحاسوب والمتصفحات تلقائياً بناءً على أوامر نصية. حقق النموذج نسبة نجاح 83.6% في معيار Online Mind2Web، متفوقاً على نماذج كبرى مثل جيميني من جوجل وأوبيراتور من OpenAI. يتميز النموذج بثلاث أوضاع تشغيل توازن بين السرعة والاستقلالية والدقة.
في خطوة متقدمة نحو تحويل المهام اليدوية البطيئة على المتصفحات وأسطح المكتب إلى أنظمة موثوقة وأوتوماتيكية، أطلقت مؤسسة OpenAGI نموذج Lux، الذي يمثل نقلة نوعية لوكلاء استخدام الحاسوب من مجرد عروض بحثية إلى بنية تحتية قابلة للتطوير. يعمل النموذج على تشغيل أجهزة الحاسوب والمتصفحات الحقيقية، ويتفوق في الأداء على المنافسين الرئيسيين في الساحة.
سجل نموذج Lux نسبة نجاح بلغت 83.6% في معيار Online Mind2Web، الذي يغطي أكثر من 300 مهمة حقيقية لاستخدام الحاسوب مأخوذة من خدمات فعلية. هذا الأداء يتفوق بوضوح على نموذج Google Gemini CUA الذي سجل 69.0%، ونموذج OpenAI Operator عند 61.3%، ونموذج Anthropic Claude Sonnet 4 عند 61.0%. يعمل Lux كنموذج لاستخدام الحاسوب وليس كنموذج دردشة مع إضافة للمتصفح؛ فهو يستقبل هدفاً مكتوباً بلغة طبيعية، يشاهد الشاشة، ثم يُخرج إجراءات منخفضة المستوى مثل النقرات وضغطات المفاتيح وأحداث التمرير.
يقدم Lux ثلاثة أوضاع تشغيل رئيسية توفر مقايضات مختلفة بين السرعة والاستقلالية والتحكم:
وضع الممثل (Actor): المسار السريع الذي يعمل بحوالي ثانية واحدة لكل خطوة، ويستهدف المهام المحددة بوضوح مثل ملء النماذج.
وضع المفكر (Thinker): يتعامل مع الأهداف الغامضة أو متعددة الخطوات، حيث يحلل التعليمات عالية المستوى إلى مهام فرعية أصغر ثم ينفذها.
وضع المنفذ (Tasker): يقدم أقصى درجات التحديد، حيث يزود المستدعي النموذج بقائمة خطوات صريحة بلغة Python لتنفيذها واحدة تلو الأخرى مع إعادة المحاولة حتى الاكتمال.
بالإضافة إلى سرعته، يُبلغ عن أن تكلفة Lux لكل رمز (token) أقل بحوالي 10 مرات من نموذج OpenAI Operator، وهو عامل حاسم للمهام الطويلة التي تتضمن مئات الإجراءات. يتم تدريب النموذج باستخدام طريقة أطلق عليها الفريق البحثي التدريب المسبق النشط الوكلائي (Agentic Active Pre-training)، حيث يتعلم النموذج من خلال التصرف في البيئات الرقمية وتحسين سلوكه عبر التفاعل واسع النطاق، بدلاً من مجرد استهلاك النصوص الثابتة من الإنترنت. يعتمد هذا الإعداد على محرك بيانات مفتوح المصدر باسم OSGym، الذي يدير أكثر من 1000 نسخة متماثلة من نظام التشغيل.
يمثل إطلاق Lux نقلة مهمة في مجال أتمتة استخدام الحاسوب، حيث يجمع بين الأداء العالي في المهام الواقعية، والمرونة عبر أوضاع تشغيل متعددة، والكفاءة من حيث السرعة والتكلفة. مع توفر النموذج عبر SDK وواجهة برمجة التطبيقات (API) من OpenAGI، وإطلاق محرك OSGym مفتوح المصدر، تفتح هذه التطورات الباب أمام فرق التطوير والبحث لبناء وتقييم وكلاء استخدام حاسوب أكثر تطوراً وموثوقية للاستخدام في سيناريوهات الإنتاج المتنوعة.
المصدر: MarkTechPost AI | تغطية حصرية من AI Tools Oasis

نقدم لك أحدث الأخبار والتحليلات في عالم الذكاء الاصطناعي بدقة ومصداقية. تابعنا للحصول على كل جديد.

تواصل OpenAI العمل على تطبيقها الشامل الخارق الذي يهدف إلى دمج الذكاء الاصطناعي في منصة واحدة متعددة الوظائف. يأتي هذا التطور في إطار سعي الشركة لتوسيع نطاق خدماتها وتقديم تجربة مستخدم متكاملة. تعرف على التفاصيل الكاملة والتأثير المتوقع لهذه الخطوة.

أعلنت منصة نوتيون عن استعادة الوصول إلى خدمة أنثروبيك بعد انقطاع مؤقت أثر على المستخدمين. يأتي هذا الإجراء بعد ساعات من تعطل الخدمة، مما أثار تساؤلات حول استقرار التكامل بين أدوات الإنتاجية وخدمات الذكاء الاصطناعي. نستعرض تفاصيل الحادثة وتأثيرها على المستخدمين.

تتزايد المخاوف في عالم العملات الرقمية من ظاهرة تُعرف بـ Tokenpocalypse، حيث قد يؤدي تضخم عدد الرموز إلى انهيار السوق. تحليل TechCrunch يكشف عن علامات تحذيرية وتأثيرات محتملة على المستثمرين.