أعلنت مؤسسة OpenAGI عن إطلاق نموذج Lux، وهو نموذج أساسي قادر على تشغيل أجهزة الحاسوب والمتصفحات تلقائياً بناءً على أوامر نصية. حقق النموذج نسبة نجاح 83.6% في معيار Online Mind2Web، متفوقاً على نماذج كبرى مثل جيميني من جوجل وأوبيراتور من OpenAI. يتميز النموذج بثلاث أوضاع تشغيل توازن بين السرعة والاستقلالية والدقة.
في خطوة متقدمة نحو تحويل المهام اليدوية البطيئة على المتصفحات وأسطح المكتب إلى أنظمة موثوقة وأوتوماتيكية، أطلقت مؤسسة OpenAGI نموذج Lux، الذي يمثل نقلة نوعية لوكلاء استخدام الحاسوب من مجرد عروض بحثية إلى بنية تحتية قابلة للتطوير. يعمل النموذج على تشغيل أجهزة الحاسوب والمتصفحات الحقيقية، ويتفوق في الأداء على المنافسين الرئيسيين في الساحة.
سجل نموذج Lux نسبة نجاح بلغت 83.6% في معيار Online Mind2Web، الذي يغطي أكثر من 300 مهمة حقيقية لاستخدام الحاسوب مأخوذة من خدمات فعلية. هذا الأداء يتفوق بوضوح على نموذج Google Gemini CUA الذي سجل 69.0%، ونموذج OpenAI Operator عند 61.3%، ونموذج Anthropic Claude Sonnet 4 عند 61.0%. يعمل Lux كنموذج لاستخدام الحاسوب وليس كنموذج دردشة مع إضافة للمتصفح؛ فهو يستقبل هدفاً مكتوباً بلغة طبيعية، يشاهد الشاشة، ثم يُخرج إجراءات منخفضة المستوى مثل النقرات وضغطات المفاتيح وأحداث التمرير.
يقدم Lux ثلاثة أوضاع تشغيل رئيسية توفر مقايضات مختلفة بين السرعة والاستقلالية والتحكم:
وضع الممثل (Actor): المسار السريع الذي يعمل بحوالي ثانية واحدة لكل خطوة، ويستهدف المهام المحددة بوضوح مثل ملء النماذج.
وضع المفكر (Thinker): يتعامل مع الأهداف الغامضة أو متعددة الخطوات، حيث يحلل التعليمات عالية المستوى إلى مهام فرعية أصغر ثم ينفذها.
وضع المنفذ (Tasker): يقدم أقصى درجات التحديد، حيث يزود المستدعي النموذج بقائمة خطوات صريحة بلغة Python لتنفيذها واحدة تلو الأخرى مع إعادة المحاولة حتى الاكتمال.
بالإضافة إلى سرعته، يُبلغ عن أن تكلفة Lux لكل رمز (token) أقل بحوالي 10 مرات من نموذج OpenAI Operator، وهو عامل حاسم للمهام الطويلة التي تتضمن مئات الإجراءات. يتم تدريب النموذج باستخدام طريقة أطلق عليها الفريق البحثي التدريب المسبق النشط الوكلائي (Agentic Active Pre-training)، حيث يتعلم النموذج من خلال التصرف في البيئات الرقمية وتحسين سلوكه عبر التفاعل واسع النطاق، بدلاً من مجرد استهلاك النصوص الثابتة من الإنترنت. يعتمد هذا الإعداد على محرك بيانات مفتوح المصدر باسم OSGym، الذي يدير أكثر من 1000 نسخة متماثلة من نظام التشغيل.
يمثل إطلاق Lux نقلة مهمة في مجال أتمتة استخدام الحاسوب، حيث يجمع بين الأداء العالي في المهام الواقعية، والمرونة عبر أوضاع تشغيل متعددة، والكفاءة من حيث السرعة والتكلفة. مع توفر النموذج عبر SDK وواجهة برمجة التطبيقات (API) من OpenAGI، وإطلاق محرك OSGym مفتوح المصدر، تفتح هذه التطورات الباب أمام فرق التطوير والبحث لبناء وتقييم وكلاء استخدام حاسوب أكثر تطوراً وموثوقية للاستخدام في سيناريوهات الإنتاج المتنوعة.
المصدر: MarkTechPost AI | تغطية حصرية من AI Tools Oasis

Bringing you the latest news and analysis in the world of Artificial Intelligence with accuracy and credibility. Follow us for all updates.

OpenAI is advancing its ambitious super app project, aiming to integrate advanced AI capabilities into a single, multifunctional platform. This development is part of the company's strategy to expand services and deliver a unified user experience. Discover the full details and expected impact of this move.

Notion has restored access to its Anthropic AI integration after a 4-hour outage disrupted users relying on Claude-powered features. The incident highlights the growing dependency on AI productivity tools and raises questions about infrastructure stability. All user data remained secure during the disruption.

A new report from TechCrunch AI warns of a potential 'Tokenpocalypse'—a massive collapse of digital tokens due to oversupply. With over 80% of new tokens losing 90% of their value, the market faces a crisis reminiscent of the dot-com bubble. This analysis explores the risks, impacts, and how investors can protect themselves.