ما هي المشكلة التي يحلها تيتانز وميراس؟

يحلان مشكلة محدودية السياق الطويل في النماذج الحالية، حيث إما أن تكون التكلفة مرتفعة جداً أو تفقد المعلومات في التسلسلات الطويلة.

كيف يعمل تيتانز على تحسين الذاكرة طويلة المدى؟

يستخدم ذاكرة عصبية عميقة تتعلم أثناء الاختبار، وتخزن فقط الرموز "المفاجئة" غير المتوقعة عبر مقياس قائم على التدرج، مع آلية نسيان فعالة.

ما الفرق بين تيتانز وميراس؟

تيتانز هو نموذج معماري محدد يجمع بين الانتباه والذاكرة العصبية، بينما ميراس هو إطار عمل نظري موحد لتصميم نماذج تسلسلية كذاكرة ترابطية.

جوجل تطرح تيتانز وميراس: ثورة في ذاكرة الذكاء الاصطناعي الطويلة المدى |...

جوجل تطرح تيتانز وميراس: ثورة في ذاكرة الذكاء الاصطناعي الطويلة المدى

تطرح جوجل ريسيرش رؤية جديدة لما بعد نماذج المحولات (Transformers) عبر مشروعي تيتانز (Titans) وميراس (MIRAS)، بهدف منح نماذج التسلسل ذاكرة طويلة المدى قابلة للاستخدام مع الحفاظ على التدريب المتوازي والاستدلال شبه الخطي. يأتي هذا الابتكار لمعالجة قيود النماذج الحالية، حيث تزداد تكلفة الانتباه القياسي تربيعياً مع طول السياق، بينما تفقد النماذج الخطية الكفؤة المعلومات في التسلسلات الطويلة جداً.

التفاصيل التقنية والآلية

يقدم تيتانز بنية معمارية ملموسة تضيف ذاكرة عصبية عميقة إلى هيكل محولات. يعمل الانتباه كذاكرة قصيرة المدى دقيقة على النافذة الحالية، بينما توفر وحدة عصبية منفصلة ذاكرة طويلة المدى تتعلم أثناء وقت الاختبار. تستخدم تيتانز مقياس "المفاجأة" القائم على التدرج لتخزين الرموز غير المتوقعة وتجاهل المتوقع منها. من الناحية المعمارية، يستخدم تيتانز ثلاثة فروع للذاكرة: فرع أساسي للتعلم في السياق، وفرع ذاكرة سياقية تتعلم من التسلسل الحديث، وفرع ذاكرة دائمة بأوزان ثابتة تشفر معرفة ما قبل التدريب.

أما ميراس فهو إطار عمل عام ينظر إلى معظم نماذج التسلسل الحديثة كحالات من التحسين عبر الإنترنت لذاكرة ترابطية. يعرّف أي نموذج تسلسلي من خلال أربعة خيارات تصميم: هيكل الذاكرة، والتحيز الانتباهي، وبوابة الاحتفاظ، وخوارزمية الذاكرة. من خلال هذه العدسة، يستعيد ميراس عدة عائلات من النماذج ويسمح ببناء نماذج جديدة خالية من الانتباه مثل مونيتا ويااد وميمورا.

النتائج والأداء

في النمذجة اللغوية ومهام التفكير المنطقي مثل C4 وWikiText وHellaSwag، تفوقت بنية تيتانز على أحدث النماذج الخطية المتكررة مثل Mamba-2 وGated DeltaNet ونماذج Transformer++ ذات الحجم المماثل. في مهمة استرجاع السياق الطويل المتطرف (BABILong)، حيث يتم توزيع الحقائق عبر مستندات طويلة جداً، تفوق تيتانز على جميع النماذج الأساسية، بما في ذلك النماذج الكبيرة جداً مثل GPT-4، مع استخدام عدد أقل من المعلمات، ووصل إلى نوافذ سياق تتجاوز 2,000,000 رمز. كما حافظ تيتانز على التدريب المتوازي الكفؤ والاستدلال الخطي السريع.

الخلاصة

يمثل تيتانز وميراس نقلة نوعية في معالجة السياقات الطويلة، حيث يجمعان بين دقة الذاكرة قصيرة المدى وقدرة الذاكرة طويلة المدى في إطار موحد وكفؤ. تفتح هذه الابتكارات الباب أمام نماذج ذكاء اصطناعي أكثر قدرة على فهم التفاعلات المعقدة والطويلة في النصوص والجينوم وغيرها من البيانات التسلسلية، مع الحفاظ على الكفاءة الحسابية. يُظهر الأداء المتفوق في المهام المعيارية إمكانات هذين النموذجين ليكونا حجر الأساس للجيل القادم من نماذج اللغة الكبيرة.

المصدر: MarkTechPost AI | تغطية حصرية من AI Tools Oasis

From Transformers to Associative Memory, How Titans and MIRAS Rethink Long Context Modeling

جوجل تطرح تيتانز وميراس: ثورة في ذاكرة الذكاء الاصطناعي الطويلة المدى

التفاصيل التقنية والآلية

النتائج والأداء

الخلاصة

AI Tools Oasis Team

Related News

OpenAI Super App Development Continues: What's New?

Notion Restores Anthropic AI Integration After 4-Hour Outage

Tokenpocalypse Warning: Is the Crypto Market Heading for a Collapse?