كشفت جوجل النقاب عن نموذج بحثي جديد يُدعى Project Genie، قادر على توليد عوالم تفاعلية ثلاثية الأبعاد من نص أو صورة واحدة. يُمكّن المستخدم من بناء مشاهد خيالية، مثل قلاع مصنوعة من المارشملو، والتفاعل معها في بيئة غامرة. يُعد هذا المشروع خطوة كبيرة نحو مستقبل إنشاء المحتوى والألعاب بواسطة الذكاء الاصطناعي، رغم أنه لا يزال في مرحلة البحث.
في تطور مثير يدفع حدود الإبداع الرقمي، تعمل جوجل على مشروع بحثي طموح يحمل اسم Project Genie، وهو نموذج ذكاء اصطناعي قادر على تحويل الأفكار البسيطة إلى عوالم تفاعلية ثلاثية الأبعاد كاملة. يأتي هذا الإعلان بعد أن شارك أحد الصحفيين تجربة شخصية فريدة، حيث تمكن من بناء قلاع خيالية مصنوعة من حلوى المارشملو داخل هذه البيئة المُولدة آلياً. لا يهدف المشروع إلى مجرد إنشاء صور ثابتة، بل إلى هندسة مساحات غامرة يمكن للمستخدم استكشافها واللعب فيها، مما يضع لبنة جديدة في طريق دمج الذكاء الاصطناعي في مجالات الترفيه والتعليم وحتى التصميم. يُشير هذا التقدم إلى تحول جذري في كيفية تفاعلنا مع الآلات، حيث تصبح قادرة على فهم نوايانا الإبداعية وتحويلها إلى واقع افتراضي على الفور.
يعتمد Project Genie على نموذج أساسي مدرب على ملايين مقاطع الفيديو، مما يمنحه فهماً عميقاً للديناميكيات البصرية والفيزيائية للعالم الحقيقي. تبدأ العملية عندما يقدم المستخدم إشارة بصرية، مثل رسمة بسيطة أو صورة حقيقية، أو حتى مجرد وصف نصي. يقوم النموذج بعد ذلك بتفسير هذا المُدخل وتوليد عالم ثلاثي الأبعاد تفاعلي بالكامل يتوافق معه. الميزة الأبرز هي قدرة المستخدم على التفاعل مع هذا العالم المُولد، مثل تحريك الشخصيات أو تعديل العناصر داخل المشهد، مما يخلق تجربة ديناميكية تشبه اللعبة ولكن من خلال أوامر طبيعية.
التجربة التي سلطت عليها التقارير الضوء تمثلت في إنشاء مشهد لـ قلعة ساحرة مصنوعة بالكامل من المارشملو، مع أبراج حلوى وأسوار ناعمة، في بيئة سحرية. لم يكن المشهد مجرد صورة جميلة، بل كان عالماً يمكن التجول فيه، مما يبرز القوة التخيلية الهائلة للأداة. هذا النهج يختلف عن أدوات توليد الصور الشائعة مثل DALL-E أو Midjourney، حيث يركز Project Genie على التفاعل والاستمرارية المكانية، مما يجعله أقرب إلى محرك لألعاب الفيديو يُدار بالذكاء الاصطناعي.
السر التقني يكمن في تدريب النموذج على فهم التمثيلات المكانية والحركية. بدلاً من تعلم إنشاء إطارات فردية، يتعلم النموذج كيف تبدو الأشياء من زوايا مختلفة وكيف تتحرك وتتفاعل مع بعضها البعض. هذا يسمح له ببناء مشهد متماسك يمكن للمستخدم التنقل فيه بحرية. ومع ذلك، تؤكد جوجل أن المشروع هو أبحاث أولية بحتة ولم يتم تحديد موعد لإتاحته للجمهور، حيث لا تزال هناك تحديات تتعلق بالاستقرار والحوسبة المطلوبة.
يُعد إطلاق مثل هذه التقنية مؤشراً قوياً على اتجاه صناعة التكنولوجيا نحو توليد المحتوى الديناميكي بواسطة الذكاء الاصطناعي. يمكن أن تكون التأثيرات بعيدة المدى:
أدوات مثل DALL-E أو Stable Diffusion تولد صوراً ثنائية الأبعاد ثابتة بناءً على النص. بينما يركز Project Genie على إنشاء عوالم تفاعلية ثلاثية الأبعاد يمكن التنقل فيها واللعب مع عناصرها، مما يوفر تجربة غامرة وديناميكية تشبه اللعبة أكثر من كونها لوحة فنية.
لا، المشروع لا يزال في مرحلة البحث والتطوير داخل مختبرات جوجل. التقارير الحالية تستند إلى تجارب محدودة أجراها باحثون وشركاء مختارون. لم تعلن جوجل عن أي خطط أو جدول زمني لإطلاقه كمنتج أو خدمة عامة.
يمكن للنموذج العمل مع مدخلات متنوعة، بما في ذلك: الوصف النصي (مثل "قلعة من المارشملو في غابة سحرية")، أو الصور الفوتوغرافية، أو حتى الرسومات والاسكتشات البسيطة. يقوم بعد ذلك بتفسير هذا المُدخل وتخيل العالم ثلاثي الأبعاد المناسب له.
أبرز التحديات تشمل: متطلبات الحوسبة العالية جداً لتوليد العوالم وتشغيلها في الوقت الفعلي، وضمان الاستقرار والاتساق المنطقي للعالم المُولد (ألا تظهر أشياء غريبة أو تتحرك بشكل غير طبيعي)، بالإضافة إلى القضايا الأخلاقية المتعلقة بإنشاء محتوى واقعي قد يكون مضللاً أو ضاراً.
بالتأكيد. التطبيقات المحتملة واسعة وتشمل: التصميم المعماري والداخلي (إنشاء نماذج أولية سريعة)، التعليم (محاكاة أحداث تاريخية أو ظواهر علمية)، والتدريب المهني (مثل محاكاة سيناريوهات الطوارئ للعاملين في المجال الطبي أو الهندسي).
يمثل مشروع جوجل Project Genie لمحة مبهرة عن المستقبل القريب، حيث يتحول الذكاء الاصطناعي من أداة للإجابة على الأسئلة أو إنشاء الصور إلى شريك إبداعي قادر على بناء عوالم كاملة. تجربة بناء قلعة المارشملو ليست مجرد لعبة عابرة، بل هي إثبات لمفهوم قد يعيد تعريف صناعات كاملة من الألعاب إلى الأفلام إلى التصميم. بينما لا يزال الطريق طويلاً قبل أن تصبح هذه التقنية في متناول الجميع، فإنها ترسم صورة لمستقبل تكون فيه حدود الإبداع الوحيدة هي خيال الإنسان، بينما يتولى الذكاء الاصطناعي مهمة التنفيذ الفني المعقد. المعضلة القادمة لن تكون في "إذا" كان بإمكاننا بناء هذه العوالم، بل في "كيف" سنستخدم هذه القوة الخلاقة بشكل مسؤول ومفيد للبشرية.
المصدر: TechCrunch AI | تحليل وصياغة: AI Tools Oasis

نقدم لك أحدث الأخبار والتحليلات في عالم الذكاء الاصطناعي بدقة ومصداقية. تابعنا للحصول على كل جديد.

تواصل OpenAI العمل على تطبيقها الشامل الخارق الذي يهدف إلى دمج الذكاء الاصطناعي في منصة واحدة متعددة الوظائف. يأتي هذا التطور في إطار سعي الشركة لتوسيع نطاق خدماتها وتقديم تجربة مستخدم متكاملة. تعرف على التفاصيل الكاملة والتأثير المتوقع لهذه الخطوة.

أعلنت منصة نوتيون عن استعادة الوصول إلى خدمة أنثروبيك بعد انقطاع مؤقت أثر على المستخدمين. يأتي هذا الإجراء بعد ساعات من تعطل الخدمة، مما أثار تساؤلات حول استقرار التكامل بين أدوات الإنتاجية وخدمات الذكاء الاصطناعي. نستعرض تفاصيل الحادثة وتأثيرها على المستخدمين.

تتزايد المخاوف في عالم العملات الرقمية من ظاهرة تُعرف بـ Tokenpocalypse، حيث قد يؤدي تضخم عدد الرموز إلى انهيار السوق. تحليل TechCrunch يكشف عن علامات تحذيرية وتأثيرات محتملة على المستثمرين.