أعلنت جوجل عن دمج قدرات جديدة لتوليد الموسيقى باستخدام الذكاء الاصطناعي ضمن تطبيق جيميني المساعد. تتيح الميزة للمستخدمين إنشاء مؤلفات موسيقية أصلية بناءً على أوصاف نصية بسيطة. يأتي هذا التطوير في إطار سباق الشركات التقنية الكبرى لتعزيز أدوات الذكاء الاصطناعي الإبداعية. يُتوقع أن تُحدث هذه الإضافة تغييراً في طريقة تفاعل المستخدمين مع المحتوى الصوتي.
في خطوة جديدة تعزز من قدرات الذكاء الاصطناعي الإبداعي، أعلنت جوجل رسمياً عن إضافة ميزة توليد الموسيقى إلى تطبيقها المساعد جيميني. يأتي هذا التطوير في وقت تشتد فيه المنافسة بين عمالقة التكنولوجيا لتقديم أدوات ذكاء اصطناعي متعددة الوسائط. تسمح الميزة الجديدة للمستخدمين بتحويل الأوصاف النصية إلى مقاطع موسيقية أصلية، مما يفتح آفاقاً جديدة للمبدعين والهواة على حد سواء. تُعد هذه الخطوة جزءاً من استراتيجية جوجل الشاملة لجعل جيميني منصة شاملة للذكاء الاصطناعي التفاعلي.
كشفت جوجل النقاب عن أن ميزة توليد الموسيقى ستكون متاحة للمستخدمين عبر تطبيق جيميني على نظامي أندرويد وiOS. تعتمد التقنية على نماذج ذكاء اصطناعي متقدمة تم تدريبها على مجموعات بيانات موسيقية ضخمة، تمكنها من فهم السياق العاطفي والنمط الموسيقي من الوصف النصي.
يمكن للمستخدمين تفعيل الميزة ببساطة من خلال إعطاء أوامر نصية مثل "اصنع لي موسيقى هادئة للاسترخاء" أو "أنشئ لحناً حماسياً لمقاطع الفيديو". يعمل النموذج بعد ذلك على تحليل الطلب وإنشاء مقطع صوتي فريد يتناسب مع الوصف. تشمل الخيارات المتاحة للمستخدم تحديد:
أكدت جوجل أن جميع المقطوعات المُنشأة هي أصلية 100% ولا تنتهك حقوق الملكية الفكرية، حيث يتم توليدها في الوقت الفعلي بناءً على معلمات المستخدم.
يُعتبر دخول جوجل إلى مجال توليد الموسيقى بالذكاء الاصطناعي نقطة تحول مهمة في الصناعة. فبينما كانت أدوات مثل OpenAI's Jukebox وMeta's AudioCraft موجودة منذ فترة، فإن دمج هذه القدرة في تطبيق مساعد واسع الانتشار مثل جيميني يجعلها في متناول الملايين. هذا التكامل السلس قد يغير قواعد اللعبة في مجالات مثل:
من الناحية التقنية، تشير التسريبات إلى أن جوجل استخدمت نموذجاً هجيناً يجمع بين تقنيات المحولات العصبية (Transformers) وشبكات التوليد التلافيفية (GANs) لتحقيق جودة صوت عالية مع تنوع إبداعي. كما أن دمج هذه الميزة ضمن تطبيق موجود يقلل من حاجز الدخول للمستخدمين العاديين مقارنة بالأدوات المتخصصة.
حالياً، تقدم جوجل الميزة ضمن الخدمات الأساسية لتطبيق جيميني المجاني، لكنها قد تقدم مستويات متقدمة مدفوعة في المستقبل مع خيارات أكثر تعقيداً وجودة أعلى.
نعم، أكدت جوجل أن المستخدمين يحتفظون بحقوق الاستخدام التجاري للمقطوعات التي ينشئونها عبر المنصة، شريطة الالتزام بشروط الخدمة العامة.
الإصدار الأولي يركز على المقطوعات الموسيقية القصيرة (حتى دقيقتين) ولا يدعم توليد الأغاني الكاملة مع كلمات، لكن جوجل تخطط لإضافة هذه الميزة في التحديثات القادمة.
تعتمد جوجل على قاعدة بيانات تدريب خالية من المواد المحمية بحقوق الطبع والنشر، وتستخدم تقنيات لمنع التقليد المباشر لأعمال فنانين محددين.
الإطلاق الأولي سيكون في عدد محدود من الدول الناطقة بالإنجليزية، مع خطط للتوسع الجغرافي واللغوي تدريجياً خلال العام الحالي.
تمثل إضافة قدرة توليد الموسيقى إلى جيميني علامة فارقة في رحلة جوجل نحو جعل الذكاء الاصطناعي شريكاً إبداعياً حقيقياً. هذه الخطوة لا تعزز فقط من قدرات التطبيق التنافسية، بل تضع معايير جديدة لما يمكن أن تقدمه أدوات الذكاء الاصطناعي للمستخدمين العاديين. مع استمرار تطور هذه التقنيات، يمكننا توقع رؤية المزيد من الأدوات الإبداعية المتكاملة التي تختصر المسافة بين الفكرة والتطبيق، مما ي democratizes عملية الإبداع الفني ويجعلها في متناول الجميع.
المصدر: TechCrunch AI | تحليل وصياغة: AI Tools Oasis

نقدم لك أحدث الأخبار والتحليلات في عالم الذكاء الاصطناعي بدقة ومصداقية. تابعنا للحصول على كل جديد.

تواصل OpenAI العمل على تطبيقها الشامل الخارق الذي يهدف إلى دمج الذكاء الاصطناعي في منصة واحدة متعددة الوظائف. يأتي هذا التطور في إطار سعي الشركة لتوسيع نطاق خدماتها وتقديم تجربة مستخدم متكاملة. تعرف على التفاصيل الكاملة والتأثير المتوقع لهذه الخطوة.

أعلنت منصة نوتيون عن استعادة الوصول إلى خدمة أنثروبيك بعد انقطاع مؤقت أثر على المستخدمين. يأتي هذا الإجراء بعد ساعات من تعطل الخدمة، مما أثار تساؤلات حول استقرار التكامل بين أدوات الإنتاجية وخدمات الذكاء الاصطناعي. نستعرض تفاصيل الحادثة وتأثيرها على المستخدمين.

تتزايد المخاوف في عالم العملات الرقمية من ظاهرة تُعرف بـ Tokenpocalypse، حيث قد يؤدي تضخم عدد الرموز إلى انهيار السوق. تحليل TechCrunch يكشف عن علامات تحذيرية وتأثيرات محتملة على المستثمرين.