
تواجه شركات التكنولوجيا أزمة تكاليف متصاعدة في تشغيل نماذج الذكاء الاصطناعي، حيث تصل فواتير الرموز (tokens) إلى مئات الملايين. يستعرض التقرير جهود الصناعة لخفض النفقات عبر تحسين الكفاءة وتطوير نماذج أصغر، مع تحليل التأثير على الابتكار والاستثمارات المستقبلية.
في خضم السباق المحموم لتطوير أنظمة ذكاء اصطناعي أكثر تقدماً، برزت مشكلة خفية لكنها مدمرة: التكاليف الباهظة لتشغيل هذه النماذج. فمع كل استعلام أو توليد نص، تستهلك النماذج الكبيرة مثل GPT-4 وClaude كميات هائلة من الرموز (tokens)، مما يترجم إلى فواتير ضخمة تصل إلى مئات الملايين من الدولارات سنوياً للشركات الكبرى. هذا الواقع دفع عمالقة التكنولوجيا إلى سباق جديد: إدارة التكاليف دون التضحية بالأداء.
التقرير الذي نشرته TechCrunch AI يكشف النقاب عن الجهود السرية والعلنية التي تبذلها الشركات لمواجهة هذه الأزمة، من تحسين البنية التحتية إلى تطوير نماذج أصغر حجماً وأقل استهلاكاً للطاقة. فهل تنجح الصناعة في خفض التكاليف قبل أن تخنق الابتكار؟
وفقاً للتقرير، فإن تكلفة تشغيل نموذج ذكاء اصطناعي كبير يمكن أن تصل إلى 700 ألف دولار يومياً في بعض الحالات، مع توقعات بارتفاع هذه الأرقام مع زيادة الاعتماد على هذه الأنظمة. الشركات مثل OpenAI وGoogle وAnthropic تجد نفسها مضطرة لإنفاق مليارات الدولارات على الحوسبة السحابية والرقائق المتخصصة، مما يهدد هوامش الربح ويحد من قدرتها على تقديم خدمات مجانية أو منخفضة التكلفة.
السبب الرئيسي لهذه التكاليف هو نموذج الدفع القائم على الرموز، حيث يتم احتساب كل كلمة أو جزء منها كرمز، وتفرض شركات مثل Microsoft Azure وAmazon Web Services رسوماً على كل رمز يتم معالجته. ومع زيادة حجم النماذج وعدد المستخدمين، تتصاعد الفواتير بشكل كبير.
للتغلب على هذه المشكلة، بدأت الشركات في تطوير استراتيجيات متعددة، منها: استخدام نماذج أصغر حجماً للمهام البسيطة، تحسين كفاءة الخوارزميات لتقليل عدد الرموز المطلوبة، والاستثمار في رقائق متخصصة مثل TPU وGPU لتسريع المعالجة وتقليل استهلاك الطاقة.
هذه الأزمة قد تؤدي إلى تغيير جذري في نموذج الأعمال لشركات الذكاء الاصطناعي. فبدلاً من تقديم خدمات غير محدودة بأسعار ثابتة، قد نرى تحولاً نحو نماذج دفع أكثر تفصيلاً، أو حتى فرض حدود صارمة على الاستخدام. كما أن الشركات الناشئة قد تجد صعوبة في المنافسة مع الكبار الذين يمتلكون الموارد اللازمة لتحمل هذه التكاليف.
على الجانب الإيجابي، قد يحفز هذا الضغط على الابتكار في مجال كفاءة الذكاء الاصطناعي، مما يؤدي إلى تطوير نماذج أصغر حجماً وأكثر ذكاءً، مثل نموذج Mistral 7B أو Phi-2 من Microsoft، التي تقدم أداءً جيداً بتكلفة أقل بكثير. كما أن الاستثمار في الطاقة المتجددة لمراكز البيانات قد يصبح أولوية لتقليل التكاليف التشغيلية.
الرموز هي وحدات صغيرة من النص تعالجها نماذج الذكاء الاصطناعي، مثل الكلمات أو أجزاء منها. كلما زاد عدد الرموز، زادت التكلفة الحسابية والمالية.
بسبب الحاجة إلى موارد حاسوبية هائلة (معالجات وذاكرة) لتدريب وتشغيل النماذج الكبيرة، بالإضافة إلى رسوم الخدمات السحابية والطاقة الكهربائية.
نعم، عبر استخدام نماذج أصغر للمهام البسيطة، تحسين الخوارزميات لتقليل عدد الرموز، أو استخدام تقنيات مثل التقطير (distillation) لنقل المعرفة من نموذج كبير إلى صغير.
الشركات الناشئة ومقدمو الخدمات المجانية هم الأكثر تضرراً، بينما تستطيع الشركات الكبيرة مثل Google وMicrosoft تحمل التكاليف بفضل مواردها الضخمة.
قد يؤدي إلى فرض رسوم أعلى على الخدمات المتميزة، أو تقييد الاستخدام المجاني، أو ظهور إعلانات داخل تطبيقات الذكاء الاصطناعي.
في النهاية، تمثل فاتورة الرموز تحدياً كبيراً لصناعة الذكاء الاصطناعي، لكنها أيضاً فرصة لإعادة التفكير في كيفية تصميم وتشغيل هذه الأنظمة. الشركات التي ستنجح في تحقيق التوازن بين الأداء والتكلفة هي التي ستقود المرحلة القادمة من الابتكار. ومع استمرار الضغط، قد نشهد تحولاً نحو نماذج أكثر استدامة وكفاءة، مما يعود بالنفع على الجميع.
المصدر: TechCrunch AI | تحليل وصياغة: AI Tools Oasis

نقدم لك أحدث الأخبار والتحليلات في عالم الذكاء الاصطناعي بدقة ومصداقية. تابعنا للحصول على كل جديد.

تواصل OpenAI العمل على تطبيقها الشامل الخارق الذي يهدف إلى دمج الذكاء الاصطناعي في منصة واحدة متعددة الوظائف. يأتي هذا التطور في إطار سعي الشركة لتوسيع نطاق خدماتها وتقديم تجربة مستخدم متكاملة. تعرف على التفاصيل الكاملة والتأثير المتوقع لهذه الخطوة.

أعلنت منصة نوتيون عن استعادة الوصول إلى خدمة أنثروبيك بعد انقطاع مؤقت أثر على المستخدمين. يأتي هذا الإجراء بعد ساعات من تعطل الخدمة، مما أثار تساؤلات حول استقرار التكامل بين أدوات الإنتاجية وخدمات الذكاء الاصطناعي. نستعرض تفاصيل الحادثة وتأثيرها على المستخدمين.

تتزايد المخاوف في عالم العملات الرقمية من ظاهرة تُعرف بـ Tokenpocalypse، حيث قد يؤدي تضخم عدد الرموز إلى انهيار السوق. تحليل TechCrunch يكشف عن علامات تحذيرية وتأثيرات محتملة على المستثمرين.