عند الحديث عن كلفة البنية التحتية للذكاء الاصطناعي، يتجه التركيز غالبًا إلى وحدات معالجة الرسوميات من "إنفيديا"، لكن عنصرًا آخر بات يلعب دورًا حاسمًا في المعادلة: الذاكرة.
فمع استعداد شركات الحوسبة السحابية العملاقة لضخ مليارات الدولارات في مراكز بيانات جديدة، قفزت أسعار شرائح DRAM بنحو سبعة أضعاف خلال عام واحد، في مؤشر على التحول المتسارع في هيكل التكاليف داخل الصناعة.
لم يعد التحدي يقتصر على امتلاك أقوى المعالجات، بل بات يتمثل في كيفية تنظيم الذاكرة بكفاءة، لضمان وصول البيانات الصحيحة إلى النموذج المناسب في الوقت المناسب، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
الشركات التي تتقن هذه الإدارة يمكنها تنفيذ الاستعلامات نفسها بعدد أقل من الرموز (Tokens)، وهو فارق قد يحدد ما إذا كان المشروع سيحقق أرباحًا أم سيخرج من السوق.
في هذا السياق، تناول المحلل المتخصص في أشباه الموصلات دوغ أو’لوغلين في نشرته على "Substack" حوارًا مع فال بيركوفيتشي، كبير مسؤولي الذكاء الاصطناعي في شركة Weka، ركّز على أهمية شرائح الذاكرة وتأثيرها المتزايد في أداء النماذج.
أحد الأمثلة اللافتة كان ما يتعلق بصفحة تسعير التخزين المؤقت (Prompt Caching) لدى "أنثروبيك".
فبعد أن كانت الإرشادات بسيطة عند إطلاق Claude Code — استخدم التخزين المؤقت لتقليل التكلفة — تحولت الوثائق لاحقًا إلى دليل تفصيلي يشرح مستويات الشراء المسبق للذاكرة المؤقتة، مع نوافذ زمنية تمتد لخمس دقائق أو ساعة.
الفكرة الجوهرية هنا: كلما تمكنت من إبقاء بيانات الطلب داخل الذاكرة المؤقتة لفترة أطول، انخفضت تكلفة إعادة استخدامها.
لكن إضافة بيانات جديدة قد تدفع بيانات أخرى إلى الخروج من نافذة التخزين، ما يفرض معادلة دقيقة بين الأداء والكلفة.
إدارة الذاكرة لا تتوقف عند مستوى البرمجيات. ففي الطبقات الأدنى، يبرز سؤال حول كيفية استخدام مراكز البيانات لأنواع مختلفة من الذاكرة، مثل DRAM مقارنة بذاكرة HBM عالية النطاق الترددي.
أما في الطبقات الأعلى، فيعمل المطورون على تصميم أسراب نماذج تستفيد من الذاكرة المشتركة بكفاءة أكبر، ما يقلل الحاجة إلى إعادة معالجة البيانات من الصفر.
وقد ظهرت شركات ناشئة متخصصة في هذا المجال، مثل "Tensormesh"، التي تركز على تحسين طبقات التخزين المؤقت ضمن منظومة الذكاء الاصطناعي.
مع تحسن تقنيات تنظيم الذاكرة، ستتمكن الشركات من استخدام عدد أقل من الرموز في عمليات الاستدلال، ما يخفض التكلفة الإجمالية.
وبالتوازي، تتحسن كفاءة النماذج نفسها في معالجة كل رمز، ما يعزز الاتجاه النزولي في التكاليف.
النتيجة المتوقعة: تطبيقات كانت تبدو غير مجدية اقتصاديًا اليوم قد تصبح قابلة للربح مع انخفاض تكاليف الخوادم والبنية التحتية.