تحديث DeepSeek V3: الابتكار في الخوارزمية يقود نمط جديد للذكاء الاصطناعي، وقد تستمر حاجة قوة الحوسبة في الارتفاع.

robot
إنشاء الملخص قيد التقدم

تحديث DeepSeek V3: الابتكار في الخوارزمية يقود نموذجًا جديدًا للذكاء الاصطناعي

أصدرت DeepSeek مؤخرًا تحديث الإصدار V3 على منصة Hugging Face - DeepSeek-V3-0324، حيث تم تحسين هذا النموذج الذي يحتوي على 6850 مليار معلمة بشكل ملحوظ في قدرات البرمجة وتصميم واجهة المستخدم وقدرات الاستدلال.

في مؤتمر GTC 2025 الذي عُقد مؤخرًا، أشاد الرئيس التنفيذي لشركة إنفيديا، جين هوانغ، بإنجازات DeepSeek. وأشار إلى أن السوق كان يعتقد سابقًا أن النموذج الفعال لـ DeepSeek سيقلل من الطلب على الرقائق، وهو أمر خاطئ، حيث أن الطلب على الحوسبة في المستقبل سيزداد بدلاً من أن ينقص.

كنموذج للانفراجة في الخوارزمية ، فإن العلاقة بين DeepSeek وموارد الحوسبة تستحق الدراسة المتعمقة. يمكننا تحليل هذه المسألة من منظور تأثير موارد الحوسبة والخوارزمية على تطور صناعة الذكاء الاصطناعي.

من المنافسة على القدرة الحاسوبية إلى الابتكار الخوارزمي: النموذج الجديد للذكاء الاصطناعي الذي تقوده DeepSeek

قوة التعدين وتطور الخوارزمية

في مجال الذكاء الاصطناعي، أدت زيادة القدرة الحاسوبية إلى توفير أساس لتشغيل خوارزميات أكثر تعقيدًا، مما يمكّن النماذج من معالجة بيانات أكبر حجمًا وتعلم أنماط أكثر تعقيدًا. في الوقت نفسه، يمكن أن يؤدي تحسين الخوارزمية إلى استخدام القدرة الحاسوبية بشكل أكثر كفاءة، مما يزيد من كفاءة استخدام موارد الحوسبة.

هذه العلاقة التبادلية تعيد تشكيل ملامح صناعة الذكاء الاصطناعي:

  1. تباين المسارات التقنية: تسعى بعض الشركات لبناء تجمعات حوسبة ضخمة للغاية، بينما تركز أخرى على تحسين كفاءة الخوارزمية، مما يؤدي إلى تشكيل مدارس تقنية مختلفة.

  2. إعادة بناء سلسلة القيمة: أصبحت بعض الشركات المصنعة للشرائح من خلال النظام البيئي رائدة في قوة الذكاء الاصطناعي، بينما خفض مقدمو خدمات السحابية عتبة النشر من خلال خدمات القوة المرنة.

  3. تعديل تخصيص الموارد: تسعى الشركات لتحقيق التوازن بين استثمار البنية التحتية للأجهزة وتطوير الخوارزمية الفعالة.

  4. ظهور المجتمعات المفتوحة المصدر: نماذج المصدر المفتوح مثل DeepSeek و LLaMA تتيح مشاركة الابتكارات في الخوارزمية وإنجازات تحسين قوة الحوسبة، مما يسرع من تكرار التقنية وانتشارها.

الابتكارات التقنية لـ DeepSeek

إن الصعود السريع لـ DeepSeek مرتبط ارتباطًا وثيقًا بالابتكارات التكنولوجية الخاصة بها. فيما يلي شرح مبسط لنقاط الابتكار الرئيسية لديها:

تحسين هيكل النموذج

تستخدم DeepSeek بنية تجمع بين Transformer و MOE (الخبراء المختلطين) ، وتقدم آلية الانتباه المحتمل المتعدد (MLA). هذه البنية تشبه فريقًا فعالًا حيث يتعامل Transformer مع المهام الروتينية ، بينما يعمل MOE كفريق من الخبراء ، حيث يمتلك كل خبير مجال تخصص خاص به. تتيح آلية MLA للنموذج التركيز بشكل أكثر مرونة على التفاصيل المهمة المختلفة ، مما يعزز الأداء بشكل أكبر.

أساليب التدريب الجديدة

قدمت DeepSeek إطار عمل تدريب مختلط الدقة FP8. يتيح هذا الإطار اختيار دقة الحساب المناسبة ديناميكيًا بناءً على احتياجات مراحل التدريب المختلفة، مما يحسن من سرعة التدريب ويقلل من استهلاك الذاكرة مع ضمان دقة النموذج.

تحسين كفاءة الخوارزمية

قامت DeepSeek بتقديم تقنية التنبؤ المتعدد الرموز (MTP). على عكس طرق التنبؤ التقليدية التدريجية، فإن تقنية MTP قادرة على التنبؤ بعدة رموز في آن واحد، مما يسرع من سرعة الاستدلال بشكل كبير، ويقلل من التكاليف.

###突破 الخوارزمية التعلم المعزز

لقد حسّن خوارزمية التعلم المعزز الجديدة GRPO (تحسين المكافآت العامة والعقوبات) من DeepSeek عملية تدريب النموذج. يمكن لهذه الخوارزمية تحقيق توازن بين الأداء والتكلفة مع ضمان تحسين أداء النموذج وتقليل الحسابات غير الضرورية.

تشكّل هذه الابتكارات نظامًا تقنيًا كاملًا، حيث تقلل من متطلبات قوة الحوسبة على طول سلسلة التدريب إلى الاستدلال. الآن، يمكن لبطاقات الرسوميات الاستهلاكية العادية تشغيل نماذج الذكاء الاصطناعي القوية، مما يقلل بشكل كبير من عوائق استخدام الذكاء الاصطناعي، ويسمح لمزيد من المطورين والشركات بالمشاركة في الابتكار في مجال الذكاء الاصطناعي.

تأثير على شركات تصنيع الرقائق

تؤثر الابتكارات التكنولوجية لـ DeepSeek على شركات تصنيع الرقائق بشكل مزدوج. من ناحية، أصبح ارتباط DeepSeek بالأجهزة والنظام البيئي المعني أعمق، وقد يؤدي انخفاض عتبة تطبيقات الذكاء الاصطناعي إلى توسيع حجم السوق الكلي. من ناحية أخرى، قد تؤدي تحسينات خوارزمية DeepSeek إلى تغيير هيكل الطلب في السوق على الرقائق عالية الجودة، حيث يمكن الآن تشغيل بعض نماذج الذكاء الاصطناعي التي كانت بحاجة إلى وحدات معالجة رسومات من الطراز الأول بكفاءة على بطاقات الرسومات المتوسطة أو حتى الاستهلاكية.

معنى صناعة الذكاء الاصطناعي في الصين

أدت تحسينات DeepSeek في الخوارزمية إلى توفير مسار تقني لصناعة الذكاء الاصطناعي في الصين. في ظل القيود المفروضة على الشرائح عالية الجودة، خفف التفكير في "البرمجيات تعوض عن الأجهزة" من الاعتماد على الشرائح المستوردة المتميزة.

في upstream، خفضت الخوارزمية الفعالة ضغط متطلبات قوة الحوسبة، مما يمكن مقدمي خدمات الحوسبة من تمديد فترة استخدام الأجهزة من خلال تحسين البرمجيات وزيادة العائد على الاستثمار. في downstream، خفض النموذج المفتوح المصدر المحسن من عائق تطوير تطبيقات الذكاء الاصطناعي. لا تحتاج العديد من الشركات الصغيرة والمتوسطة إلى موارد قوة حوسبة كبيرة، ويمكنها أيضًا تطوير تطبيقات تنافسية بناءً على نموذج DeepSeek، مما سيؤدي إلى ظهور المزيد من حلول الذكاء الاصطناعي في المجالات الرأسية.

التأثير العميق لـ Web3 + AI

بنية تحتية للذكاء الاصطناعي اللامركزي

تقدم تحسينات الخوارزمية في DeepSeek دفعة جديدة للبنية التحتية للذكاء الاصطناعي Web3. تجعل المعمارية المبتكرة، والخوارزميات الفعالة، ومتطلبات قوة الحوسبة المنخفضة، الاستدلال الذكي اللامركزي ممكنًا. تعد معمارية MoE مناسبة بشكل طبيعي للتوزيع الموزع، حيث يمكن أن تمتلك العقد المختلفة شبكات خبراء مختلفة، دون الحاجة إلى تخزين نموذج كامل في عقدة واحدة، مما يقلل بشكل كبير من متطلبات التخزين والحساب للعقدة الواحدة، وبالتالي يعزز مرونة وكفاءة النموذج.

إطار تدريب FP8 يقلل بشكل أكبر من الحاجة إلى موارد الحوسبة المتقدمة، مما يسمح لمزيد من موارد الحوسبة بالانضمام إلى شبكة العقد. وهذا لا يقلل فقط من عتبة المشاركة في الحوسبة اللامركزية للذكاء الاصطناعي، بل يعزز أيضًا القدرة والكفاءة الحوسبية للشبكة بأكملها.

أنظمة متعددة الوكلاء

  1. تحسين استراتيجيات التداول الذكية: من خلال تحليل بيانات السوق في الوقت الفعلي، وتوقع تقلبات الأسعار قصيرة الأجل، وتنفيذ التداولات على السلسلة، ومراقبة نتائج الصفقات، تساعد على تشغيل عدة عوامل ذكية بالتعاون لتحقيق عوائد أعلى للمستخدمين.

  2. التنفيذ التلقائي للعقود الذكية: تعمل الوكلاء الذكيون على مراقبة العقود الذكية وتنفيذها ومراقبة النتائج، مما يحقق أتمتة منطق الأعمال الأكثر تعقيدًا.

  3. إدارة محافظ الاستثمار الشخصية: تساعد الخوارزمية المستخدمين في البحث عن أفضل فرص الرهن أو توفير السيولة في الوقت الحقيقي بناءً على تفضيلات المخاطر وأهداف الاستثمار والوضع المالي للمستخدم.

ديب سيك هو بالضبط من خلال قيود قوة الحساب، من خلال الابتكار في الخوارزمية للبحث عن اختراق، وفتح مسار تطوير مختلف لصناعة الذكاء الاصطناعي في الصين. خفض عتبة التطبيق، وتعزيز دمج الويب 3 مع الذكاء الاصطناعي، والحد من الاعتماد على الشرائح المتطورة، وتمكين الابتكار المالي، هذه التأثيرات تعيد تشكيل مشهد الاقتصاد الرقمي. في المستقبل، لن يكون تطوير الذكاء الاصطناعي مجرد سباق قوة حساب، بل سيكون سباقاً للتعاون الأمثل بين قوة الحساب والخوارزمية. في هذا المسار الجديد، يقوم مبتكرون مثل ديب سيك بإعادة تعريف قواعد اللعبة بالحكمة الصينية.

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
wagmi_eventuallyvip
· 07-11 19:09
خفض التكاليف وزيادة الكفاءة yyds!
شاهد النسخة الأصليةرد0
DataOnlookervip
· 07-08 22:09
يجب أن نضيف بطاقة الرسوميات أيضًا
شاهد النسخة الأصليةرد0
AirdropSkepticvip
· 07-08 22:05
لا معنى له، لا يمكن التفوق على Zhipu.
شاهد النسخة الأصليةرد0
BearMarketBardvip
· 07-08 21:57
挺住别 الارتفاع,v4马上来了
شاهد النسخة الأصليةرد0
RektButStillHerevip
· 07-08 21:54
حقق تخفيض التكاليف وزيادة الكفاءة
شاهد النسخة الأصليةرد0
All-InQueenvip
· 07-08 21:54
حزب الشريحة قد بلغ ذروته مرة أخرى
شاهد النسخة الأصليةرد0
  • تثبيت