يفان تشانغ يكشف عن المواصفات التقنية الكاملة لـ DeepSeek V4: 1.6T معلمات، 384 خبيرًا مع 6 تفعيلات

بوابة الأخبار: رسالة بتاريخ 22 أبريل — كشف طالب الدكتوراه في برينستون ييفان تشانغ عن المواصفات التقنية الكاملة لـ DeepSeek V4 على X، وذلك بعد عرضٍ مسبق في 19 أبريل. يتضمن V4 1.6 تريليون إجمالي المعلمات ونُسخة خفيفة الوزن، V4-Lite، بإجمالي 285 مليار معلمة.

يعتمد النموذج آلية انتباه DSA2، والتي تجمع بين انتباه DeepSeek Sparse (DeepSeek Sparse Attention) السابق من V3.2 وNSA (Native Sparse Attention) مع تضمينات رؤوس ذات بُعد 512، مقترنة بـ Sparse Multi-Query Attention (MQA) وSliding Window Attention (SWA). طبقة MoE (Mixture of Experts) تحتوي على 384 خبيرًا مع تفعيل 6 لكل تمريرة أمامية، باستخدام Fused MoE Mega-Kernel. تستخدم الاتصالات المتبقية بنية Hyper-Connections.

تفاصيل التدريب التي تم الكشف عنها لأول مرة تتضمن استخدام مُحسّن Muon (applying Newton-Schulz orthogonalization to momentum updates) لتحديثات الزخم، ونافذة سياق قبل التدريب بحجم 32K رمزًا، وGRPO (Group Relative Policy Optimization) مع تصحيح تباعد KL أثناء التعلم التعزيزي. تمتد نافذة السياق النهائية إلى مليون رمز. النموذج نصي فقط.

لا يعمل يانغ لصالح DeepSeek، ولم تعلّق الشركة رسميًا على المعلومات التي تم الكشف عنها.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

OpenClaw、Hermes 和 SillyTavern 已确认获 GLM Coding Plan 支持

Zhipu AI 产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 作为受支持的 GLM Coding Plan 项目;其他工具将逐案评估。不要共享凭据或将订阅用作 API 访问;联系支持以处理错误 1313。 Zhipu AI 产品经理李宣布,OpenClaw、Hermes 和 SillyTavern 已在 GLM Coding Plan 下正式获得支持,其他工具将逐案评估。该说明提醒用户不要共享凭据或将订阅用作 API 访问,并建议在遇到错误 1313 的用户联系支持。

GateNewsمنذ 3 د

الرئيس التنفيذي لـ Google Cloud: Gemini لتشغيل طرح Siri المخصص من Apple في 2026

الملخص: سيعمل Gemini على تشغيل Siri مخصصًا من Apple في عام 2026، مبنيًا على نماذج Foundation من Apple وتعاون Gemini؛ وتختبر Apple نسخة Siri تشبه الدردشة ضمن iOS 27/macOS 27، ومن المقرر طرحها في WWDC 2026. الملخص: من المقرر أن يعمل Gemini من Google Cloud على تشغيل Siri مخصص من Apple بحلول عام 2026، من خلال دمج Gemini مع نماذج Foundation من Apple ضمن تعاون تبلغ قيمته تقريبًا $1 billion. تجري Apple اختبارًا لإعادة تصميم Siri بصورة تشبه الدردشة في iOS 27/macOS 27، مع واجهة Dynamic Island وميزات جديدة، وذلك قبل الكشف عنها في WWDC 2026 في 8 يونيو.

GateNewsمنذ 35 د

SpaceX-Cursor $60B 交易为 SBF 的赦免论点提供了新的证据

抽象 SpaceX 宣布与 $60 十亿美元 Cursor 的合作伙伴关系,并提供收购选项;这将塑造 SBF 的赦免申请,因为 Alameda 的早期 Cursor 持仓按今天的价值约为 $3 十亿美元。该稿权衡了 SBF 的资不抵债主张、父母的公开拉票、债权人的反对意见,以及赦免几率之低。 摘要 SpaceX-Cursor 交易助推 SBF 的赦免申请;Alameda 的 $200k 股份将约为 $3B 今天 (15,000x)。SBF 称 FTX 资不抵债;市场显示赦免几率很低;特朗普不太可能赦免。

GateNewsمنذ 42 د

سهم Chegg ينهار بنسبة 99% مع قيام الذكاء الاصطناعي بإحداث اضطراب في سوق التكنولوجيا التعليمية

الملخص: ارتفعت شركة Chegg مدفوعةً بالطلب المتزايد على التعليم عبر الإنترنت، ثم أدى تَحَوُّل أدوات الذكاء الاصطناعي إلى تعطيل نموذجها، ما أدى إلى تسريحات جماعية ضخمة وانهيارها إلى ما دون $2، مع تأثيرات أوسع تقودها موجة الانتقال إلى الذكاء الاصطناعي طالت شركات تعدين العملات المشفرة وشركات التكنولوجيا المالية. الملخص: يستعرض هذا المقال صعود شركة Chegg بوصفها محبوبة في مجال التعليم التكنولوجي خلال حقبة الجائحة، وتراجعها اللاحق في ظل التبنّي السريع للذكاء الاصطناعي التوليدي، الذي يوفّر إجابات سريعة ويقوض عرض القيمة الخاص بـ Chegg. يوثّق عمليات تسريح العمال في 2025 وانخفاض السهم باتجاه الإيقاف عن التداول، ويضع تجربة Chegg ضمن سياق أوسع لاضطراب يقوده الذكاء الاصطناعي ويعيد تشكيل قطاع التقنية والقطاع الخاص بالعملات المشفرة: إذ تتحول شركات تعدين Bitcoin إلى عمليات مرتبطة بالذكاء الاصطناعي، وتُعيد الاستراتيجيات الأصيلة في الذكاء الاصطناعي تعريف القدرة التنافسية في التكنولوجيا المالية وما وراءها.

CryptoFrontierمنذ 52 د

تطلق OpenAI نموذجًا لمرشح خصوصية مفتوح المصدر لكشف معلومات التعريف الشخصية وإخفائها

ملخص: مرشح الخصوصية من OpenAI هو نموذج مفتوح المصدر وقابل للتنفيذ محليًا يكتشف معلومات التعريف الشخصية ويقوم بإخفائها في النص. يدعم سياقات كبيرة، ويحدد العديد من فئات معلومات التعريف الشخصية، وهو مخصص لسير عمل يراعي الخصوصية مثل إعداد البيانات، والفهرسة، والتسجيل، والمراجعة. مرشح الخصوصية من OpenAI هو نموذج مفتوح المصدر يعمل محليًا (سياق 128k-token) يكتشف معلومات التعريف الشخصية ويقوم بإخفائها في النص، ويغطي بيانات الاتصال والبيانات المالية وبيانات الاعتماد الخاصة بسير عمل الخصوصية.

GateNewsمنذ 1 س

OpenAI تخطط لنشر 30GW من القدرة الحاسوبية بحلول 2030

تسعى OpenAI إلى توفير 30GW من القدرة الحاسوبية بحلول عام 2030 لتلبية الطلب المتزايد على الذكاء الاصطناعي، مع اكتمال 8GW من هدف 10GW لعام 2025. وتشير عملية التوسع إلى استراتيجية تهدف إلى توسيع البنية التحتية لتطوير ونشر الذكاء الاصطناعي من الجيل التالي. تعتزم OpenAI الوصول إلى 30GW من قدرة الحوسبة بحلول عام 2030 لاستيعاب الطلب المتزايد على الذكاء الاصطناعي، بعد أن تكون قد أنجزت بالفعل 8GW من هدف 10GW لعام 2025. وتعكس هذه الخطوة توسعًا استراتيجيًا للبنية التحتية لدعم تطوير ونشر الذكاء الاصطناعي من الجيل التالي.

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات