Gate News 消息,4月24日——V4已公开披露其V4-Pro模型的内部自用(dogfooding)数据。该公司从50多名工程师处收集了约200项真实世界的工程任务,涵盖功能开发、缺陷修复、重构以及诊断,遍及包括 PyTorch、CUDA、Rust 和 C++ 等技术栈。经过严格筛选后,保留了30项任务用于基准评估。
V4-Pro-Max 的代码通过率为 67%,显著优于 Sonnet 4.5 的 47%,并接近 Opus 4.5 的 70%。不过,它落后于 Opus 4.5 Thinking (73%) 和 Opus 4.6 Thinking (80%),同时也大幅高于 Haiku 4.5 的 13%。
在一项包含85名受访者的内部调查中,所有参与者均表示在日常工作流中使用 V4-Pro 进行“代理式编程(agentic coding)”。52% 将 V4-Pro 作为其默认的首要代码模型,39% 倾向于表示认可,而不足 9% 表达了不认可。报告的问题包括底层错误、对含糊提示的误解,以及偶发的过度思考行为。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
أطلقت DeepSeek النسخة التجريبية المفتوحة المصدر V4، وحصلت على درجة تقنية 3206 متفوقة على GPT-5.4
DeepSeek 于 4 月 24 日正式推出 V4 预览版系列,以 MIT 许可协议开源,模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告,V4-Pro-Max(最高推理力度模式)在 Codeforces 基准取得 3206 分,超越 GPT-5.4。
MarketWhisperمنذ 3 د
寒武纪完成 DeepSeek-V4 的 Day 0 适配,成为中国 AI 芯片生态的里程碑
Gate News 消息,4 月 24 日——寒武纪今日宣布,已使用其专有 NeuWare 软件生态系统和 vLLM 框架,完成了 DeepSeek-V4(DeepSeek 最新的大语言模型)的 Day 0 适配。适配代码已同步开源,标志着
GateNewsمنذ 20 د
طرحت Tencent كمصدر مفتوح Hy3 في نسخة المعاينة، وقد تحسن أداء الاختبارات القياسية للشفرة بنسبة 40% مقارنة بالإصدار السابق
أطلقت شركة Tencent في 23 أبريل بشكل رسمي نموذجًا لغويًا كبيرًا من نوع Hy3 بإصدار المعاينة المفتوح المصدر على منصات GitHub وHugging Face وModelScope، كما توفر في الوقت نفسه خدمة واجهة برمجة تطبيقات مدفوعة عبر Tencent Cloud. ووفقًا لما ذكرته Decrypt في 24 أبريل، بدأ إصدار Hy3 بإصدار المعاينة التدريب من أواخر يناير، ولم يستغرق إطلاقه أكثر من ثلاثة أشهر بحلول تاريخ النشر.
MarketWhisperمنذ 27 د
استثمارات محفظة FTX بقيمة 158 تريليون وون إذا لم تكن قد أفلتست
FTX، منصة تداول العملات الرقمية المركزية التي قدمت طلبًا لحماية الإفلاس بموجب الفصل 11 في نوفمبر 2022 بسبب نقص السيولة وتدفقات رأس المال الخارجة، كانت ستحتفظ باستثمارات بقيمة تقارب 158.796 تريليون وون إذا لم تكن قد انهارت، وفقًا لتحليل مستشهد به من قِبل Park
CryptoFrontierمنذ 30 د
小米披露 MiMo-V2-Pro 训练细节:1T 模型参数,部署数千台 GPU
Gate News 信息,4月24日——小米大型语言模型团队负责人罗富莉在一场深入采访中披露,MiMo-V2-Pro 模型总计拥有 1 万亿参数,训练所需数千台 GPU。她指出,1T 规模代表达到性能接近 Claude Opus 4.6 水平并为下一阶段 AI 代理获取具有竞争力的入场券所需的最低门槛
GateNewsمنذ 44 د
DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一
Gate News 消息,4 月 24 日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上取得满分 120/120,与 Axiom 并列第一。
在使用 LeanExplore 与受约束采样的实践模式中,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00
GateNewsمنذ 52 د