Архітектуру DeepSeek V4 підтверджено: 3 із 4 прогнозів збулися, модуль Engram відсутній

Повідомлення Gate News, 24 квітня — DeepSeek сьогодні опублікував картку моделі V4, підтвердивши раніші архітектурні припущення, зроблені шляхом аналізу бібліотеки ядер TileKernels, випущеної вчора (23 квітня). Згідно з моніторингом від Beating, було підтверджено три ключові компоненти: mHC (Manifold-Constrained Hyper-Connections) замість оригінального HyperConnection від ByteDance, архітектуру MoE з маршрутизацією експертів Top-k та змішане прецизійне зберігання ваг FP4+FP8. Прогнозований умовний модуль пам’яті Engram не з’явився в картці моделі.

Картка моделі розкрила нові компоненти, не охоплені TileKernels: гібридні механізми уваги (CSA + HCA) забезпечують приріст ефективності V4 у довгому контексті, зменшуючи FLOPs під час інференсу лише до 27% рівня V3.2 на вікнах контексту 1M, а KV cache — до 10%. Тепер для тренування використовується оптимізатор Muon.

Ця верифікація демонструє, як реалізації ядер на рівні виробництва можуть розкривати базову архітектуру моделі ще до публікації офіційних специфікацій.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

V4-Pro досягає 67% частки успішних проходжень коду в внутрішньому dogfooding-тесті, наближаючись до продуктивності Opus 4.5

Повідомлення Gate News, 24 квітня — V4 публічно розкрила внутрішні дані власного випробування (dogfooding) для своєї моделі V4-Pro. Компанія зібрала приблизно 200 реальних інженерних завдань від понад 50 інженерів, охоплюючи розробку функцій, виправлення багів, рефакторинг і діагностику в різних технологічних стеків, зокрема

GateNews6хв. тому

Британія стежить за Anthropic AI, щоб посилити кібербезпеку банківського сектору

Сполучене Королівство вивчає важливий крок у фінансовій кібербезпеці, працюючи з компанією з AI Anthropic. Ранні обговорення вказують, що уряд може розгорнути вдосконалену модель Claude Mythos від Anthropic у банках і фінансових установах. Цей крок має на меті посилити захист, оскільки кіберзагрози

CryptometerIo10хв. тому

Офіс IP Китаю додає ШІ, напівпровідники та мозково-комп’ютерні інтерфейси до програми прискореного захисту

Повідомлення Gate News, 24 квітня — Національне управління з інтелектуальної власності Китаю 24 квітня оголосило, що створить комплексний захист прав інтелектуальної власності для нових технологій шляхом інституційних реформ, розширених послуг і впровадження ширших застосувань. Управління wi

GateNews17хв. тому

Державний уряд США керує біткоїн-нода без майнінгу, зазначив адмірал

Старший адмірал заявив, що уряд США активно керує нодою в мережі Bitcoin, навмисно уникаючи участі в майнінговій діяльності. Розкриття інформації вказує, що органи влади беруть на себе більш залучену роль у блокчейн-інфраструктурі для нагляду та

CryptoFrontier33хв. тому

Дохід Tesla за Q1 зріс на 16% до $22,4 млрд; дебют гуманоїдного робота заплановано на середину 2026 року

Повідомлення Gate News, 24 квітня — Tesla повідомила про дохід за перший квартал у розмірі 22,4 млрд дол. США 23 квітня, що становить зростання на 16% у річному обчисленні. Поставки автомобілів компанії у всьому світі перевищили 358 000 одиниць, тоді як виробництво сягнуло понад 408 000 одиниць. Шанхайський завод Tesla Gigafactory поставив 213 000 автомоб

GateNews34хв. тому

Прибуток SK Hynix у I кварталі зріс у п’ять разів до рекорду на хвилі буму ШІ, премії співробітникам підняли до $878K

Повідомлення Gate News, 24 квітня — SK Hynix повідомила про п’ятиразове зростання квартального операційного прибутку до рекордних 37.61 трлн вон ($32.4 мільярда) 23 квітня, яке зумовлене різким зростанням попиту з боку рішень на основі штучного інтелекту та дата-центрів. Несподівана вигода забезпечує небачені раніше премії працівникам, і, за оцінками аналітиків, вони можуть досягти до $878,000 на одного співробітника у 2027 році, якщо нинішні прогнози прибутків збережуться.

GateNews1год тому
Прокоментувати
0/400
Немає коментарів