Повідомлення Gate News, 24 квітня — DeepSeek V4-Pro і DeepSeek V4-Flash були офіційно випущені та відкрито передані в open-source 24 квітня, причому довжина контекстного опрацювання суттєво розширена з 128K до 1M, що відповідає майже 10-кратному зростанню місткості. Huawei Computing оголосила, що її продукти Ascend supernode повністю підтримують моделі серії DeepSeek V4 завдяки тісній співпраці між технологіями чипа та моделі.
Ascend 950 забезпечує розгортання інференсу моделей DeepSeek V4 із високою пропускною здатністю та низькою затримкою завдяки технікам злитого ядра та багатопотокової паралельності, щоб зменшити накладні витрати на обчислення Attention і доступ до пам’яті. Для DeepSeek V4-Pro із входом 8K Ascend 950 досягає приблизно 20ms TPOT із 4,700 TPS пропускної здатності Decode на одну карту; для DeepSeek V4-Flash за входу до 8K він досягає приблизно 10ms TPOT із пропускною здатністю 1,600 TPS. Серія супервузлів Ascend A3 також досягає повної сумісності: надано опорні реалізації для тренування для швидкого фінастройнінгу. На основі супервузла Ascend A3 на 64 карти з великим режимом EP, DeepSeek V4-Flash досягає понад 2,000 TPS пропускної здатності Decode на одну карту в сценаріях вхід-вихід 8K/1K за допомогою рушія інференсу vLLM. Повні лінійки продуктів Huawei Ascend A2, A3 і 950 підтримують як DeepSeek V4-Flash, так і V4-Pro.
Huawei Cloud оголосила про сумісність першою серед конкурентів із DeepSeek V4, надаючи розробникам сервіси API token в один клік через свою платформу MaaS. Huawei Cloud оптимізувала можливості системного рівня, рівня операторів і рівня кластерів, щоб забезпечити швидку адаптацію моделей та високопродуктивне розгортання. Підприємства, зокрема Kingsoft WPS і 360, уже інтегрували нову модель DeepSeek через Huawei Cloud.
Cambricon також оголосила про сумісність Day 0 з DeepSeek V4-Flash і V4-Pro на основі фреймворка інференсу vLLM, при цьому код адаптації відкрито передано в open-source для спільноти GitHub. Раніше Cambricon досягла адаптації першою серед конкурентів, коли DeepSeek V3.2 було випущено торік; тоді було проведено глибоку оптимізацію продуктивності у співпраці програмного та апаратного забезпечення для моделей серії DeepSeek.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
AI-платформа Certifyde завершила раунд seed на 2 мільйона доларів 1 травня, підтриманий генеральним директором Ripple Бредом Гарлінгхаусом
Згідно з TechfundingNews, платформа для AI-застосунків Certifyde завершила раунд seed на 2 мільйони доларів 1 травня. Інвестори включають K5 Global, Flamingo Capital та бізнес-ангелів, зокрема співзасновника Honey Джорджа Руана, CEO Ripple Бреда Гарлінгхауса й співзасновника Nutra Роланда
GateNews23хв. тому
Технічний керівник Пентагону: Anthropic досі в чорному списку, виняток для Mythos
Керівник технологій Пентагону (Pentagon technology chief) 1 травня повідомив Конгресу: «Anthropic досі перебуває в чорному списку, але Mythos Preview — це інше питання», офіційно визнавши, що Міністерство оборони по-іншому ставиться до основного бренду Anthropic і до його нової моделі Mythos. Ця заява перегукується з тим, що 19 квітня Axios розкрив: NSA (Агентство національної безпеки) фактично використовує Mythos, і тим самим остаточно закріплює політичний курс на «винятковий канал для Mythos». Водночас це також означає, що Пентагон раніше в суді стверджував: використання інструментів Anthropic загрожує національній безпеці, тоді як нинішні практичні дії створюють внутрішню суперечність у юридичній аргументації.
Anthropic vs Pentagon
ChainNewsAbmedia1год тому
137 Ventures закриває $700M для нових фондів, AUM досягає $15B
За даними ChainCatcher, 137 Ventures, ранній інвестор у SpaceX, нещодавно завершила залучення коштів для двох нових фондів на загальну суму понад $700 мільйонів, довівши свої активи під управлінням до понад $15 мільярдів. Новий капітал підтримуватиме інвестиції в AI-агентів, робототехніку та космічну силову установку
GateNews1год тому
Reddit зростає на 16% на сильних прогнозах щодо 2 кварталу; Apple стикається з дефіцитом Mac через те, що попит на ШІ випереджає пропозицію
Акції Reddit зросли на 16% до відкриття ринку в п’ятницю після того, як компанія опублікувала прогноз щодо виручки на наступний квартал, вищий за очікування. Щоденна кількість активних відвідувачів збільшилася на 17% до 126,8 мільйона, тоді як середня виручка на одного користувача у всьому світі підскочила на 44%, завдяки ШІ-інструментам
GateNews1год тому
Міністерство оборони США досягло угоди з 7 компаніями зі штучного інтелекту, зокрема OpenAI, Google та Microsoft
За даними Міністерства оборони США, сьогодні (1 травня) агентство підписало угоди з сімома провідними компаніями в галузі штучного інтелекту: SpaceX, OpenAI, Google, Nvidia, Reflection, Microsoft і Amazon Web Services (AWS). Угоди спрямовані на прискорення військової трансформації та створення t
GateNews1год тому
Datavault AI співпрацює з King Mining Capital над планом токенізації $150M Gold
За даними Businesswire, 1 травня компанія Datavault AI, що котирується на Nasdaq, оголосила про стратегічне партнерство з King Mining Capital для запуску GoldVault — план токенізації золота на суму понад 150 мільйонів доларів. Згідно з угодою, Datavault AI придбає 5% частки в King Mining Capital і
GateNews1год тому