DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости

Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode полностью поддерживают модели серии DeepSeek V4 благодаря тесному сотрудничеству между технологиями чипа и модели.

Ascend 950 обеспечивает развертывание инференса моделей DeepSeek V4 с высокой пропускной способностью и низкой задержкой за счет методов склеивания ядер и параллелизма в несколько потоков, чтобы снизить накладные расходы на вычисления Attention и обращения к памяти. Для DeepSeek V4-Pro с входом 8K Ascend 950 достигает примерно 20ms TPOT при 4,700 TPS на одно устройство в режиме Decode; для DeepSeek V4-Flash при входе до 8K он достигает примерно 10ms TPOT при пропускной способности 1,600 TPS. Серия Ascend A3 supernode также обеспечивает полную совместимость: предоставлены эталонные реализации для быстрого дообучения. На основе supernode Ascend A3 из 64 карт с большим режимом EP DeepSeek V4-Flash достигает более 2,000 TPS на одну карту в режиме Decode в сценариях вход-выход 8K/1K, используя движок инференса vLLM. Полные линейки продуктов Huawei Ascend A2, A3 и 950 поддерживают как DeepSeek V4-Flash, так и V4-Pro.

Huawei Cloud объявила о совместимости с DeepSeek V4 для самых первых, предоставив разработчикам сервисы API token в один клик через свою платформу MaaS. Huawei Cloud оптимизировала возможности системного уровня, уровня операторов и уровня кластера, чтобы обеспечить быструю адаптацию моделей и высокопроизводительное развертывание. Компании, включая Kingsoft WPS и 360, уже интегрировали новую модель DeepSeek через Huawei Cloud.

Cambricon также объявила о совместимости Day 0 с DeepSeek V4-Flash и V4-Pro на основе фреймворка инференса vLLM, а код адаптации был с открытым исходным кодом опубликован для сообщества GitHub. Ранее Cambricon уже достигла совместимости для самых первых при выпуске DeepSeek V3.2 в прошлом году: она провела глубокую оптимизацию совместной производительности ПО и оборудования на моделях серии DeepSeek.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

AI Platform Certifyde завершила раунд seed на 2 миллиона долларов 1 мая, при поддержке генерального директора Ripple Брэда Гарлингхауса

По данным TechfundingNews, платформа для AI-приложений Certifyde завершила раунд посевного финансирования на 2 миллиона долларов 1 мая. Среди инвесторов — K5 Global, Flamingo Capital, а также бизнес-ангелы, включая сооснователя Honey Джорджа Руана, CEO Ripple Брэд Гарлингхаус и сооснователя Nutra Роланда

GateNews23м назад

Технологический директор Пентагона: Anthropic по-прежнему в черном списке, исключение для Mythos

Технологический руководитель Пентагона (chief) 1 мая заявил в Конгрессе: «Anthropic все еще находится в черном списке, но Mythos Preview — это уже другой вопрос», официально признав, что Пентагон относится к основному бренду Anthropic и его новой модели Mythos по-разному. Этот сигнал совпал с раскрытием Axios от 19 апреля о том, что NSA (Агентство национальной безопасности) фактически использовало Mythos для согласованных ответов, и тем самым официально закрепил политический курс в сторону «исключительного канала для Mythos» — одновременно это также означает, что Пентагон ранее в суде утверждал, что использование инструментов Anthropic будет угрожать нацбезопасности, что вступает в внутреннее противоречие в юридической аргументации с текущими фактическими действиями. Anthropic vs Pentagon

ChainNewsAbmedia1ч назад

137 Ventures закрывает $700M в новых фондах, AUM достигает 15 млрд долларов

По данным ChainCatcher, 137 Ventures, ранний инвестор в SpaceX, недавно завершила сбор средств для двух новых фондов на общую сумму свыше $700 миллионов, доведя объем активов под управлением до более $15 миллиардов. Новые средства пойдут на инвестиции в AI-агентов, робототехнику и космическую силовую установку

GateNews1ч назад

Reddit взлетает на 16% на сильный прогноз на 2-й квартал; Apple сталкивается с дефицитом Mac из-за того, что спрос на ИИ опережает поставки

Акции Reddit выросли на 16% до открытия рынка в пятницу после того, как компания опубликовала прогноз по выручке на следующий квартал выше ожиданий. Ежедневная активная аудитория увеличилась на 17% до 126,8 миллиона, а средняя выручка на пользователя по всему миру подскочила на 44%, благодаря AI-powered

GateNews1ч назад

Министерство обороны США достигло соглашения с 7 компаниями в сфере ИИ, включая OpenAI, Google и Microsoft

Согласно Министерству обороны США, сегодня (1 мая) ведомство подписало соглашения с семью ведущими компаниями в области искусственного интеллекта: SpaceX, OpenAI, Google, Nvidia, Reflection, Microsoft и Amazon Web Services (AWS). Соглашения направлены на ускорение военной трансформации и создание

GateNews1ч назад

Datavault AI сотрудничает с King Mining Capital в рамках плана токенизации $150M Gold

По данным Businesswire, 1 мая котирующаяся на Nasdaq Datavault AI объявила о стратегическом партнёрстве с King Mining Capital для запуска GoldVault — плана токенизации золота на сумму более 150 миллионов долларов. В рамках соглашения Datavault AI приобретёт 5% доли в King Mining Capital и, кроме того, an

GateNews1ч назад
комментарий
0/400
Нет комментариев