DeepSeek 30 квітня представив метод Visual Primitives для покращення мультимодальних міркувань

Згідно з технічним звітом DeepSeek, 30 квітня компанія представила Visual Primitives — метод, який вбудовує базові візуальні елементи, зокрема точки та рамки, у ланцюги міркувань, щоб подолати проблему Reference Gap у мультимодальних задачах. Метод зменшує споживання токенів зображень завдяки стисненню KV cache.

У тестах з лічби та просторових міркувань підхід відповідає за продуктивністю GPT-5.4, Claude-Sonnet-4.6 та Gemini-3-Flash на вибраних вимірах. DeepSeek заявила, що відкриє вихідний код частин бенчмарків і наборів даних, а ваги моделей буде випущено після інтеграції.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Forefront Tech завершує $100M зведення цін IPO, лістинг на Nasdaq за кодом FTHAU

За даними ChainCatcher, спеціальна інвестиційна компанія з викупом Forefront Tech завершила розміщення IPO на суму 100 мільйонів доларів 30 квітня та буде торгуватися на Nasdaq під тикером FTHAU. Компанія планує використати виручені кошти для пошуку можливостей злиттів і поглинань у блокчейні, фінтеху, штучному

GateNews18хв. тому

Код Anthropic Claude завищив оплату користувачу на $200,98 через помилку в білінгу; спочатку відмовили у поверненні коштів, перш ніж повністю компенсувати збитки

За моніторингом від Beating, помилка в білінгу в сервісі Anthropic Claude Code спричинила тому, що Max 20x підписника було переплачено $200,98 додаткових комісій за використання, хоча він використав лише 13% свого щомісячного ліміту. Помилка виникла, коли в історії комітів git-репозиторію користувача містився верхній регістр

GateNews46хв. тому

NVIDIA випустила ваги флагманської моделі Cosmos-Reason2-32B і розширила контекстне вікно до 256K токенів

За даними Beating, NVIDIA випустила ваги для Cosmos-Reason2-32B — флагманської версії її фізичного AI-міркувального vision-language-моделю (VLM), створеної для того, щоб роботи та системи автономного керування могли розуміти просторові, часові й фізичні принципи. Модель із 32 мільярдами параметрів,

GateNews1год тому

OpenAI пояснює, чому Codex забороняє згадувати «ґоблінів»: винагорода за «ботанський» характер вийшла з-під контролю

OpenAI у своєму офіційному блозі пояснила, що Codex забороняє “говоріння” про гоблінів та інших істот, і що причиною стали заохочувальні сигнали, які віддають перевагу біологічним метафорам під час тренування “ботанічного” характеру, що призвело до кросперсонального забруднення та помилкового спрямування RLHF. Подія спалахнула після того, як Barron Roth викрив системні інструкції; OpenAI застосувала дві стратегії — короткострокове жорстке хардкодування та довгострокове очищення заохочувальних сигналів — попереджаючи про вразливість дизайну нагород, а для посттренувальних аудитів потрібна точніша деталізація.

ChainNewsAbmedia1год тому

Alibaba відкриває у відкритому доступі модуль інтерпретованості Qwen-Scope для Qwen, який охоплює 7 моделей, станом на 30 квітня

За даними PANews, 30 квітня Qwen від Alibaba оголосив про відкритий код Qwen-Scope — модулю інтерпретованості, натренованого на моделях серій Qwen3 і Qwen3.5. Реліз охоплює 7 великих мовних моделей у варіантах для щільних і mixture-of-experts, із 14 наборами sparse autoencoder

GateNews2год тому

AI-сервери Nvidia B300 досягли 1 мільйона доларів у Китаї на тлі дефіциту поставок

За даними Reuters, сервери для AI Nvidia B300 тепер продаються в Китаї приблизно за 7 мільйонів юанів (1 мільйон доларів США), що зумовлено посиленням боротьби зі схемами контрабанди та збереженням попиту з боку місцевих технічних компаній. Ціна зросла з приблизно 4 мільйонів юанів (585 тисяч доларів США) наприкінці 2025 року, значно

GateNews2год тому
Прокоментувати
0/400
Немає коментарів