DeepSeek phát hành mã nguồn mở TileKernels, thư viện kernel GPU cho đào tạo và suy luận mô hình lớn

Tin tức cổng, ngày 23 tháng 4 — DeepSeek đã phát hành mã nguồn mở TileKernels theo giấy phép MIT, một thư viện kernel GPU được viết bằng TileLang cho đào tạo và suy luận mô hình ngôn ngữ lớn. TileLang là ngôn ngữ chuyên biệt do nhóm tile-ai phát triển để diễn đạt các kernel GPU hiệu năng cao trong Python. DeepSeek cho biết hầu hết các kernel trong thư viện đã tiến gần đến giới hạn hiệu năng phần cứng về mật độ tính toán và băng thông bộ nhớ, với một phần đã được triển khai trong các tác vụ đào tạo và suy luận nội bộ.

Thư viện gồm sáu nhóm kernel: MoE (hỗn hợp các chuyên gia) phân luồng và định tuyến, bao gồm chọn chuyên gia Top-k, ánh xạ token sang chuyên gia, và mở rộng/thu gộp kèm chuẩn hoá trọng số; lượng tử hoá hỗ trợ các định dạng FP8, FP4 và E5M6 với lượng tử hoá theo từng token, theo từng block và theo từng kênh, bao gồm các tác vụ lượng tử hoá gộp SwiGLU+; chuyển vị theo lô (batch transpose); Engram gating với lan truyền xuôi/ngược RMSNorm gộp và giảm gradient trọng số; Manifold HyperConnection với chuẩn hoá Sinkhorn và tách/áp dụng trộn; và các giao diện autograd cấp cao bọc các kernel mức thấp thành các lớp có thể huấn luyện.

Engram và Manifold HyperConnection là các thành phần độc quyền trong kiến trúc mô hình của DeepSeek, với chi tiết triển khai lần đầu tiên được công bố công khai. Thư viện yêu cầu GPU thuộc kiến trúc NVIDIA SM90 hoặc SM100 (H100/H200 hoặc dòng Blackwell), CUDA Toolkit 13.1 trở lên và PyTorch 2.10 trở lên.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Plasma trêu ngươi việc ra mắt sản phẩm liên quan đến stablecoin vào tháng 6 năm 2026

Tin tức từ Gate, 23 tháng 4 — Plasma đã công bố kế hoạch ra mắt một sản phẩm mới liên quan đến stablecoin vào tháng 6 năm 2026, nêu rõ "stablecoin của bạn cuối cùng cũng có một nơi để ở, tháng 6 năm 2026." Theo tài liệu quảng cáo, sản phẩm sẽ có thẻ thanh toán bằng stablecoin, chức năng chi tiêu của người dùng, và

GateNews49phút trước

Bonanza Factory Hoàn tất PoC cho Tích hợp VND trên Sàn Giao dịch Tài sản Kỹ thuật số của MB Bank Việt Nam

Tin tức cổng, ngày 23 tháng 4 — Bonanza Factory, một nhà cung cấp giải pháp tuân thủ của Hàn Quốc, đã hoàn tất một (PoC) với Ngân hàng Thương mại Cổ phần Quân đội của Việt Nam (MB Bank) để tích hợp gửi và rút tiền dựa trên VND giữa ngân hàng và các sàn giao dịch tài sản kỹ thuật số, và hiện là

GateNews58phút trước

WBTC sẽ hoàn tất nâng cấp cấu hình cross-chain DVN vào ngày 26 tháng 4

Tin tức Cổng, ngày 23 tháng 4 — WBTC thông báo rằng họ đang nâng cấp cấu hình cross-chain DVN (Mạng Xác minh phi tập trung) để ứng phó với sự cố rsETH gần đây. Dự án cho biết việc điều chỉnh này là một biện pháp phòng ngừa được thiết kế nhằm tăng cường các tiêu chuẩn bảo mật cho tích hợp cross-chain

GateNews58phút trước

Bunq vượt 100 triệu euro trong giao dịch tiền mã hóa, ra mắt tính năng Giỏ cổ phiếu

Tin tức Gate, ngày 23 tháng 4 — Bunq, một ngân hàng số châu Âu (neobank), đã vượt 100 triệu euro về khối lượng giao dịch tiền mã hóa trong năm đầu tiên kể từ khi ra mắt dịch vụ tài sản kỹ thuật số vào tháng 4 năm 2025, với khoảng 500.000 giao dịch. Nền tảng này ghi nhận mức tăng 41% về tổng số lượt đăng ký trong năm 2026, phản ánh

GateNews1giờ trước

GoPlus AgentGuard ra mắt Chế độ Checkup để tăng cường bảo mật Web3 cho tác nhân AI

Tin Cổng, ngày 23 tháng 4 — Thành phần bảo mật GoPlus AI AgentGuard đã chính thức phát hành tính năng Checkup, được thiết kế để khắc phục các điểm mù bảo mật trong quá trình ra quyết định tự chủ và kiểm soát tài sản của các tác nhân AI, nâng bảo mật cho tác nhân AI từ "chặn gián đoạn" lên "đo lường hệ thống

GateNews2giờ trước

Avici Ra Mắt Sản Phẩm Grow và Smart Credit để Tạo Lợi Suất trên Solana

Tin tức cổng, ngày 23 tháng 4 — Ngân hàng số crypto tự quản (self-custodial) Avici đã ra mắt hai sản phẩm mới, Grow và Smart Credit, hợp tác với Jupiter Lend và Fluid. Avici Grow cho phép người dùng gửi tài sản và kiếm lợi suất mà không có thời gian khóa, cho phép rút bất cứ lúc nào. Smart Credit

GateNews2giờ trước
Bình luận
0/400
Không có bình luận