Tin cổng Gate News, ngày 22 tháng 4 — Google Research đã phát hành ReasoningBank, một khung bộ nhớ tác nhân cho phép các tác nhân điều khiển bởi mô hình ngôn ngữ lớn liên tục học hỏi sau khi triển khai. Khung này trích xuất các chiến lược suy luận phổ quát từ cả kinh nghiệm nhiệm vụ thành công và thất bại, lưu chúng vào một ngân hàng bộ nhớ để tra cứu và thực thi trên các nhiệm vụ tương tự trong tương lai. Bài báo liên quan được công bố tại ICLR, và mã nguồn đã được mở trên GitHub.
ReasoningBank cải tiến dựa trên hai cách tiếp cận hiện có: Synapse, ghi lại toàn bộ quỹ đạo hành động nhưng có khả năng chuyển giao hạn chế do mức độ chi tiết quá nhỏ, và Agent Workflow Memory, chỉ học từ các trường hợp thành công. ReasoningBank thực hiện hai thay đổi then chốt: lưu “các mẫu suy luận” thay vì “chuỗi hành động,” với mỗi bộ nhớ chứa các trường có cấu trúc cho tiêu đề, mô tả và nội dung; và đưa các quỹ đạo thất bại vào quá trình học. Khung sử dụng một mô hình để tự đánh giá các quỹ đạo thực thi, biến các trải nghiệm thất bại thành các quy tắc tránh bẫy. Ví dụ, quy tắc “nhấp vào nút Tải thêm khi thấy” phát triển thành “xác minh trước mã định danh của trang hiện tại, tránh các vòng lặp cuộn vô tận, rồi sau đó nhấp tải thêm.”
Bài báo cũng giới thiệu Memory-aware Test-time Scaling (MaTTS), phân bổ thêm năng lực tính toán trong quá trình suy luận để khám phá nhiều quỹ đạo và lưu kết quả vào ngân hàng bộ nhớ. Mở rộng song song chạy nhiều quỹ đạo riêng biệt cho cùng một nhiệm vụ, tinh chỉnh các chiến lược mạnh mẽ hơn thông qua so sánh tự thân; mở rộng tuần tự tinh chỉnh lặp một quỹ đạo duy nhất, lưu suy luận trung gian vào bộ nhớ.
Trong các tác vụ trình duyệt WebArena và các tác vụ mã hóa SWE-Bench-Verified sử dụng Gemini 2.5 Flash làm tác nhân ReAct, ReasoningBank đạt tỷ lệ thành công cao hơn 8,3% trên WebArena và cao hơn 4,6% trên SWE-Bench-Verified so với một chuẩn không có bộ nhớ, đồng thời giảm trung bình số bước trên mỗi tác vụ khoảng 3. Việc thêm MaTTS với mở rộng song song (k=5) tiếp tục cải thiện tỷ lệ thành công trên WebArena thêm 3 điểm phần trăm và giảm số bước thêm 0,4.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
NeoCognition Huy động $40M vốn hạt giống cho các tác nhân AI học ngay khi làm việc
Tin tức từ Gate, ngày 22 tháng 4 — Phòng thí nghiệm nghiên cứu AI NeoCognition thông báo hoàn tất một vòng gọi vốn hạt giống $40 triệu, xuất phát chế độ ẩn. Được thành lập bởi Phó giáo sư Đại học Bang Ohio Yu Su, cùng với Xiang Deng và Yu Gu, công ty có trụ sở tại Palo Alto, California. Vòng gọi vốn này
GateNews9phút trước
PicWe Ra Mắt Ví Tác Nhân AI với Quản Lý Khóa Trên Thiết Bị
PicWe thông báo ra mắt bản beta công khai của PicWe Wallet, một ví khóa cục bộ trên thiết bị được hỗ trợ bởi tác nhân AI, không có cụm khôi phục. Ví hỗ trợ tài sản đa chuỗi, giao dịch hoán đổi (swap), tự động hóa có thể truy cập bằng AI và nhằm thống nhất hạ tầng RWA.
PicWe đã ra mắt bản beta công khai của PicWe Wallet, một ví được bật tác nhân AI (AI Agent) lưu trữ khóa ngay trên thiết bị, loại bỏ cụm khôi phục và giữ các thao tác quan trọng ở cục bộ. Bản beta hỗ trợ quản lý tài sản đa chuỗi, giao dịch hoán đổi và phí dựa trên stablecoin, đồng thời cho phép các tương tác AI có thể lập trình. Các sáng kiến PicWe rộng hơn định vị nền tảng như một hạ tầng thống nhất cho tài sản thế giới thực, cho phép phát hành, lưu thông, thanh toán, thanh toán xuyên biên giới, token hóa và phối hợp chuỗi cung ứng cho các trường hợp sử dụng ở doanh nghiệp.
GateNews53phút trước
Hugging Face phát hành mã nguồn mở ml-intern, một tác nhân AI cho nghiên cứu ML tự chủ
Phát hành mã nguồn mở cho ml-intern, tác nhân nghiên cứu ML tự chủ của Hugging Face có khả năng đọc bài báo, tuyển chọn dữ liệu, huấn luyện, đánh giá và lặp lại qua các lĩnh vực khoa học, y học và toán học.
Tóm tắt: ml-intern của Hugging Face là một tác nhân nghiên cứu ML tự chủ mã nguồn mở có thể đọc các bài báo, tuyển chọn tập dữ liệu, huấn luyện trên GPU tại chỗ hoặc trên đám mây, đánh giá kết quả và lặp lại để cải tiến. Được xây dựng dựa trên smolagents với giao diện dòng lệnh (CLI) và web, nó điều hướng qua arXiv/HF Papers, HF Hub và HF Jobs. Các bản demo bao quát khoa học, y học và toán học, cho thấy khả năng tự động hóa đầu-cuối và mức tăng hiệu năng.
GateNews57phút trước
Giáo sư Dai Jifeng của Đại học Thanh Hoa ra mắt Naive.ai, huy động ~$300M với định giá $800M
Tin tức Gate, ngày 22 tháng 4 — Dai Jifeng, giảng viên liên kết tại Khoa Kỹ thuật Điện của Đại học Thanh Hoa, đã sáng lập Naive.ai, một công ty tập trung vào huấn luyện sau mô hình mã nguồn mở và các tác nhân AI. Startup này đã huy động khoảng $300 triệu USD với định giá ước tính là $80
GateNews2giờ trước
AWS mở rộng các quy trình AI nhiều tác nhân, hỗ trợ Claude Opus 4.7 trên Bedrock
Tin tức từ Gate, ngày 22 tháng 4 — Amazon Web Services đã công bố việc mở rộng các sáng kiến AI mang tính tác nhân thông qua các quy trình làm việc nhiều tác nhân, hỗ trợ Anthropic's Claude Opus 4.7 trên Amazon Bedrock để giúp khách hàng đi xa hơn các thử nghiệm AI sinh thành. Công ty đang mở rộng quan hệ đối tác khi khách hàng chuyển từ các công cụ AI đơn lẻ sang các hệ thống kết nối nhiều tác nhân chuyên biệt.
GateNews2giờ trước
0G Labs Hợp Tác Với Alibaba Cloud để Bật Truy Cập Tác Nhân AI Trên Chuỗi tới Mô Hình Qwen
Tin tức từ Gate, ngày 22 tháng 4 — 0G Labs đã công bố quan hệ hợp tác với Alibaba Cloud nhằm cho phép các tác nhân AI trực tiếp gọi mô hình ngôn ngữ lớn Qwen của Alibaba trên chuỗi thông qua hạ tầng blockchain của 0G. Sự hợp tác này đánh dấu một sự chuyển dịch trong các mô hình tiếp cận AI từ cách làm dựa trên API sang
GateNews3giờ trước