سحابة Tencent مفتوحة المصدر CubeSandbox، متوافقة مع E2B، وتشغيل 2000 صندوق رملي على جهاز واحد

robot
إنشاء الملخص قيد التقدم

أخبار ME، 21 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، قامت Tencent Cloud بفتح مصدر صندوق الرمل لوكيل الذكاء الاصطناعي Cube Sandbox، مكتوب بلغة Rust، بموجب رخصة Apache 2.0.
الصندوق هو بيئة معزولة لتشغيل الكيل، تمنع الكود الناتج عن النموذج من حذف الملفات عن طريق الخطأ أو الوصول غير المصرح به إلى المضيف.
حاليًا، تستخدم منتجات مثل OpenAI Agents SDK و Manus و Perplexity و Hugging Face بنية مماثلة، والمعيار الفعلي للواجهة هو E2B.
يتوافق Cube مع واجهة E2B، ولا حاجة لتغيير رمز العمل، فقط بتغيير متغير بيئة واحد، يمكن نقل الوكيل من خدمة E2B الخاصة إلى Cube ذات النشر الذاتي.
أعلنت Tencent Cloud عن مجموعتين من بيانات الأداء.
البدء البارد لمرة واحدة أقل من 60 مللي ثانية، عند 50 تزامن، المتوسط 67 مللي ثانية، P95 90 مللي ثانية، P99 137 مللي ثانية.
استهلاك الذاكرة الدائم لنموذج واحد أقل من 5 ميجابايت (تم قياسه عندما لا تتجاوز مواصفات الصندوق 32 جيجابايت)،
ويمكن لخادم واحد بثمانية وتسعين نواة تشغيل أكثر من 2000 صندوق رمل في نفس الوقت.
في نفس السيناريو، يبدأ حاوية Docker في حوالي 200 مللي ثانية، مع نواة مضيف مشتركة؛
أما تشغيل الآلات الافتراضية التقليدية فيستغرق ثوانٍ، ويبدأ كل نموذج بذاكرة لا تقل عن 20 ميجابايت.
طريقة Cube هي تخصيص نواة نظام تشغيل ضيف مستقل لكل وكيل، مع عزل على مستوى الأجهزة، مع تقليل زمن التشغيل إلى مئات الملي ثانية.
يعتمد التسريع على تهيئة تجمع الموارد، واستنساخ اللقطات، وتحسين قفل الطبقة الأساسية؛
ويتم تقليل استهلاك الذاكرة عبر إعادة كتابة Rust، وإعادة استخدام الذاكرة CoW، ومشاركة القرص عبر reflink.
كما يتضمن المشروع CubeVS، الذي يستخدم eBPF لعزل الشبكة بين الصناديق الرملية.
أعطت الاختبارات على نطاق واسع مثالين.
كان Cube يعمل أصلاً ضمن نظام Tencent Cloud Serverless، مع أكثر من مئات المليارات من الطلبات.
بعد نقل سيناريو برمجة الذكاء الاصطناعي Yuanbao إلى Cube، انخفض استهلاك الموارد بنسبة 95.8%.
بين العملاء الخارجيين، تمكن MiniMax من إدارة مئات الآلاف من الصناديق الرملية في تدريب Agentic RL خلال دقائق باستخدام Cube.
الخطة التالية هي فتح مصدر لخاصية استرجاع اللقطات على مستوى الأحداث، وتوفير استرجاع الحالة في غضون مئات الملي ثانية.
(المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت