أطلقت Alibaba للتو نموذج Wan2.2-S2V، وهو نموذج لتحويل الكلام إلى فيديو يحتوي على 14 مليار معلمة.
حوّل الصوت إلى مقاطع سينمائية بجودة عالية مع تحكم واقعي في الحركة والبيئة. وهو مفتوح المصدر بالكامل.
أمثلة أدناه: (صوت على)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 10
أعجبني
10
5
إعادة النشر
مشاركة
تعليق
0/400
PumpAnalyst
· 09-12 16:10
مرة أخرى هي حيلة استغلال البيانات الكبيرة. نرى الحقيقة لكن لا نقولها.
حسناً... هذا جنوني!
أطلقت Alibaba للتو نموذج Wan2.2-S2V، وهو نموذج لتحويل الكلام إلى فيديو يحتوي على 14 مليار معلمة.
حوّل الصوت إلى مقاطع سينمائية بجودة عالية مع تحكم واقعي في الحركة والبيئة. وهو مفتوح المصدر بالكامل.
أمثلة أدناه: (صوت على)