مجموعة 蚂蚁 تطلق نموذج كبير متعدد الوسائط مفتوح المصدر Ming-Flash-Omni 2.0

أطلقت مجموعة 蚂蚁 مفتوحة المصدر النموذج متعدد الوسائط Ming-Flash-Omni 2.0، وهو أول نموذج موحد لتوليد الصوت في جميع السيناريوهات في الصناعة، يمكنه توليد الصوت والكلام والمؤثرات البيئية والموسيقى في مسار صوتي واحد في الوقت نفسه. يمكن للمستخدمين إصدار أوامر بلغة طبيعية للتحكم في نغمة الصوت، سرعة الكلام، النغمة، مستوى الصوت، العاطفة واللهجات. حقق النموذج معدل استنتاج منخفض جدًا يبلغ 3.1 هرتز، مما يتيح توليد صوت عالي الدقة في الوقت الحقيقي لمدة دقائق طويلة من الصوتيات الممتدة. (تقرير صحيفة لوح الابتكار التكنولوجي)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.52Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.52Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.52Kعدد الحائزين:1
    0.00%
  • تثبيت