Alibaba acaba de lanzar Wan2.2-S2V, un modelo de discurso a video de 14B parámetros.
Transforma audio en clips de calidad cinematográfica con movimiento realista y control del entorno. Y es completamente de código abierto.
Ejemplos a continuación: (sonido en)
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
¡Ok... esto es una locura!
Alibaba acaba de lanzar Wan2.2-S2V, un modelo de discurso a video de 14B parámetros.
Transforma audio en clips de calidad cinematográfica con movimiento realista y control del entorno. Y es completamente de código abierto.
Ejemplos a continuación: (sonido en)