Công nghệ tạo video AI đột phá, Web3 AI đối mặt với cơ hội mới

Công nghệ tạo video AI đạt được bước tiến đột phá, mang lại cơ hội mới cho Web3 AI

Gần đây, một trong những thay đổi nổi bật nhất trong lĩnh vực AI là sự đột phá của công nghệ tạo video đa phương thức. Công nghệ này đã phát triển từ việc tạo video chỉ từ văn bản sang mô hình tạo toàn bộ tích hợp văn bản, hình ảnh và âm thanh.

Một số ví dụ về những đột phá công nghệ đáng chú ý bao gồm:

  1. Một công ty công nghệ đã mở nguồn khung EX-4D có thể chuyển đổi video đơn thành nội dung 4D góc tự do, tỷ lệ chấp nhận của người dùng trên 70%. Điều này có nghĩa là AI có thể tự động tạo ra hiệu ứng xem ở bất kỳ góc nào cho video thông thường, điều này trước đây cần phải có đội ngũ mô hình 3D chuyên nghiệp để thực hiện.

  2. Một nền tảng AI tuyên bố có khả năng tạo ra video "chất lượng điện ảnh" 10 giây từ một hình ảnh đơn lẻ. Hiệu ứng cụ thể vẫn cần được xác minh sau khi phiên bản chuyên nghiệp của nó được cập nhật.

  3. Một công nghệ được phát triển bởi một tổ chức nghiên cứu AI nổi tiếng có thể đồng bộ tạo ra video 4K và âm thanh môi trường. Công nghệ này vượt qua thách thức đồng bộ âm thanh và hình ảnh trong các cảnh phức tạp, chẳng hạn như đạt được sự tương ứng chính xác giữa hành động đi bộ trong hình ảnh và âm thanh bước chân.

  4. Mô hình AI của một nền tảng video ngắn sử dụng 8 tỷ tham số, có thể tạo ra video 1080p trong vòng 2.3 giây, chi phí khoảng 3.67 nhân dân tệ/5 giây. Mặc dù việc kiểm soát chi phí khá tốt, nhưng vẫn còn không gian để cải thiện chất lượng tạo ra trong các cảnh phức tạp.

Những đột phá này có ý nghĩa quan trọng trong chất lượng video, chi phí sản xuất và các tình huống ứng dụng:

Về mặt kỹ thuật, độ phức tạp của việc tạo video đa mô hình đang gia tăng theo cấp số nhân. Nó cần xử lý việc tạo ra hình ảnh đơn lẻ (khoảng 10^6 điểm pixel), đảm bảo tính liên tục về thời gian (ít nhất 100 khung hình), đồng bộ âm thanh (10^4 điểm mẫu mỗi giây) và tính nhất quán trong không gian 3D. Hiện nay, những nhiệm vụ phức tạp này được thực hiện thông qua việc phân tách theo mô-đun và hợp tác giữa các mô hình lớn, mỗi mô-đun tập trung vào chức năng cụ thể, như ước lượng độ sâu, chuyển đổi góc nhìn, nội suy thời gian và tối ưu hóa việc kết xuất.

Về chi phí, tối ưu hóa kiến trúc suy diễn đóng vai trò then chốt. Điều này bao gồm chiến lược sinh cấp bậc (trước tiên tạo khung ở độ phân giải thấp, sau đó tăng cường chi tiết ở độ phân giải cao), cơ chế tái sử dụng bộ nhớ đệm (tái sử dụng các cảnh tương tự) và phân bổ tài nguyên động (điều chỉnh độ sâu mô hình theo độ phức tạp của nội dung).

Về mặt ứng dụng, công nghệ AI đang làm đảo lộn quy trình sản xuất video truyền thống. Trước đây, một đoạn quảng cáo dài 30 giây có thể tốn hàng trăm ngàn nhân dân tệ chi phí sản xuất, bao gồm thiết bị, địa điểm, diễn viên và hậu kỳ. Bây giờ, AI có thể rút ngắn quy trình này chỉ còn vài phút sau khi nhập từ khóa, đồng thời có thể đạt được các góc độ và hiệu ứng mà quay phim truyền thống khó có thể đạt được. Cuộc cách mạng này sẽ định hình lại nền kinh tế sáng tạo, khiến cho sự sáng tạo và thẩm mỹ trở thành yếu tố then chốt.

Những tiến bộ của công nghệ AI Web2 cũng có ảnh hưởng quan trọng đến lĩnh vực AI Web3:

  1. Sự thay đổi trong cấu trúc nhu cầu về sức mạnh tính toán đã tạo ra cơ hội cho sức mạnh tính toán phân tán bị bỏ trống, đồng thời cũng tăng cường nhu cầu về các mô hình tinh chỉnh phân tán khác nhau, thuật toán và nền tảng suy diễn.

  2. Sự gia tăng nhu cầu về gán nhãn dữ liệu đã cung cấp những ứng dụng mới cho cơ chế khuyến khích Web3. Việc tạo ra video chuyên nghiệp cần có mô tả cảnh chính xác, hình ảnh tham khảo, phong cách âm thanh, quỹ đạo chuyển động của máy quay và các điều kiện ánh sáng cũng như dữ liệu chuyên môn khác. Cách thức khuyến khích của Web3 có thể khuyến khích các nhiếp ảnh gia, kỹ sư âm thanh và nghệ sĩ 3D cung cấp dữ liệu chất lượng cao.

  3. Công nghệ AI đã tiến hóa từ việc phân phối tài nguyên quy mô lớn tập trung sang hợp tác theo mô-đun, điều này đã tạo ra nhu cầu mới cho các nền tảng phi tập trung. Trong tương lai, sự kết hợp giữa sức mạnh tính toán, dữ liệu, mô hình và cơ chế khuyến khích có thể hình thành một vòng lặp tích cực tự gia tăng, thúc đẩy sự hòa nhập sâu sắc giữa các kịch bản Web3 AI và Web2 AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Chia sẻ
Bình luận
0/400
rekt_but_not_brokevip
· 4giờ trước
Có gì lạ đâu, chỉ là vẽ rắn thêm chân thôi.
Xem bản gốcTrả lời0
DefiOldTrickstervip
· 11giờ trước
Ông lão đã chơi cái này bao nhiêu năm rồi, cái này nhìn là biết có thể chơi đùa với mọi người một phen, trên chuỗi lại sắp diễn ra một đợt bơm lớn nữa rồi... Ai ơi, lần trước tôi đã kể cho các bạn nghe về cái bẫy Token AI đó còn nhớ không?
Xem bản gốcTrả lời0
ReverseTradingGuruvip
· 07-13 12:22
À đúng đúng đúng, có tay là được, tất cả đều là người làm việc với AI.
Xem bản gốcTrả lời0
WalletDetectivevip
· 07-13 12:21
Chỉ đến mức này? Không bằng camera giám sát thời kỳ đầu.
Xem bản gốcTrả lời0
GasOptimizervip
· 07-13 12:18
Đến đây đến đây! Hãy tiết kiệm gas trong cái bể của mọi người.
Xem bản gốcTrả lời0
InfraVibesvip
· 07-13 12:13
Có chút vượt quá khả năng hiểu biết của tôi rồi 233
Xem bản gốcTrả lời0
DevChivevip
· 07-13 12:03
bull da, có lẽ trong tương lai ngành công nghiệp phim ảnh sẽ có một số người thất nghiệp
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)