Google đã phát triển công nghệ trí tuệ nhân tạo mới có khả năng biến ảnh tĩnh thành video động bằng cách sử dụng âm thanh của người nói, mở ra nhiều ứng dụng trong lĩnh vực sáng tạo nội dung, giải trí và trợ lý ảo cá nhân.
Google phát triển công nghệ trí tuệ nhân tạo biến ảnh tĩnh thành video động
Google đã phát triển một công nghệ trí tuệ nhân tạo mới có thể biến ảnh tĩnh thành video động chỉ bằng cách sử dụng âm thanh của người nói. Công nghệ này, được đặt tên là VLOGGER, mở ra nhiều ứng dụng trong lĩnh vực sáng tạo nội dung, giải trí và trợ lý ảo cá nhân.
VLOGGER không yêu cầu bất kỳ huấn luyện riêng cho từng người, phát hiện khuôn mặt hoặc điều chỉnh khác. Chỉ cần cung cấp một bức ảnh từ eo lên và một bản ghi âm bất kỳ, công cụ sẽ tự động tạo ra video động với chất lượng và nhất quán thời gian tốt.
Nhóm nghiên cứu của Google cho biết VLOGGER vượt trội hơn so với các phương pháp tạo hình ảnh tiên tiến nhất về chất lượng hình ảnh, bảo tồn nhận dạng và sự nhất quán thời gian. Công cụ này có thể được sử dụng để không chỉ đơn giản hóa quá trình sáng tạo, mà còn tạo ra các trường hợp sử dụng hoàn toàn mới, như giao tiếp trực tuyến nâng cao, giáo dục hoặc trợ lý ảo cá nhân.
Quy trình và ứng dụng của công nghệ VLOGGER
VLOGGER dựa trên một quy trình hai bước để tạo ra video không thực tế từ ảnh tĩnh. Đầu tiên, một mô hình sinh ngẫu nhiên từ con người sang 3D dự đoán chuyển động cơ thể và biểu cảm khuôn mặt từ âm thanh đầu vào. Sau đó, một mô hình kiến trúc dựa trên các mô hình phân tán hình ảnh gần đây được sử dụng để cung cấp sự kiểm soát trong các miền thời gian và không gian.
Google cũng đã tạo ra một tập dữ liệu mới được gọi là MENTOR để hỗ trợ công nghệ VLOGGER. Tập dữ liệu này bao gồm khoảng 800.000 nhận dạng, bao gồm cử chỉ động, và có chú thích về tư thế 3D và biểu cảm. Đây là một tập dữ liệu lớn hơn so với các tập dữ liệu hiện có và giúp cải thiện chất lượng và độ chính xác của công cụ.
Phản ứng và triển vọng của công nghệ VLOGGER
Việc VLOGGER có làm tốt như nhóm nghiên cứu tin tưởng hay không vẫn còn đang tranh luận. Tuy nhiên, công nghệ này mở ra nhiều triển vọng trong lĩnh vực sáng tạo nội dung, giải trí và trợ lý ảo cá nhân. Công cụ VLOGGER có thể giúp đơn giản hóa quá trình tạo video và tạo ra những trường hợp sử dụng mới.
Google chưa tiết lộ kế hoạch phát hành VLOGGER hoặc việc tích hợp công nghệ này vào các sản phẩm trí tuệ nhân tạo khác của mình. Tuy nhiên, công nghệ VLOGGER đang được nghiên cứu để đánh giá khả thi và tiềm năng ứng dụng trong tương lai.