Google ra mắt Gemini Omni, cho phép tạo video bằng hình ảnh, giọng nói và văn bản

20/05/2026 13:48

(PLO)- Tại sự kiện Google I/O 2026, gã khổng lồ công nghệ tìm kiếm đã trình làng Gemini Omni, dòng mô hình AI mới có khả năng kết hợp suy luận với các công cụ sáng tạo nội dung.

Đáng chú ý, người dùng có thể tạo hoặc chỉnh sửa video bằng nhiều loại dữ liệu đầu vào khác nhau như hình ảnh, video, văn bản, thậm chí cả giọng nói.

Mô hình đầu tiên thuộc dòng này là Gemini Omni Flash, hiện đã bắt đầu xuất hiện trên ứng dụng Gemini, Google Flow và YouTube Shorts.

Thông tin quan trọng dành cho 3 tỉ người dùng Google Chrome

Tạo video bằng Omni Flash trong Google Flow. Ảnh: TIỂU MINH

Khác với cách chỉnh sửa video truyền thống vốn yêu cầu nhiều thao tác phức tạp, Gemini Omni cho phép người dùng trò chuyện trực tiếp với AI để thay đổi nội dung video bằng ngôn ngữ tự nhiên. Chẳng hạn, người dùng có thể yêu cầu thêm nhân vật, thay đổi bối cảnh, chỉnh sửa chuyển động hoặc biến một đoạn video thông thường thành một khung cảnh hoàn toàn khác. Hệ thống cũng ghi nhớ các yêu cầu trước đó để duy trì sự nhất quán giữa nhân vật và bối cảnh.

Google cho biết Gemini Omni không chỉ tạo hình ảnh hoặc video theo yêu cầu mà còn sử dụng kiến thức về thế giới thực để xử lý nội dung hợp lý hơn. Mô hình được thiết kế để hiểu các yếu tố như chuyển động, trọng lực hay cách sự vật tương tác với nhau trong thực tế nhằm tạo ra video tự nhiên hơn.

Một điểm mới khác là tính năng Avatar, cho phép tạo phiên bản kỹ thuật số từ chính người dùng để tạo video có ngoại hình và giọng nói tương tự ngoài đời thật. Tuy nhiên, Google cho biết hãng vẫn đang tiếp tục thử nghiệm và phát triển tính năng này theo hướng an toàn hơn trước khi mở rộng phạm vi sử dụng.

Tạo nhân vật để sử dụng đồng nhất xuyên suốt video. Ảnh: TIỂU MINH

Theo Google, tất cả video tạo bằng Gemini Omni sẽ được gắn dấu nhận diện kỹ thuật số SynthID để hỗ trợ xác minh nội dung AI và tăng tính minh bạch.

9 thiết bị công nghệ đáng chú ý trong tháng 5-2026

Galaxy Z Fold 8 Wide bị rò rỉ thông tin, khiến nhiều người không khỏi ngỡ ngàng

Tiểu Minh

Theo dõi Báo Pháp Luật Tp HCM trên Google News

từ khóa

#google #gemini omni #gemini omni flash #tạo video bằng omni flash

Tiện ích

Tin mới

Báo Pháp Luật TP. Hồ Chí Minh

Google ra mắt Gemini Omni, cho phép tạo video bằng hình ảnh, giọng nói và văn bản

Thông tin quan trọng dành cho 3 tỉ người dùng Google Chrome

9 thiết bị công nghệ đáng chú ý trong tháng 5-2026

Galaxy Z Fold 8 Wide bị rò rỉ thông tin, khiến nhiều người không khỏi ngỡ ngàng

từ khóa

Đọc thêm

Chiêu lừa mới nhắm vào phụ huynh có con nghỉ hè

Lớp tập huấn chuyển đổi số quy mô lớn vừa bế giảng tại TP.HCM

Thông tin quan trọng dành cho người dùng Zalo

45% mật khẩu bị lộ có thể bị bẻ khóa trong chưa đầy một phút

Hàng tỉ người dùng Gmail có nguy cơ bị ảnh hưởng bởi lỗi bảo mật này

Nếu làm những điều này, máy tính có thể bị theo dõi mà bạn không hề hay biết

Bất ngờ với 5 công nghệ từ thập niên 1980 vẫn được dùng đến hôm nay

Vì sao dây điện thoại bàn ngày xưa luôn xoắn thành lò xo?

Mỹ công bố loạt hồ sơ UFO, nhưng chưa có bằng chứng về người ngoài hành tinh

5 tính năng AI chỉnh sửa ảnh miễn phí bạn nên biết

Làm hộ chiếu online, chọn sai mục này có thể khiến hồ sơ bị chậm

Mỏi mắt vì điện thoại, hãy thử ngay quy tắc 20-20-20

Ra mắt Applied AI Lab đầu tiên tại Việt Nam

Thực hư việc nhận tích xanh Facebook miễn phí

Đi du lịch dịp lễ cần nhớ điều này để tránh mất dữ liệu

Gần 2,86 tỉ mật khẩu bị đánh cắp, người dùng nên bỏ thói quen này ngay

Nhận được tin nhắn phạt nguội kiểu này, người dùng nên xóa ngay để tránh mất tiền

Người dùng Zalo nên biết điều này để tránh mất quyền lợi

Lời giải cho bài toán sản xuất hàng loạt robot hình người tại Việt Nam

Robot phá kỷ lục của con người tại giải bán marathon

Google ra mắt Gemini Omni, cho phép tạo video bằng hình ảnh, giọng nói và văn bản

từ khóa

Tiện ích

Tất cả chuyên mục