Chia sẻ trên trang Facebook cá nhân, Mark Zuckerberg cho biết công ty vừa phát hành SeamlessM4T, một mô hình AI đa phương thức mới cho phép mọi người trên thế giới giao tiếp hiệu quả hơn.
“SeamlessM4T có khả năng chuyển giọng nói thành văn bản, chuyển văn bản thành giọng nói, chuyển giọng nói thành giọng nói, dịch văn bản thành văn bản và nhận dạng giọng nói gần 100 ngôn ngữ. Theo thời gian, chúng tôi sẽ tích hợp những tiến bộ AI này trong dịch thuật và phiên âm vào Facebook, Instagram, WhatsApp, Messenger và Threads”.
Vào tháng 7-2022, công ty đã triển khai dự án No Language Left Behind, sử dụng AI để dịch văn bản cho 200 ngôn ngữ với trọng tâm cải thiện bản dịch cho các ngôn ngữ hiếm hoặc ít được sử dụng.
SeamlessM4T được xây dựng dựa trên mô hình AI cũ của Meta vào năm 2022. Ảnh minh họa |
Giống như nhiều công ty công nghệ lớn, Meta đã tăng cường tập trung phát triển AI trong năm nay.
Trước đó, Microsoft đã phát hành công cụ tìm kiếm Bing được tích hợp AI mới, sử dụng cùng một công nghệ như ChatGPT của OpenAI. Tương tự, Amazon cho biết họ sẽ sử dụng AI tổng quát để phân tích và tóm tắt các đánh giá của khách hàng, trong khi Google thử nghiệm tạo ra trải nghiệm tìm kiếm mới lạ…
AI gần như đã được áp dụng trong nhiều lĩnh vực, tuy nhiên, sự gia tăng của AI cũng làm dấy lên mối lo ngại về những tác động tiềm tàng đối với xã hội .
Giống như nhiều mô hình AI trước đây của Meta, SeamlessM4T đang được phát hành theo giấy phép nghiên cứu. Công ty cũng đang phát hành siêu dữ liệu cho dự án trong tập dữ liệu có tên SeamlessAlign. Meta nói rằng đây là tập dữ liệu đa phương thức nguồn mở lớn nhất, chứa 270.000 giờ khai thác lời nói và căn chỉnh văn bản mà AI đã được đào tạo.