Viettel muốn tạo ra AI hiểu người Việt hơn ChatGPT?

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam

(PLO)- Viettel AI vừa công bố VT-Super-120B-A12B, mô hình ngôn ngữ lớn tiếng Việt có quy mô 120 tỷ tham số, được phát triển nhằm phục vụ các bài toán đặc thù của cơ quan, tổ chức và doanh nghiệp trong nước.

Trong bối cảnh cuộc đua AI ngày càng tập trung vào dữ liệu và năng lực làm chủ công nghệ, Viettel AI cho biết đơn vị đã phát triển thành công mô hình ngôn ngữ lớn VT-Super-120B-A12B với quy mô 120 tỷ tham số. Đây là một trong những mô hình AI tiếng Việt có quy mô lớn nhất do đội ngũ kỹ sư trong nước trực tiếp huấn luyện và tối ưu.

Theo Viettel AI, mô hình đạt hiệu suất thuộc nhóm dẫn đầu trong cùng phân khúc quy mô khi tham gia các bài kiểm tra đánh giá. Điểm khác biệt nằm ở việc mô hình được huấn luyện trên dữ liệu tiếng Việt và dữ liệu nghiệp vụ trong nước, giúp cải thiện khả năng xử lý các yêu cầu gắn với thực tế tại Việt Nam.

viettel-2.jpg

VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super. Bên cạnh khả năng xử lý tiếng Việt, mô hình vẫn duy trì hiệu năng tiếng Anh của phiên bản gốc và hạn chế tình trạng suy giảm kiến thức đã học sau quá trình huấn luyện bổ sung.

Một trong những thế mạnh của mô hình là khả năng xử lý ngữ cảnh dài. Điều này cho phép AI theo dõi và liên kết thông tin xuyên suốt nhiều tài liệu, quy trình hoặc cuộc hội thoại phức tạp trong cùng một tác vụ.

Theo Viettel AI, đây là yếu tố quan trọng đối với nhiều bài toán thực tế tại Việt Nam, nơi quy trình xử lý công việc thường liên quan đến nhiều loại hồ sơ, văn bản và quy định khác nhau. Khi có thể hiểu được lượng lớn dữ liệu trong cùng một ngữ cảnh, AI sẽ đưa ra phản hồi chính xác và phù hợp hơn.

Để xây dựng mô hình, đội ngũ phát triển đã sử dụng nhiều nguồn dữ liệu tiếng Việt như dữ liệu hành chính, dữ liệu doanh nghiệp, hội thoại thực tế và các tài liệu chuyên ngành. Quá trình huấn luyện được thực hiện qua nhiều giai đoạn, từ mở rộng kiến thức tiếng Việt đến nâng cao khả năng suy luận và cải thiện chất lượng phản hồi.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, cho rằng AI đang dần trở thành một hạ tầng công nghệ quan trọng. Theo ông, việc làm chủ mô hình ngôn ngữ lớn bằng tiếng Việt sẽ tạo nền tảng để phát triển các hệ thống AI phù hợp hơn với nhu cầu của cơ quan, doanh nghiệp trong nước.

Ở góc độ đối tác công nghệ, NVIDIA đánh giá việc phát triển các mô hình AI dựa trên ngôn ngữ và dữ liệu bản địa sẽ góp phần mở rộng khả năng ứng dụng trí tuệ nhân tạo trong nhiều lĩnh vực khác nhau.

Trên nền tảng VT-Super-120B-A12B, Viettel AI đang phát triển các hệ thống AI Agent có khả năng tự thực hiện nhiều tác vụ liên tiếp thay vì chỉ trả lời câu hỏi đơn lẻ. Một trong những ứng dụng đầu tiên là Trợ lý AI Pháp luật, được thiết kế để hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đưa ra gợi ý xử lý cho người dùng.

Theo định hướng của Viettel AI, mô hình mới sẽ được ứng dụng trong nhiều lĩnh vực như hành chính công, chăm sóc khách hàng, vận hành doanh nghiệp và phân tích dữ liệu, với mục tiêu xây dựng các hệ thống AI hiểu rõ ngôn ngữ, dữ liệu và nhu cầu thực tế của người dùng Việt Nam.

Đọc thêm