Sophie Trần (đứng giữa) tại buổi giới thiệu dự án “Yêu lắm tiếng Việt ơi!” - Ảnh: Đ.Thiện |
Chúng tôi đã có cuộc trao đổi với chị Sophie Trần, giám đốc marketing thị trường Việt Nam của Google châu Á - Thái Bình Dương, về dự án này:
* Theo thống kê của Google, tiếng Việt đang đứng ở đâu trong bản đồ ngôn ngữ trên mạng internet?
- Việt Nam là quốc gia có lượng người dùng Internet phát triển nhanh suốt một thập kỷ qua với khoảng 34% dân số, tương đương 33 triệu người dùng vào thời điểm hiện nay. Nội dung tiếng Việt trực tuyến ngày càng phong phú hơn. Đây cũng là một phần của sự phát triển Internet mạnh mẽ tại châu Á.
Từ những số liệu thống kê về Internet trên thế giới, đã có gần 50% người dùng Internet đến từ châu Á, 20% đến từ châu Âu và chỉ 10% đến từ Bắc Mỹ.
Tuy nhiên, sự phổ biến của ngôn ngữ trên web không tỉ lệ thuận với những số liệu này. Ngôn ngữ phổ biến nhất trên Internet vẫn là tiếng Anh, với tỉ lệ nội dung lên đến 30%.
Tiếng Trung Quốc đứng thứ hai trong khi tiếng Đức, Nga, Tây Ban Nha, Nhật Bản và một vài quốc gia khác nằm trong tốp 10 ngôn ngữ phổ biến nhất trên Internet. Tiếng Việt vẫn chưa nằm trong danh sách này.
Đây là một ví dụ điển hình cho thấy khoảng cách giữa ngôn ngữ trực tuyến với ngôn ngữ mà chúng ta dùng ngoài đời thường.
Tiếng Việt là ngôn ngữ mà người Việt sử dụng chủ yếu khi trực tuyến. Người dùng Việt Nam đến với các trang web với mục đích tìm kiếm thông tin, tuy nhiên đôi khi những phần giải đáp hữu ích có thể đến từ một ngôn ngữ khác ngoài tiếng Việt.
* Vì vậy người dùng Việt Nam mới nhờ đến công cụ Google dịch, nhưng có vẻ khả năng chuyển ngữ giữa tiếng Việt và ngôn ngữ phổ biến nhất là tiếng Anh hiện nay vẫn chưa chính xác lắm?
- Đối với bản dịch tiếng Việt, công cụ này có thể cung cấp kết quả ở một mức độ chấp nhận được. Chẳng hạn, đối với nội dung học thuật về khoa học hay lĩnh vực y tế, công cụ này có thể hỗ trợ những bản dịch với mức độ chính xác lên đến 90%.
Còn đối với những nội dung liên quan đến đời sống hay ngôn ngữ giao tiếp hằng ngày, công cụ này đang dần được cải thiện. Ví dụ ở Việt Nam, “chém gió” có nghĩa là “buôn chuyện”.
Thuật ngữ này mang ý nghĩa về văn hóa, lối sống tại địa phương, và nếu như chúng ta không “dạy” cho máy tính ý nghĩa này, nó sẽ không thể hiểu được. Đây chính là điểm bất cập còn tồn tại hiện nay.
* Google kỳ vọng gì ở dự án “Yêu lắm tiếng Việt ơi!”?
- Internet là một kho dữ liệu vô hạn, cho đến khi nào rào cản ngôn ngữ còn tồn tại thì sự hữu dụng của thông tin sẽ không được phát huy một cách tối đa. Việt Nam có lượng người dùng Internet lớn cũng như tỉ lệ sử dụng điện thoại thông minh ở mức cao. Vì vậy, chúng tôi nhận thấy đây là cơ hội để có thể xóa bỏ được rào cản này, đồng thời cải thiện chất lượng tiếng Việt trực tuyến.
Vào tháng 3-2015 vừa qua, chúng tôi đã ra mắt chiến dịch “Yêu lắm tiếng Việt ơi!” tại Việt Nam. Đây là một chương trình thí điểm của chúng tôi với mục tiêu khắc phục dần hạn chế của ngôn ngữ, bằng cách kêu gọi cộng đồng những người hiểu và yêu tiếng Việt tham gia đóng góp kiến thức của mình nhằm tạo nên sự thay đổi tích cực cho tiếng Việt trên web.
Bất kỳ ai cũng có thể tham gia chương trình này, và bằng cách cùng nhau đóng góp vốn hiểu biết của mình về tiếng Việt, chúng ta có thể giúp máy tính hiểu ngôn ngữ của con người. Từ đó, chúng ta có thể hoàn thiện tiếng Việt trực tuyến, mang lại lợi ích cho toàn thể cộng đồng mạng.
* Lợi ích của người dùng Việt từ dự án này?
- Nhiệm vụ của Google là làm cho thông tin dễ dàng tiếp cận và hữu ích cho mọi người dùng. Người dùng có thể là sinh viên, một người mẹ, người cha, một nhà kinh doanh, một chủ doanh nghiệp nhỏ hay một nhà đầu tư...
Nếu các trang web chỉ hoạt động trong phạm vi tiếng Việt, khả năng truy cập những thông tin hữu ích đang có trên web của người dùng sẽ bị hạn chế.
Chẳng hạn, nếu người dùng là một sinh viên Việt Nam đang tìm kiếm thông tin trên toàn thế giới cho bài nghiên cứu của mình. Những nội dung mà họ tìm được chỉ giới hạn trong tiếng Việt, trong khi câu trả lời tốt nhất lại nằm trong một ngôn ngữ khác như tiếng Anh. Nếu không có bản dịch chính xác, sinh viên đó đã bỏ lỡ một nguồn thông tin hữu ích cho nhu cầu của mình.
Khi ngôn ngữ trực tuyến được cải thiện, người dùng có thể tìm thấy thông tin mình cần trong các ngôn ngữ khác nhau, ngay cả khi họ tìm kiếm bằng tiếng Việt. Ví dụ, nếu yêu cầu tìm kiếm xuất phát bằng tiếng Việt, từ người dùng Việt Nam và sau khi tìm kiếm thì công cụ tìm kiếm sẽ cung cấp một đáp án bằng tiếng Anh, đồng thời dịch qua tiếng Việt nếu như nhận thấy đó là một kết quả phù hợp nhất.
Còn đối với người làm kinh doanh, nếu một nhà đầu tư không biết tiếng Việt đang tìm kiếm thông tin về Việt Nam nhằm đưa ra quyết định đầu tư thì nguồn thông tin tốt nhất liên quan đến nhu cầu của họ chắc chắn là bằng tiếng Việt.
Tuy nhiên, nếu thông tin bị giới hạn trong tiếng Việt sẽ là rào cản cho việc truy cập thông tin cũng như đưa ra quyết định đầu tư phù hợp cho nhà đầu tư đó. Đây không chỉ là một mất mát cho nhà đầu tư, mà còn là một mất mát của Việt Nam.
* Cảm xúc của Sophie Trần về cái tên "Yêu lắm tiếng Việt ơi!"?
- Tôi lớn lên tại Pháp và đã trở lại Việt Nam được một thời gian dài, bởi tôi luôn mong muốn làm điều gì đó cho đất nước này. Tôi thức dậy vào mỗi buổi sáng và luôn nghĩ về những điều tôi có thể làm nhằm cải thiện cuộc sống của người Việt thông qua các công cụ, công nghệ mà Google đã và đang phát triển.
Cách tham gia "Yêu lắm tiếng Việt ơi!" Google dịch ra đời khoảng 10 năm trước với mục tiêu giải quyết những trở ngại về ngôn ngữ để người dùng có thể truy cập thông tin một cách dễ dàng hơn. Google dịch sử dụng máy dịch để chuyển ngữ văn bản từ một ngôn ngữ khác. Đối với dịch văn bản, công cụ này hỗ trợ 90 ngôn ngữ. Đối với hình ảnh được quét từ thiết bị, Google có thể hỗ trợ dịch 36 ngôn ngữ. Ngoài ra, đối với các cuộc hội thoại, Google dịch có thể cung cấp bản dịch với 42 ngôn ngữ. Đã có hơn 500 triệu người dùng Google dịch và hơn 1 tỉ bản dịch được thực hiện mỗi ngày. Cộng đồng dịch vận hành bằng cách nhận phản hồi của người dùng cho các bản dịch cần được cải thiện. Đến với cộng đồng Google dịch, người dùng được yêu cầu đăng nhập tài khoản Gmail, chọn ngôn ngữ mà họ biết và muốn cải thiện. Giả sử người dùng chọn tiếng Việt và tiếng Anh sẽ có hai lựa chọn chuyển ngữ là từ tiếng Việt sang tiếng Anh hoặc ngược lại. Đối với mỗi lựa chọn, người dùng có thể cải thiện bằng thao tác dịch (translate) hoặc thẩm định (validate). Với thao tác dịch, người dùng sẽ được cung cấp một từ hay cụm từ ngẫu nhiên và máy sẽ cung cấp bản dịch tương ứng. Đối với thẩm định, chức năng này sẽ cung cấp từ hoặc cụm từ với nhiều phương án dịch khác nhau, người dùng chỉ cần xác nhận câu trả lời đúng/sai bằng cách đánh dấu vào ô trống có sẵn. Tính năng dịch này hoạt động trên tất cả thiết bị, điện thoại di động, máy tính bảng hoặc máy tính xách tay. Google dịch tiếp nhận sự đóng góp từ người dùng tại đường dẫn translate.google.com.vn/community. |