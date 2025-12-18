(PLO)- Google vừa chính thức ra mắt Gemini 3 Flash, cho tốc độ phản hồi và xử lý đa phương thức nhanh hơn dù hoàn toàn được cung cấp miễn phí.

Theo Google, hệ sinh thái Gemini hiện xử lý hơn một ngàn tỉ token mỗi ngày thông qua API, cho thấy quy mô sử dụng AI ngày càng nhiều, đặc biệt là trong các tác vụ lập trình, phân tích nội dung phức tạp và xây dựng ứng dụng tương tác.

Cân bằng giữa trí tuệ và hiệu suất

Phiên bản Gemini 3 Flash kế thừa nền tảng suy luận của Gemini 3 Pro, nhưng được tinh chỉnh để phản hồi nhanh hơn và sử dụng tài nguyên hiệu quả hơn.

Mô hình có khả năng điều chỉnh mức độ “suy nghĩ” tùy theo độ phức tạp của tác vụ, từ đó giảm trung bình hơn 30% lượng token tiêu thụ so với Gemini 2.5 Pro trong các tình huống sử dụng thực tế.

Điểm đáng chú ý là Gemini 3 Flash vẫn đạt kết quả cao trên các bài kiểm tra học thuật chuyên sâu. Cụ thể, mô hình đạt 90,4% trên GPQA Diamond và 33,7% trên Humanity’s Last Exam khi không sử dụng công cụ hỗ trợ. Trên thang đo MMMU Pro, Gemini 3 Flash đạt 81,2%, tương đương với Gemini 3 Pro và vượt trội so với thế hệ trước.

So sánh Gemini 3 Flash với các công cụ AI khác. Ảnh: Google

Nhanh hơn và rẻ hơn

Google cho biết thế mạnh lớn nhất của Gemini 3 Flash nằm ở tốc độ xử lý.

Theo đánh giá của Artificial Analysis, mô hình này nhanh hơn gấp ba lần so với Gemini 2.5 Pro, trong khi chi phí được tối ưu đáng kể.

Cụ thể, Gemini 3 Flash có giá 0,50 USD cho mỗi một triệu token đầu vào và 3 USD cho mỗi một triệu token đầu ra. Token đầu vào dạng âm thanh được giữ ở mức 1 USD cho mỗi một triệu token.

Cách tiếp cận này giúp Gemini 3 Flash phù hợp với các ứng dụng yêu cầu phản hồi gần như tức thì, từ trợ lý AI thời gian thực cho đến các hệ thống tự động hóa dựa trên tác nhân.

Trên thang đo đánh giá năng lực của các tác nhân lập trình (SWE-bench Verified), Gemini 3 Flash đạt 78%, vượt qua cả Gemini 2.5 và Gemini 3 Pro.

Nhờ khả năng suy luận, sử dụng công cụ và xử lý đa phương thức, Gemini 3 Flash có thể đảm nhiệm các tác vụ như phân tích video, trích xuất dữ liệu, hỏi đáp bằng hình ảnh hay xây dựng các ứng dụng tương tác cần phản hồi nhanh.

Người dùng phổ thông được hưởng lợi gì?

Đối với người dùng phổ thông, Gemini 3 Flash đã trở thành mô hình mặc định trong ứng dụng Gemini, thay thế cho phiên bản 2.5 Flash. Điều này đồng nghĩa với việc người dùng trên toàn cầu có thể trải nghiệm Gemini 3 Flash mà không mất phí.

Cách sử dụng Gemini 3 Flash miễn phí. Ảnh: TIỂU MINH

Nhờ khả năng lập luận đa phương thức, người dùng có thể yêu cầu Gemini phân tích hình ảnh, video và chuyển nội dung đó thành kế hoạch cụ thể chỉ trong vài giây.

