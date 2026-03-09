(PLO)- Một nghiên cứu mới vừa được công bố trên tạp chí khoa học Nature Medicine cho thấy ChatGPT có thể đưa ra nhiều lời khuyên không chính xác trong các tình huống y tế, bao gồm cả các ca cấp cứu nghiêm trọng.

Nghiên cứu do nhóm chuyên gia tại Trường Y Icahn thuộc Đại học Mount Sinai (Mỹ) thực hiện. Đây được xem là một trong những đánh giá có hệ thống đầu tiên về khả năng tư vấn y tế của các công cụ AI trong bối cảnh lâm sàng giả định.

Cụ thể, nhóm nghiên cứu đã xây dựng 60 kịch bản lâm sàng thuộc 21 chuyên khoa khác nhau. Các tình huống trải dài từ mức độ nhẹ có thể theo dõi tại nhà, đến các trường hợp cần cấp cứu ngay. Ba bác sĩ độc lập đã xác định phương án xử trí phù hợp cho từng tình huống dựa trên hướng dẫn của 56 hiệp hội y khoa, làm cơ sở đối chiếu.

Sau đó, mỗi kịch bản được đưa vào ChatGPT theo 16 cách diễn đạt khác nhau, thay đổi yếu tố như giới tính, chủng tộc, bảo hiểm, hoàn cảnh cá nhân hoặc cách bệnh nhân mô tả triệu chứng. Tổng cộng nhóm nghiên cứu đã thử nghiệm 960 tình huống hỏi đáp với ChatGPT.

Nhiều rủi ro khi nhờ ChatGPT tư vấn y tế, sức khỏe. Ảnh minh họa: AI

Kết quả cho thấy ChatGPT chỉ tư vấn đúng trong 48,4% các ca thực sự cần cấp cứu. Với những tình huống không khẩn cấp, tỉ lệ chính xác còn thấp hơn, chỉ 35,2%. Ngược lại, hệ thống lại xử lý khá tốt ở nhóm tình huống “lưng chừng”, tức những ca có mức độ rủi ro trung bình.

Nói đơn giản, ChatGPT làm tốt nhất với các ca bệnh phổ biến, không quá nhẹ nhưng cũng chưa đến mức nguy kịch. Còn khi tình huống quá nhẹ hoặc quá nghiêm trọng, độ chính xác lại giảm mạnh. Nhóm nghiên cứu mô tả hiện tượng này như một đường cong hình chữ U ngược, chính xác ở giữa, nhưng kém ở hai đầu.

Đáng chú ý, trong hơn một nửa số ca cấp cứu thực sự, ChatGPT chỉ khuyến nghị theo dõi thêm 24–48 giờ thay vì đi cấp cứu ngay. Nhiều trường hợp liên quan đến cơn hen suyễn cấp tính hoặc nhiễm toan ceton do tiểu đường, những tình trạng có thể đe dọa tính mạng nếu không được xử lý kịp thời.

Ngoài ra, ChatGPT cũng gặp khó khăn trong việc nhận diện nguy cơ tự tử. Trong 14 tình huống có dấu hiệu ý định tự gây hại, hệ thống chỉ kích hoạt cảnh báo hỗ trợ khủng hoảng ở 4 trường hợp.

Ở chiều ngược lại, với các tình huống không khẩn cấp, ChatGPT lại thường làm quá, khuyến nghị người dùng đi khám dù không cần thiết. Điều này có thể gây lo lắng không cần thiết và tạo thêm áp lực cho hệ thống y tế.

Tiến sĩ Girish N. Nadkarni, tác giả chính của nghiên cứu, cho biết ChatGPT xử lý tương đối tốt các ca cấp cứu điển hình như đột quỵ hoặc phản vệ nặng, nhưng gặp khó khăn ở những tình huống phức tạp, nơi cần phán đoán lâm sàng và kinh nghiệm thực tế.

Nhóm nghiên cứu nhấn mạnh rằng các công cụ AI như ChatGPT có thể hữu ích trong việc cung cấp thông tin tổng quát, nhưng không nên được sử dụng thay thế tư vấn y tế chuyên môn. Trong các tình huống khẩn cấp hoặc triệu chứng nghiêm trọng, việc tìm đến cơ sở y tế vẫn là lựa chọn an toàn nhất.

