Nghiên cứu do nhóm chuyên gia tại Trường Y Icahn thuộc Đại học Mount Sinai (Mỹ) thực hiện. Đây được xem là một trong những đánh giá có hệ thống đầu tiên về khả năng tư vấn y tế của các công cụ AI trong bối cảnh lâm sàng giả định.
Cụ thể, nhóm nghiên cứu đã xây dựng 60 kịch bản lâm sàng thuộc 21 chuyên khoa khác nhau. Các tình huống trải dài từ mức độ nhẹ có thể theo dõi tại nhà, đến các trường hợp cần cấp cứu ngay. Ba bác sĩ độc lập đã xác định phương án xử trí phù hợp cho từng tình huống dựa trên hướng dẫn của 56 hiệp hội y khoa, làm cơ sở đối chiếu.
Sau đó, mỗi kịch bản được đưa vào ChatGPT theo 16 cách diễn đạt khác nhau, thay đổi yếu tố như giới tính, chủng tộc, bảo hiểm, hoàn cảnh cá nhân hoặc cách bệnh nhân mô tả triệu chứng. Tổng cộng nhóm nghiên cứu đã thử nghiệm 960 tình huống hỏi đáp với ChatGPT.
Tin xấu dành cho người dùng Google
(PLO)- Google vừa xác nhận tổng cộng 10 lỗ hổng bảo mật mới, ảnh hưởng đến gần 4 tỉ người dùng.
Kết quả cho thấy ChatGPT chỉ tư vấn đúng trong 48,4% các ca thực sự cần cấp cứu. Với những tình huống không khẩn cấp, tỉ lệ chính xác còn thấp hơn, chỉ 35,2%. Ngược lại, hệ thống lại xử lý khá tốt ở nhóm tình huống “lưng chừng”, tức những ca có mức độ rủi ro trung bình.
Nói đơn giản, ChatGPT làm tốt nhất với các ca bệnh phổ biến, không quá nhẹ nhưng cũng chưa đến mức nguy kịch. Còn khi tình huống quá nhẹ hoặc quá nghiêm trọng, độ chính xác lại giảm mạnh. Nhóm nghiên cứu mô tả hiện tượng này như một đường cong hình chữ U ngược, chính xác ở giữa, nhưng kém ở hai đầu.
Đáng chú ý, trong hơn một nửa số ca cấp cứu thực sự, ChatGPT chỉ khuyến nghị theo dõi thêm 24–48 giờ thay vì đi cấp cứu ngay. Nhiều trường hợp liên quan đến cơn hen suyễn cấp tính hoặc nhiễm toan ceton do tiểu đường, những tình trạng có thể đe dọa tính mạng nếu không được xử lý kịp thời.
Ngoài ra, ChatGPT cũng gặp khó khăn trong việc nhận diện nguy cơ tự tử. Trong 14 tình huống có dấu hiệu ý định tự gây hại, hệ thống chỉ kích hoạt cảnh báo hỗ trợ khủng hoảng ở 4 trường hợp.
Ở chiều ngược lại, với các tình huống không khẩn cấp, ChatGPT lại thường làm quá, khuyến nghị người dùng đi khám dù không cần thiết. Điều này có thể gây lo lắng không cần thiết và tạo thêm áp lực cho hệ thống y tế.
Tiến sĩ Girish N. Nadkarni, tác giả chính của nghiên cứu, cho biết ChatGPT xử lý tương đối tốt các ca cấp cứu điển hình như đột quỵ hoặc phản vệ nặng, nhưng gặp khó khăn ở những tình huống phức tạp, nơi cần phán đoán lâm sàng và kinh nghiệm thực tế.
Nhóm nghiên cứu nhấn mạnh rằng các công cụ AI như ChatGPT có thể hữu ích trong việc cung cấp thông tin tổng quát, nhưng không nên được sử dụng thay thế tư vấn y tế chuyên môn. Trong các tình huống khẩn cấp hoặc triệu chứng nghiêm trọng, việc tìm đến cơ sở y tế vẫn là lựa chọn an toàn nhất.
Cảnh báo mới cho hàng triệu người dùng iPhone
(PLO)- Các chuyên gia bảo mật vừa phát hiện một bộ công cụ khai thác mới có tên là Coruna, được thiết kế để tấn công các mẫu iPhone chạy iOS từ phiên bản 13 đến 17.2.1.