Cờ vây là môn cờ phổ biến ở các nước Đông Á có lịch sử hàng ngàn năm. Người chơi đặt những con cờ trắng đen trên bàn cờ 19x19 để loại bỏ đối thủ theo những chiến thuật phức tạp. Do đó, đây là môn cờ khó chơi với máy tính hơn hẳn cờ vua.
Phần mềm AlphaGo do DeepMind chế tạo đã đánh thắng người 3 lần vô địch cờ vây châu Âu Fan Hui với tỉ số tuyệt đối 5-0 tại trung tâm công ty. Theo người xem, đây là một trải nghiệm "lạnh người" khi thấy con người bị đánh bại không thương tiếc.
Đây là chiến thắng đầu tiên của máy tính trước con người trong môn cờ vây. Vào năm 2014, Rémi Coulom, người phá triển môn cờ vây trí tuệ nhân tạo Crazy Stone còn dự đoán rằng phải mất 10 năm nữa máy tính mới có thể thắng được những kỳ thủ hàng đầu của cờ vây.
AlphaGo được phát triển khác với những phần mềm trước. Dựa trên những công nghệ trí thông minh nhân tạo dành cho nhiều công việc khác, ví dụ như hệ thống học chơi game cổ điển, AlphaGo dùng hệ thống được gọi là "Deep Learning" để xây dựng "kiến thức" về trò chơi. Và nó có khả năng chọn lựa những nước đi có khả năng chiến thắng cao nhất.
Khi "dạy" máy tính chơi game, cách đơn giản nhất là xếp loại những khả năng có thể diễn ra nhất trong trò chơi, từ xấu đến tốt nhất, và chọn cách phản ứng tốt nhất. Chiến lược này có tác dụng với nhiều trò chơi, nhất là khi máy tính đã trải nghiệm được mọi phương án. Nhưng với trò phức tạp như cờ vua, điều này không có tác dụng, nên phải mất nhiều năm IBM mới có thể xây dựng nên Deep Blue.
Cờ vây còn phức tạp hơn với rất nhiều quy tắc và luật lệ, nhiều nước chơi gấp 3 lần cờ vua. Với nhiều kỳ thủ cờ vây, rất khó nhìn bàn cờ để tính toán một cách khoa học xem ai sẽ thắng. Cờ vây không có "quân cờ chủ" sẽ xác định người thắng khi cờ bị bắt như cờ vua, và cũng không có phương pháp toán học đơn giản nào để xem ai có khả năng chiếm lợi thế cho đến khi bàn cờ đi vào những nước cuối.
AlphaGo chơi cờ vây bằng chính khả năng tưởng tượng của nó. Chương trình này bao gồm 2 mạng thần kinh, phần mềm mô phỏng hệ thống thần kinh não bộ của con người để tổng hợp các quyết định đơn giản rồi đưa ra những lựa chọn phức tạp nhất.
Một là mạng quy tắc được huấn luyện bằng cách xem hàng triệu ván cờ vây. Với những trải nghiệm này, nó xây dựng mẫu tiên đoán để dự đoán nước đi tiếp theo của đối thủ, dựa trên hiểu biết về các vị trí và những nước đi trước của cá nhân người chơi. Hệ thống này được hỗ trợ bằng mạng thần kinh "củng cố", có thể phản đối ngược lại chính nó, học hỏi từ những chiến thắng và thất bại trước, lọc ra những nước đi tốt nhất. Mạng này được huấn luyện tiên toán người thắng cuộc bằng cách xem xét nhiều ván cờ khác nhau.
AlphaGo là bước đầu để DeepMaind xây dựng hệ thống trí thông minh nhân tạo cho nhiều công việc thực tế như chẩn đoán y khoa và dự đoán khí hậu. Hiện tại, công ty này đang hướng đến mục tiêu đánh bại kỳ thủ cờ vây vô địch thế giới Lee Se-dol.