AI đánh bại con người ở trò chơi Diplomacy

Oct 2

Mới đây nhất, nhóm các nhà nghiên cứu tại Meta đã thử nghiệm thành công Cicero, một phần mềm trí tuệ nhân tạo có khả năng đánh bại con người trong Diplomacy - trò chơi mô phỏng cuộc tranh đấu quyền lực giữa 7 cường quốc Châu Âu trước thềm Thế Chiến I (được coi là một trong những trò boardgame ưa thích của các chính khách nổi tiếng như Tổng thống J.F. Kennedy, Henry Kissinger, v.v.)

Lấy bối cảnh châu Âu năm 1901, Diplomacy mô phỏng cuộc tranh đấu quyền lực ở châu Âu giữa 7 cường quốc: Anh, Pháp, Nga, Đức, Áo, Ý và Thổ Nhĩ Kỳ. Để giành chiến thắng tuyệt đối, người chơi phải điều khiển các quân đoàn và hạm đội của mình để chiếm được 18 trên tổng số 34 “vùng hậu cần” (supply center).

Điểm đặc biệt của Diplomacy là luật được thiết kế để không ai có thể một mình giành chiến thắng mà không có sự hỗ trợ của ít nhất một đồng minh khác. Trò chơi không sử dụng xúc xắc nên không có yếu tố may rủi hay bất định tác động đến kết quả. Vì vậy, người chơi chỉ có một cách duy nhất để đánh bại các đối thủ của mình là vận dụng những kỹ năng ngoại giao như: phân tích tình huống, hoạch định chiến lược, đàm phán, v.v. Mục tiêu của người chơi là đánh giá đúng ý đồ của cả các “đối tác” lẫn “đối tượng”, xây dựng và duy trì các liên minh bền vững với đồng minh, và đồng thời ly gián những liên quân tiềm năng chống lại mình.

Tuy nhiên, khác với những bộ môn như cờ vua, cờ vây (chơi theo lượt), sau khi đàm phán xong, cả 7 người chơi Diplomacy sẽ ra lệnh cùng một lúc và các mệnh lệnh sẽ được thực thi đồng thời. Quá trình “khớp lệnh” khi đó mới làm bộc lộ những người chơi thực hiện đúng cam kết đã đề ra trong lúc đàm phán và những người chơi “nói một đường, làm một nẻo”. Lòng tin là một thứ gì đấy rất xa xỉ trong Diplomacy. Cũng chính vì thế mà gây dựng lòng tin với đồng minh và biết phản bội đúng người đúng thời điểm gần như là một phần tất yếu để giành chiến thắng tuyệt đối trong trò chơi này.

Diplomacy được cho là đặt ra một bài toán hóc búa cho các nhà nghiên cứu trí tuệ nhân tạo (AI) trong suốt hơn 50 năm qua. Sự khác biệt giữa Diplomacy và các trò đấu tay đôi kinh điển như cờ vua hay cờ vây nằm ở hai điểm chính: (1) trong Diplomacy bạn phải thi đấu với 6 đối thủ thay vì 1 đối thủ và (2) giao tiếp bằng ngôn ngữ là một phần của trò chơi.

Do đó, để AI có thể đánh bại con người ở trò chơi này, nó phải có cả khả năng tư duy chiến lược (strategic reasoning) để nhận biết đối tác/đối tượng và các tình thế thuận lợi/nguy hiểm, lẫn khả năng giao tiếp sử dụng ngôn ngữ của con người (natural language). Cũng chính vì sự “bất tương xứng về thông tin” (một bên luôn có những thông tin mà bên kia không có) là một phần của trò chơi nên AI phải biết lúc nào nên chia sẻ ít, lúc nào nên chia sẻ nhiều, lúc nào cần thành thật, lúc nào cần gian trá.

Đây là điều khiến phần mềm AI mang tên Cicero do nhóm các nhà nghiên cứu của Meta phát triển thật sự ấn tượng. Sau tổng cộng 72 giờ thi đấu với hơn 80 người chơi qua 40 ván Diplomacy khác nhau, Cicero đã lọt vào top 10% những người chơi tốt nhất. Đây là một thành tích quá ấn tượng đối với bất kỳ người chơi Diplomacy nào. Nhưng ấn tượng hơn cả là việc Cicero đã đánh giá tương đối chính xác ý đồ của những người chơi khác, giao tiếp thành thục và không để lộ danh phận AI của mình. Hơn hết, Cicero không bị ảnh hưởng bởi những thiên kiến cố hữu trong tâm lý con người và không ra quyết định dựa trên cảm xúc. Mọi quyết định mà AI đưa ra thuần tuý dựa trên phán đoán của nó về lợi ích mà một nước đi có thể mang lại. Trên đường dài, điều đó khiến cho AI mắc ít sai lầm hơn con người.

Điều này có hàm ý gì cho chúng ta? Phải chăng các nhà ngoại giao tương lai sẽ phải trang bị AI như các trợ lý cá nhân để giành lợi thế trong các cuộc đàm phán? Và chúng ta phải làm gì nếu như AI cứ từng bước khéo léo chiếm lĩnhthế giới mà vẫn khiến ta phải cảm mến nó?

- - -

Đọc thêm: What If the Robots Were Very Nice While They Took Over the World?

scholicymaker .

AI đánh bại con người ở trò chơi Diplomacy

Cà phê mỗi ngày

Scholicymaker