Trí tuệ nhân tạo

AlphaGeometry2: Trí tuệ nhân tạo vượt qua các nhà vô địch Olympic toán học về hình học

mm

Trí tuệ nhân tạo đã lâu được cố gắng để bắt chước lý luận logic giống con người. Mặc dù nó đã đạt được tiến bộ lớn trong việc nhận dạng mẫu, nhưng lý luận trừu tượng và suy luận biểu tượng vẫn còn là những thách thức khó khăn cho trí tuệ nhân tạo. Giới hạn này trở nên đặc biệt rõ ràng khi trí tuệ nhân tạo được sử dụng để giải quyết các vấn đề toán học, một lĩnh vực đã lâu được coi là một bằng chứng về khả năng nhận thức của con người như tư duy logic, sáng tạo và hiểu biết sâu sắc. Không giống như các nhánh toán học khác dựa trên công thức và thao tác đại số, hình học khác. Nó đòi hỏi không chỉ tư duy logic có cấu trúc, từng bước mà còn khả năng nhận ra mối quan hệ ẩn và kỹ năng xây dựng các yếu tố phụ để giải quyết vấn đề.

Trong một thời gian dài, những khả năng này được cho là duy nhất của con người. Tuy nhiên, Google DeepMind đã làm việc trên việc phát triển trí tuệ nhân tạo có thể giải quyết các nhiệm vụ lý luận phức tạp này. Năm ngoái, họ đã giới thiệu AlphaGeometry, một hệ thống trí tuệ nhân tạo kết hợp sức mạnh dự đoán của mạng nơ-ron với logic cấu trúc của lý luận biểu tượng để giải quyết các vấn đề hình học phức tạp. Hệ thống này đã tạo ra một tác động đáng kể bằng cách giải quyết 54% các vấn đề hình học của Kỳ thi toán học Olympic quốc tế (IMO) để đạt được hiệu suất tương đương với những người giành huy chương bạc. Gần đây, họ đã đưa nó lên một tầm cao mới với AlphaGeometry2, đạt được tỷ lệ giải quyết 84% để vượt qua hiệu suất của một nhà vô địch Olympic toán học trung bình.

Trong bài viết này, chúng ta sẽ khám phá các đổi mới chính giúp AlphaGeometry2 đạt được mức hiệu suất này và ý nghĩa của sự phát triển này đối với tương lai của trí tuệ nhân tạo trong việc giải quyết các vấn đề lý luận phức tạp. Nhưng trước khi đi sâu vào những gì làm cho AlphaGeometry2 đặc biệt, điều quan trọng là phải hiểu AlphaGeometry là gì và nó hoạt động như thế nào.

AlphaGeometry: Tiên phong trong việc giải quyết vấn đề hình học bằng trí tuệ nhân tạo

AlphaGeometry là một hệ thống trí tuệ nhân tạo được thiết kế để giải quyết các vấn đề hình học phức tạp ở mức của IMO. Về cơ bản, nó là một hệ thống thần kinh-ký hiệu kết hợp mô hình ngôn ngữ thần kinh với động cơ suy luận biểu tượng. Mô hình ngôn ngữ thần kinh giúp hệ thống dự đoán các cấu trúc hình học mới, trong khi trí tuệ nhân tạo biểu tượng áp dụng logic hình thức để tạo ra bằng chứng. Thiết lập này cho phép AlphaGeometry suy nghĩ giống như con người bằng cách kết hợp khả năng nhận dạng mẫu của mạng nơ-ron, mô phỏng tư duy trực giác của con người, với tư duy logic có cấu trúc của logic hình thức, bắt chước khả năng suy luận diễn dịch của con người. Một trong những đổi mới chính của AlphaGeometry là cách nó tạo ra dữ liệu đào tạo. Thay vì dựa vào các bản demo của con người, nó tạo ra một tỷ biểu đồ hình học ngẫu nhiên và suy luận hệ thống các mối quan hệ giữa điểm và đường. Quá trình này tạo ra một tập dữ liệu lớn gồm 100 triệu ví dụ độc đáo, giúp mô hình thần kinh dự đoán các cấu trúc hình học chức năng và hướng dẫn động cơ biểu tượng đến các giải pháp chính xác. Phương pháp này cho phép AlphaGeometry giải quyết 25 trong số 30 vấn đề hình học của Kỳ thi Olympic toán học trong thời gian thi đấu tiêu chuẩn, gần giống với hiệu suất của các đối thủ con người hàng đầu.

Làm thế nào AlphaGeometry2 đạt được hiệu suất cải tiến

Mặc dù AlphaGeometry là một bước đột phá trong lý luận toán học do trí tuệ nhân tạo, nó vẫn có một số hạn chế. Nó gặp khó khăn trong việc giải quyết các vấn đề phức tạp, thiếu hiệu quả trong việc xử lý nhiều thách thức hình học và có hạn chế trong phạm vi vấn đề. Để vượt qua những chướng ngại vật này, AlphaGeometry2 giới thiệu một loạt các cải tiến đáng kể:

  1. Mở rộng khả năng của trí tuệ nhân tạo để hiểu các vấn đề hình học phức tạp hơn

Một trong những cải tiến quan trọng nhất của AlphaGeometry2 là khả năng làm việc với một phạm vi rộng hơn của các vấn đề hình học. AlphaGeometry trước đây gặp khó khăn với các vấn đề liên quan đến phương trình tuyến tính của góc, tỷ lệ và khoảng cách, cũng như những vấn đề yêu cầu suy luận về điểm, đường và vòng tròn di chuyển. AlphaGeometry2 vượt qua những hạn chế này bằng cách giới thiệu một mô hình ngôn ngữ tiên tiến hơn, cho phép nó mô tả và phân tích các vấn đề phức tạp này. Kết quả là, nó có thể giải quyết 88% tất cả các vấn đề hình học của IMO trong hai thập kỷ qua, một sự tăng đáng kể so với 66% trước đó.

  1. Một động cơ giải quyết vấn đề nhanh hơn và hiệu quả hơn

Một lý do quan trọng khác AlphaGeometry2 hoạt động tốt như vậy là động cơ biểu tượng được cải tiến của nó. Động cơ này, đóng vai trò là lõi logic của hệ thống này, đã được nâng cấp theo nhiều cách. Đầu tiên, nó được cải tiến để làm việc với một tập hợp các quy tắc giải quyết vấn đề tinh chỉnh hơn, khiến nó hiệu quả và nhanh hơn. Thứ hai, nó có thể nhận ra khi các cấu trúc hình học khác nhau đại diện cho cùng một điểm trong một vấn đề, cho phép nó suy luận linh hoạt hơn. Cuối cùng, động cơ đã được viết lại bằng C++ thay vì Python, khiến nó nhanh hơn 300 lần so với trước. Sự tăng tốc này cho phép AlphaGeometry2 tạo ra các giải pháp nhanh hơn và hiệu quả hơn.

  1. Đào tạo trí tuệ nhân tạo với các vấn đề hình học phức tạp và đa dạng hơn

Hiệu quả của mô hình thần kinh AlphaGeometry2 đến từ việc đào tạo rộng rãi trong các vấn đề hình học tổng hợp. AlphaGeometry ban đầu tạo ra một tỷ biểu đồ hình học ngẫu nhiên để tạo ra 100 triệu ví dụ đào tạo độc đáo. AlphaGeometry2 đưa điều này lên một tầm cao mới bằng cách tạo ra các biểu đồ rộng rãi và phức tạp hơn, bao gồm các mối quan hệ hình học tinh vi. Ngoài ra, nó hiện kết hợp các vấn đề đòi hỏi phải giới thiệu các cấu trúc phụ trợ – các điểm hoặc đường mới được định nghĩa để giúp giải quyết vấn đề, cho phép nó dự đoán và tạo ra các giải pháp tinh vi hơn.

  1. Tìm đường dẫn tốt nhất đến giải pháp với các chiến lược tìm kiếm thông minh hơn

Một đổi mới quan trọng của AlphaGeometry2 là phương pháp tìm kiếm mới, được gọi là Bộ sưu tập kiến thức chia sẻ của các cây tìm kiếm (SKEST). Không giống như người tiền nhiệm của nó, dựa vào một phương pháp tìm kiếm cơ bản, AlphaGeometry2 chạy nhiều tìm kiếm song song, với mỗi tìm kiếm học hỏi từ những tìm kiếm khác. Kỹ thuật này cho phép nó khám phá một phạm vi rộng hơn của các giải pháp có thể và cải thiện đáng kể khả năng của trí tuệ nhân tạo để giải quyết các vấn đề phức tạp trong thời gian ngắn hơn.

  1. Học hỏi từ một mô hình ngôn ngữ tiên tiến hơn

Một yếu tố quan trọng khác đằng sau thành công của AlphaGeometry2 là việc áp dụng mô hình Gemini của Google, một mô hình trí tuệ nhân tạo tiên tiến đã được đào tạo trên một tập hợp toán học rộng lớn và đa dạng hơn. Mô hình ngôn ngữ mới này cải thiện khả năng của AlphaGeometry2 trong việc tạo ra các giải pháp từng bước do sự suy luận chuỗi tư duy được cải tiến. Bây giờ, AlphaGeometry2 có thể tiếp cận các vấn đề theo một cách có cấu trúc hơn. Bằng cách tinh chỉnh dự đoán và học hỏi từ các loại vấn đề khác nhau, hệ thống này hiện có thể giải quyết một tỷ lệ lớn hơn đáng kể các câu hỏi hình học cấp Olympic.

Đạt được kết quả vượt qua các nhà vô địch Olympic toán học

Cảm ơn những tiến bộ trên, AlphaGeometry2 giải quyết 42 trong số 50 vấn đề hình học của IMO từ năm 2000-2024, đạt được tỷ lệ thành công 84%. Những kết quả này vượt qua hiệu suất của một nhà vô địch Olympic toán học trung bình và thiết lập một tiêu chuẩn mới cho lý luận toán học do trí tuệ nhân tạo. Ngoài hiệu suất ấn tượng của nó, AlphaGeometry2 cũng đang tạo ra những bước tiến trong việc tự động hóa chứng minh định lý, đưa chúng ta đến gần hơn với các hệ thống trí tuệ nhân tạo không chỉ giải quyết vấn đề hình học mà còn giải thích lý do của chúng theo cách con người có thể hiểu

Tương lai của trí tuệ nhân tạo trong lý luận toán học

Sự tiến bộ từ AlphaGeometry đến AlphaGeometry2 cho thấy trí tuệ nhân tạo đang trở nên tốt hơn trong việc xử lý các vấn đề toán học phức tạp đòi hỏi tư duy sâu sắc, logic và chiến lược. Nó cũng cho thấy rằng trí tuệ nhân tạo không chỉ là về việc nhận dạng mẫu – nó có thể suy luận, tạo ra mối quan hệ và giải quyết vấn đề theo cách cảm giác giống như lý luận logic của con người.

AlphaGeometry2 cũng cho chúng ta thấy những gì trí tuệ nhân tạo có thể làm được trong tương lai. Thay vì chỉ thực hiện theo hướng dẫn, trí tuệ nhân tạo có thể bắt đầu khám phá các ý tưởng toán học mới và thậm chí giúp nghiên cứu khoa học. Bằng cách kết hợp mạng nơ-ron với lý luận logic, trí tuệ nhân tạo có thể không chỉ là một công cụ tự động hóa các nhiệm vụ đơn giản mà còn là một đối tác đủ điều kiện giúp mở rộng kiến thức của con người trong các lĩnh vực dựa trên tư duy phản biện.

Chúng ta có thể đang bước vào một kỷ nguyên mà trí tuệ nhân tạo chứng minh định lý và tạo ra những khám phá mới trong vật lý, kỹ thuật và sinh học? Khi trí tuệ nhân tạo chuyển từ tính toán cưỡng bức sang giải quyết vấn đề suy nghĩ hơn, chúng ta có thể đang ở trên ngưỡng của một tương lai nơi con người và trí tuệ nhân tạo làm việc cùng nhau để khám phá những ý tưởng mà chúng ta chưa bao giờ nghĩ đến.

Tiến sĩ Tehseen Zia là Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, nắm giữ bằng Tiến sĩ về Trí tuệ Nhân tạo từ Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ Nhân tạo, Học máy, Khoa học Dữ liệu và Thị giác Máy tính, ông đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã dẫn dắt các dự án công nghiệp khác nhau với tư cách là Điều tra viên Chính và từng là Tư vấn viên Trí tuệ Nhân tạo.