sơ khai AlphaGeometry: AI của DeepMind làm chủ các vấn đề hình học ở cấp độ Olympic - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

AlphaGeometry: AI của DeepMind làm chủ các vấn đề hình học ở cấp độ Olympic

mm
cập nhật on

Trong bối cảnh trí tuệ nhân tạo không ngừng phát triển, việc chinh phục khả năng nhận thức là một hành trình hấp dẫn. Toán học, với những mô hình phức tạp và cách giải quyết vấn đề sáng tạo, là minh chứng cho trí thông minh của con người. Trong khi những tiến bộ gần đây trong mô hình ngôn ngữ đã xuất sắc trong việc giải các bài toán đố, lĩnh vực hình học đã đặt ra một thách thức đặc biệt. Việc mô tả các sắc thái trực quan và biểu tượng của hình học bằng từ ngữ sẽ tạo ra khoảng trống trong dữ liệu đào tạo, hạn chế khả năng học cách giải quyết vấn đề hiệu quả của AI. Thử thách này đã thúc đẩy DeepMind, một công ty con của Google, giới thiệu AlphaHình học—một hệ thống AI đột phá được thiết kế để giải quyết các vấn đề hình học phức tạp.

Những hạn chế của AI tượng trưng trong hình học

Phương pháp tiếp cận AI phổ biến cho hình học phụ thuộc rất nhiều vào các quy tắc do con người tạo ra. Mặc dù hiệu quả đối với các vấn đề đơn giản, nhưng điều này AI biểu tượng gặp khó khăn về tính linh hoạt, đặc biệt khi phải đối mặt với các kịch bản hình học mới hoặc độc đáo. Việc không thể dự đoán các câu đố ẩn hoặc các điểm phụ quan trọng để chứng minh các bài toán hình học phức tạp làm nổi bật những hạn chế của việc chỉ dựa vào các quy tắc được xác định trước. Hơn nữa, việc tạo ra các quy tắc đầy đủ cho mọi tình huống có thể tưởng tượng được sẽ trở nên không thực tế khi các vấn đề ngày càng phức tạp, dẫn đến các vấn đề về phạm vi bao phủ và khả năng mở rộng bị hạn chế.

Phương pháp tiếp cận biểu tượng thần kinh của AlphaGeometry

AlphaGeometry của DeepMind kết hợp các mô hình ngôn ngữ lớn thần kinh (LLM) với AI biểu tượng để điều hướng thế giới hình học phức tạp. Cái này biểu tượng thần kinh Cách tiếp cận thừa nhận rằng việc giải các bài toán hình học đòi hỏi cả ứng dụng quy tắc và trực giác. LLM trao quyền cho hệ thống bằng khả năng trực quan để dự đoán các cấu trúc hình học mới, trong khi áp dụng AI biểu tượng Logic chính thức để tạo ra bằng chứng nghiêm ngặt.

Trong sự tương tác năng động này, LLM phân tích nhiều khả năng, dự đoán các cấu trúc quan trọng để giải quyết vấn đề. Những dự đoán này đóng vai trò là manh mối, hỗ trợ công cụ biểu tượng đưa ra các suy luận và tiến gần hơn đến giải pháp. Sự kết hợp sáng tạo này làm cho AlphaGeometry trở nên khác biệt, cho phép nó giải quyết các vấn đề hình học phức tạp ngoài các tình huống thông thường.

Cách tiếp cận biểu tượng thần kinh của AlphaGeometry phù hợp với lý thuyết quá trình kép, một khái niệm chia nhận thức của con người thành hai hệ thống — một hệ thống cung cấp những ý tưởng nhanh chóng, trực quan và hệ thống kia đưa ra quyết định có chủ ý, hợp lý hơn. LLM vượt trội trong việc xác định các mẫu chung nhưng thường thiếu lý luận chặt chẽ, trong khi các công cụ suy luận tượng trưng dựa trên các quy tắc rõ ràng nhưng có thể chậm và không linh hoạt. AlphaGeometry khai thác điểm mạnh của cả hai hệ thống, với LLM hướng dẫn công cụ suy luận tượng trưng hướng tới các giải pháp khả thi.

Đào tạo với dữ liệu tổng hợp

Để khắc phục tình trạng khan hiếm dữ liệu thực, các nhà nghiên cứu tại DeepMind đã đào tạo mô hình ngôn ngữ của AlphaGeometry bằng dữ liệu tổng hợp. Gần nửa tỷ sơ đồ hình học ngẫu nhiên đã được tạo ra và công cụ biểu tượng đã phân tích từng sơ đồ, đưa ra các tuyên bố về các đặc tính của nó. Những câu lệnh này sau đó được tổ chức thành 100 triệu điểm dữ liệu tổng hợp để huấn luyện mô hình ngôn ngữ. Quá trình đào tạo diễn ra theo hai bước: đào tạo trước mô hình ngôn ngữ trên tất cả dữ liệu tổng hợp được tạo và tinh chỉnh nó để dự đoán các manh mối hữu ích cần thiết để giải quyết vấn đề bằng cách sử dụng các quy tắc ký hiệu.

Hiệu suất cấp độ Olympic của AlphaGeometry

AlphaGeometry được kiểm tra dựa trên các tiêu chí được thiết lập bởi Olympic Toán học Quốc tế (IMO), một cuộc thi uy tín nổi tiếng với những tiêu chuẩn đặc biệt cao trong việc giải toán. Đạt thành tích đáng khen ngợi, AlphaGeometry thành công giải quyết được 25 trên 30 vấn đề trong thời gian quy định, thể hiện thành tích ngang bằng với vận động viên đạt huy chương vàng IMO. Đáng chú ý, hệ thống tiên tiến trước đây chỉ có thể giải quyết được 10 vấn đề. Tính giá trị của các giải pháp của AlphaGeometry còn được khẳng định thêm bởi huấn luyện viên đội IMO Hoa Kỳ, một giáo viên chấm điểm giàu kinh nghiệm, đề xuất điểm tối đa cho các giải pháp của AlphaGeometry.

Tác động của AlphaGeometry

Kỹ năng giải quyết vấn đề đáng chú ý của AlphaGeometry thể hiện một bước tiến đáng kể trong việc thu hẹp khoảng cách giữa tư duy của máy móc và con người. Ngoài khả năng thành thạo như một công cụ có giá trị cho giáo dục cá nhân hóa trong toán học, sự phát triển AI mới này còn có tiềm năng tác động đến nhiều lĩnh vực khác nhau. Ví dụ, trong thị giác máy tính, AlphaGeometry có thể nâng cao hiểu biết về hình ảnh, tăng cường khả năng phát hiện đối tượng và hiểu biết về không gian để thị giác máy chính xác hơn. Khả năng xử lý các cấu hình không gian phức tạp của AlphaGeometry có tiềm năng biến đổi các lĩnh vực như thiết kế kiến ​​trúc và quy hoạch kết cấu. Ngoài các ứng dụng thực tế, AlphaGeometry có thể hữu ích trong việc khám phá các lĩnh vực lý thuyết như vật lý. Với khả năng mô hình hóa các dạng hình học phức tạp, nó có thể đóng một vai trò then chốt trong việc làm sáng tỏ các lý thuyết phức tạp và khám phá những hiểu biết mới lạ trong lĩnh vực vật lý lý thuyết.

Hạn chế của AlphaGeometry

Mặc dù AlphaGeometry thể hiện những tiến bộ đáng chú ý về khả năng thực hiện suy luận và giải quyết các vấn đề toán học của AI nhưng nó vẫn gặp phải một số hạn chế nhất định. Sự phụ thuộc vào các công cụ biểu tượng để tạo ra dữ liệu tổng hợp đặt ra những thách thức về khả năng thích ứng của nó trong việc xử lý một loạt các kịch bản toán học và các lĩnh vực ứng dụng khác. Sự khan hiếm dữ liệu huấn luyện hình học đa dạng đặt ra những hạn chế trong việc giải quyết các suy luận phức tạp cần thiết cho các bài toán nâng cao. Sự phụ thuộc của nó vào một công cụ biểu tượng, được đặc trưng bởi các quy tắc nghiêm ngặt, có thể hạn chế tính linh hoạt, đặc biệt là trong các tình huống giải quyết vấn đề trừu tượng hoặc độc đáo. Vì vậy, dù thành thạo toán “sơ cấp” nhưng AlphaGeometry hiện lại tỏ ra kém cỏi khi phải đối mặt với những bài toán nâng cao ở trình độ đại học. Việc giải quyết những hạn chế này sẽ là mấu chốt để nâng cao khả năng ứng dụng của AlphaGeometry trên các lĩnh vực toán học đa dạng.

The Bottom Line

AlphaGeometry của DeepMind thể hiện bước nhảy vọt đột phá về khả năng của AI trong việc xử lý các vấn đề hình học phức tạp, thể hiện cách tiếp cận biểu tượng thần kinh kết hợp các mô hình ngôn ngữ lớn với AI biểu tượng truyền thống. Sự kết hợp sáng tạo này cho phép AlphaGeometry vượt trội trong việc giải quyết vấn đề, được chứng minh bằng thành tích ấn tượng tại Olympic Toán học Quốc tế. Tuy nhiên, hệ thống phải đối mặt với những thách thức như phụ thuộc vào các công cụ biểu tượng và sự khan hiếm dữ liệu đào tạo đa dạng, hạn chế khả năng thích ứng của nó với các kịch bản toán học nâng cao và các lĩnh vực ứng dụng ngoài toán học. Việc giải quyết những hạn chế này là rất quan trọng để AlphaGeometry phát huy hết tiềm năng của nó trong việc chuyển đổi cách giải quyết vấn đề trên nhiều lĩnh vực khác nhau và thu hẹp khoảng cách giữa tư duy của máy móc và con người.

Tiến sĩ Tehseen Zia là Phó Giáo sư chính thức tại Đại học COMSATS Islamabad, có bằng Tiến sĩ về AI tại Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ nhân tạo, Học máy, Khoa học dữ liệu và Thị giác máy tính, ông đã có những đóng góp đáng kể với các công bố trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã lãnh đạo nhiều dự án công nghiệp khác nhau với tư cách là Điều tra viên chính và là Nhà tư vấn AI.