Connect with us

Cảm giác trực giác mới của Trí tuệ nhân tạo: Tại sao việc suy nghĩ thông minh hơn quan trọng hơn việc suy nghĩ lâu hơn

Trí tuệ nhân tạo

Cảm giác trực giác mới của Trí tuệ nhân tạo: Tại sao việc suy nghĩ thông minh hơn quan trọng hơn việc suy nghĩ lâu hơn

mm

Những tiến bộ trong lĩnh vực trí tuệ nhân tạo (AI) đã được thúc đẩy trong thời gian dài bởi niềm tin rằng việc tăng dữ liệu và sức mạnh tính toán có thể cải thiện hiệu suất. Cách tiếp cận “lực lượng thô” này đã dẫn đến các hệ thống AI ấn tượng, chẳng hạn như GPT-3, đã hoạt động đáng kinh ngạc trong những năm qua. Tuy nhiên, mô hình này đang đạt đến giới hạn của nó. Khi các vấn đề AI trở nên phức tạp hơn, rõ ràng là việc chỉ thêm nhiều sức mạnh xử lý hơn sẽ không phải là một giải pháp bền vững hoặc hiệu quả cho tiến bộ lâu dài. Sự nhận thức này đã thúc đẩy các nhà nghiên cứu phải suy nghĩ lại cách tiếp cận của họ đối với việc phát triển AI. Trong bối cảnh này, mô hình Cogito v2 của Deep Cogito giới thiệu một cách tiếp cận mới có thể thay đổi tương lai của việc phát triển AI. Thay vì dựa vào nhiều sức mạnh xử lý hơn hoặc kéo dài quá trình suy luận, Cogito v2 phát triển những “cảm giác trực giác” nội bộ giúp mô hình xác định đúng đường đi trước khi thậm chí bắt đầu tìm kiếm. Đây là một sự thay đổi mô hình trong cách AI đang được phát triển bằng cách tập trung vào việc suy nghĩ tốt hơn, không phải suy nghĩ lâu hơn.

Sự thay đổi trong phát triển AI

Trong nhiều năm, động lực chính đằng sau sự tiến bộ của AI là ý tưởng rằng “nhiều hơn là tốt hơn.” Cách tiếp cận này đã dẫn đến các mô hình AI tạo ra các chuỗi suy luận rộng lớn để giải quyết các vấn đề phức tạp. Các mô hình của OpenAI, chẳng hạn như GPT-3, là một ví dụ về cách tiếp cận này, nơi các chuỗi suy luận dài hơn đã dẫn đến kết quả ấn tượng trên các nhiệm vụ khó khăn. Mặc dù phương pháp này đã tạo ra kết quả ấn tượng, nhưng nó đi kèm với những hạn chế đáng kể. Các chuỗi suy luận dài hơn đòi hỏi nhiều tài nguyên tính toán hơn, dẫn đến thời gian suy luận chậm hơn và chi phí hoạt động cao hơn. Hơn nữa, nghiên cứu đã chỉ ra rằng những quá trình kéo dài này thường dẫn đến sự giảm hiệu suất, nơi suy luận dài hơn dẫn đến sự thiên vị lớn hơn và hiệu quả thấp hơn. Vấn đề cơ bản là việc dựa vào các chuỗi suy luận dài và tăng sức mạnh tính toán không còn là một giải pháp hiệu quả cho việc giải quyết các vấn đề AI phức tạp. Những cách tiếp cận này bị giới hạn bởi thời gian xử lý và yêu cầu bộ nhớ khổng lồ của chúng.

Tại sao ‘cảm giác trực giác’ quan trọng với AI

Không giống như các hệ thống AI hiện tại phụ thuộc vào suy luận kéo dài, con người thường dựa vào những gì được gọi là “cảm giác trực giác” (một hình thức phán đoán trực giác nhanh) để giải quyết vấn đề. Mặc dù cảm giác trực giác có thể giống như một khái niệm trừu tượng, nhưng nó thường là kết quả của nhiều năm kinh nghiệm, học tập và xử lý ngữ cảnh cho phép con người đưa ra quyết định nhanh chóng mà không cần phân tích đầy đủ mọi chi tiết. Chính loại trực giác này phân biệt giữa tính toán thô và suy luận giống con người. Con người xây dựng ‘cảm giác trực giác’ này thông qua việc nhận dạng mẫu và tích lũy kinh nghiệm, và nó cho phép chúng ta đưa ra quyết định mà không cần khám phá mọi tùy chọn có thể. “Cảm giác trực giác” mới của AI nhằm mục đích sao chép quá trình này.

Ý tưởng này, cũng được gọi là “trước kiến thức thông minh”, có thể là chìa khóa để trao quyền cho các hệ thống AI với suy luận giống con người và làm cho chúng hiệu quả hơn. Các mô hình AI với trước kiến thức thông minh mạnh có thể dự đoán những giải pháp nào có khả năng thành công mà không cần phải thực hiện tính toán rộng lớn. Thay vì dựa vào các phương pháp tìm kiếm rộng lớn, cảm giác trực giác cho phép các hệ thống AI tận dụng kiến thức trước đó, tập trung vào các đường dẫn hiệu quả nhất đến giải pháp.

Làm thế nào Cogito v2 tích hợp ‘cảm giác trực giác’

Cogito đã tích hợp ý tưởng về ‘cảm giác trực giác’ (còn được gọi là trước kiến thức thông minh) vào mô hình mới nhất của nó, Cogito v2. Họ tích hợp ý tưởng này bằng cách sử dụng một cơ chế gọi là Lặp lại và Tinh chỉnh (IDA). Cơ chế này cho phép mô hình học hỏi từ quá trình suy luận của chính nó và tinh chỉnh kỹ năng giải quyết vấn đề của nó theo thời gian. Thay vì dựa vào các lời nhắc tĩnh hoặc giáo viên cố định, IDA cho phép AI tinh chỉnh các đường suy luận thành công trở lại vào các tham số cốt lõi của mô hình. Quá trình tự cải thiện này tinh chỉnh khả năng suy luận của mô hình theo thời gian, tối ưu hóa không chỉ cho câu trả lời chính xác, mà còn cho các phương pháp suy nghĩ hiệu quả nhất.

  • Lặp lại và Tinh chỉnh (IDA)

Để hiểu cách IDA hoạt động, chúng ta có thể xem xét lý thuyết quá trình kép, chia suy nghĩ của con người thành hai hệ thống: Hệ thống 1 và Hệ thống 2. Hệ thống 1 đề cập đến việc ra quyết định trực giác nhanh, trong khi Hệ thống 2 chậm hơn, với suy luận có chủ đích hơn. Lý thuyết cho rằng con người dựa vào Hệ thống 1 cho hầu hết các nhiệm vụ nhưng chuyển sang Hệ thống 2 khi đối mặt với các quyết định phức tạp hơn.
IDA là một chu kỳ hai bước: khuếch đại và tinh chỉnh. Trong giai đoạn khuếch đại, mô hình sử dụng các phương pháp tính toán rộng lớn để tạo ra các giải pháp hoặc dấu vết suy luận chất lượng cao. Đây giống như suy nghĩ Hệ thống 2, nơi AI dành thời gian để đánh giá cẩn thận các giải pháp tiềm năng. Trong giai đoạn tinh chỉnh, mô hình sau đó nội hóa những hiểu biết từ giai đoạn khuếch đại, biến quá trình suy luận từ Hệ thống 2 thành Hệ thống 1. Giống như một lái xe trở nên trực giác hơn sau khi tích lũy kinh nghiệm, một mô hình AI với IDA có thể đưa ra quyết định nhanh hơn, hiệu quả hơn theo thời gian.
Ý tưởng chính đằng sau IDA là sử dụng suy luận tính toán rộng lớn trong giai đoạn khuếch đại, sau đó tinh chỉnh suy luận nâng cao trở lại vào các tham số của mô hình. Quá trình này cho phép mô hình nội hóa các chiến lược suy luận hiệu quả, xây dựng khả năng suy nghĩ trực giác khi giải quyết vấn đề. Bằng cách lặp lại chu kỳ này, hệ thống AI liên tục cải thiện khả năng đưa ra quyết định với ít tài nguyên tính toán hơn.

Ưu điểm của việc tích hợp ‘cảm giác trực giác’ vào AI

Một trong những ưu điểm chính của cảm giác trực giác AI là hiệu quả của nó. Các mô hình như Cogito v2 chứng minh các chuỗi suy luận ngắn hơn tới 60% so với các mô hình cạnh tranh. Điều này có nghĩa là chúng có thể đến với câu trả lời bằng ít bước nội bộ hơn, giảm thời gian và tài nguyên cần thiết cho suy luận. Ví dụ, một vấn đề có thể mất DeepSeek R1 hơn 200 token để giải quyết có thể được Cogito v2 hoàn thành trong ít hơn 100 token.
Hơn nữa, chi phí đào tạo Cogito v2 thấp hơn đáng kể so với các mô hình AI truyền thống. Toàn bộ quá trình đào tạo cho Cogito v2, bao gồm một loạt các tham số, có chi phí dưới 3,5 triệu đô la, thấp hơn nhiều so với chi phí thường liên quan đến các mô hình lớn như GPT-4.
Cogito v2 cũng đã chứng minh các khả năng mới nổi trong các lĩnh vực mà nó không được đào tạo rõ ràng. Ví dụ, mặc dù được đào tạo chủ yếu trên văn bản, Cogito v2 có thể suy luận về hình ảnh, rút ra những hiểu biết về thành phần và môi trường của hình ảnh. Khả năng suy luận xuyên mô hình này là một bước tiến quan trọng hướng tới trí tuệ tổng quát, một cột mốc quan trọng trên con đường đến Trí tuệ nhân tạo tổng quát (AGI).

Suy nghĩ lại về việc phát triển AI

Sự thành công của trước kiến thức thông minh cho thấy rằng các chiến lược phát triển AI cần một sự thay đổi cơ bản. Thay vì chỉ tăng kích thước mô hình hoặc tăng tài nguyên tính toán, việc phát triển AI nên tập trung vào xây dựng các hệ thống có thể phát triển và tinh chỉnh các chiến lược nhận thức của riêng chúng. Sự thay đổi này phản ánh sự phát triển nhận thức của con người, nơi trí tuệ không phải là kết quả của một bộ não lớn hơn hoặc thời gian suy nghĩ nhiều hơn, mà là các mô hình và chiến lược suy luận tốt hơn. Sự thay đổi này có thể có những ý nghĩa lâu dài. Bằng cách nhấn mạnh suy nghĩ thông minh hơn sức mạnh tính toán thô, AI có thể trở nên đa năng, thích nghi và có khả năng xử lý các thách thức mới. Sự thay đổi này có thể tăng tốc ứng dụng của AI trong các ngành như chăm sóc sức khỏe, an ninh mạng và giao thông tự động, khiến các hệ thống AI trở nên hiệu quả, tiết kiệm chi phí và có tác động hơn.

Kết luận

Sự thành công của Cogito v2 chứng minh rằng tương lai của AI nằm không ở việc tăng kích thước mô hình hoặc tăng sức mạnh tính toán, mà ở việc tinh chỉnh kiến trúc suy luận và tối ưu hóa cho việc giải quyết vấn đề thông minh hơn. Sự thay đổi này hứa hẹn một tương lai bền vững và dễ tiếp cận hơn cho AI, nơi các hệ thống có thể liên tục cải thiện và thích nghi với ít phụ thuộc vào tài nguyên tính toán rộng lớn. Bằng cách tập trung vào suy luận thông minh hơn tính toán thô, AI có thể trở nên có khả năng giải quyết các vấn đề phức tạp, thực tế hơn.

Tiến sĩ Tehseen Zia là Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, nắm giữ bằng Tiến sĩ về Trí tuệ Nhân tạo từ Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ Nhân tạo, Học máy, Khoa học Dữ liệu và Thị giác Máy tính, ông đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã dẫn dắt các dự án công nghiệp khác nhau với tư cách là Điều tra viên Chính và từng là Tư vấn viên Trí tuệ Nhân tạo.