Trí tuệ tổng hợp nhân tạo

GPT-4 có phải là bước nhảy vọt để đạt được AGI không?

cập nhật on 23 Tháng Tư, 2024

Microsoft gần đây đã phát hành một bài báo nghiên cứu có tiêu đề: Những tia sáng của trí tuệ nhân tạo tổng hợp: Những thử nghiệm ban đầu với GPT-4. Theo mô tả của Microsoft:

Tờ giấy này báo cáo về cuộc điều tra của chúng tôi về phiên bản đầu tiên của GPT-4, khi phiên bản này vẫn đang được OpenAI tích cực phát triển. Chúng tôi cho rằng (phiên bản đầu tiên này của) GPT-4 là một phần của nhóm LLM mới (chẳng hạn như ChatGPT và PaLM của Google) thể hiện trí thông minh chung hơn các mô hình AI trước đây.

Trong bài báo này, có bằng chứng thuyết phục chứng minh rằng GPT-4 vượt xa khả năng ghi nhớ và nó có sự hiểu biết sâu sắc và linh hoạt về các khái niệm, kỹ năng và lĩnh vực. Trên thực tế, khả năng khái quát hóa của nó vượt xa khả năng của bất kỳ người nào còn sống ngày nay.

Trong khi trước đây chúng ta đã thảo luận về lợi ích của AGI, chúng ta nên nhanh chóng tóm tắt sự đồng thuận chung về hệ thống AGI là gì. Về bản chất, AGI là một loại AI tiên tiến có thể khái quát hóa trên nhiều miền và không bị thu hẹp phạm vi. Ví dụ về AI hẹp bao gồm xe tự hành, chatbot, bot cờ vua hoặc bất kỳ AI nào khác được thiết kế cho một mục đích duy nhất.

Một AGI khi so sánh sẽ có thể luân phiên linh hoạt giữa bất kỳ lĩnh vực nào ở trên hoặc bất kỳ lĩnh vực chuyên môn nào khác. Đó là một AI sẽ tận dụng các thuật toán non trẻ như học chuyểnvà học tập tiến hóa, đồng thời khai thác các thuật toán kế thừa như học tập củng cố sâu.

Mô tả AGI ở trên phù hợp với trải nghiệm cá nhân của tôi khi sử dụng GPT-4, cũng như bằng chứng được chia sẻ trong tài liệu nghiên cứu do Microsoft phát hành.

Một trong những gợi ý được nêu trong bài báo là GPT-4 viết một bằng chứng về sự vô hạn của các số nguyên tố dưới dạng một bài thơ.

Nếu chúng ta phân tích các yêu cầu để tạo ra một bài thơ như vậy, chúng ta nhận thấy rằng nó đòi hỏi suy luận toán học, diễn đạt thơ và tạo ngôn ngữ tự nhiên. Đây là một thách thức vượt quá khả năng trung bình của hầu hết mọi người.

Bài báo muốn hiểu liệu GPT-4 có chỉ đơn giản là tạo ra nội dung dựa trên khả năng ghi nhớ chung thay vì hiểu ngữ cảnh và khả năng suy luận hay không. Khi được yêu cầu tạo lại một bài thơ theo phong cách Shakespeare, nó đã có thể làm được. Điều này đòi hỏi mức độ hiểu biết nhiều mặt vượt xa khả năng của người dân nói chung và bao gồm lý thuyết về trí tuệ và thiên tài toán học.

Làm thế nào để tính toán trí thông minh GPT-4?

Sau đó, câu hỏi trở thành làm thế nào chúng ta có thể đo lường trí thông minh của LLM? Và GPT-4 đang hiển thị các hành vi học tập thực sự hay chỉ ghi nhớ?

Cách kiểm tra hệ thống AI hiện tại là đánh giá hệ thống trên một tập hợp các bộ dữ liệu điểm chuẩn tiêu chuẩn và để đảm bảo rằng chúng độc lập với dữ liệu đào tạo và chúng bao gồm nhiều nhiệm vụ và lĩnh vực. Loại thử nghiệm này gần như không thể thực hiện được do số lượng dữ liệu gần như không giới hạn mà GPT-4 được đào tạo.

Bài viết thảo luận về việc tạo ra các nhiệm vụ/câu hỏi mới và khó chứng minh một cách thuyết phục rằng GPT-4 vượt xa khả năng ghi nhớ và nó có sự hiểu biết sâu sắc và linh hoạt về các khái niệm, kỹ năng và lĩnh vực.

Khi nói đến trí thông minh, GPT-4 có thể tạo ra các câu chuyện ngắn, kịch bản phim và nó có thể tính toán các công thức phức tạp nhất.

GPT-4 cũng có khả năng viết mã ở mức rất cao, cả về viết mã từ hướng dẫn và hiểu mã hiện có. GPT-4 có thể xử lý nhiều tác vụ viết mã khác nhau, từ
thách thức mã hóa đối với các ứng dụng trong thế giới thực, từ lắp ráp cấp thấp đến khung cấp cao, từ cấu trúc dữ liệu đơn giản đến các chương trình phức tạp như trò chơi. GPT-4 cũng có thể suy luận về việc thực thi mã, mô phỏng tác động của các lệnh và giải thích kết quả bằng ngôn ngữ tự nhiên. GPT-4 thậm chí có thể thực thi mã giả,

GPT-4 có thể đưa ra phản hồi hợp lý cho hầu hết mọi lời nhắc được đưa ra. Trên thực tế, trí thông minh của nó gần như bất khả chiến bại trong sự phức tạp của nó.

Hạn chế của GPT-4

Sau đó, bài báo tiếp tục mô tả cách họ thăm dò các phản ứng và hành vi của GPT-4, để xác minh tính nhất quán, nhất quán và đúng đắn của nó, đồng thời phát hiện ra những hạn chế và thành kiến của nó.

Hạn chế rõ ràng nhất là nó xu hướng ảo giác. Đây là một ví dụ về ảo giác được đưa ra trong bài báo mà GPT-4 tự tin vào câu trả lời của mình là hoàn toàn sai.

Có vẻ như ngay cả GPT-4 cũng hiểu được giới hạn hiện tại với ảo giác vì đây là phản hồi mà nó đưa ra khi tôi hỏi ảo giác GPT là gì:

Ảo giác GPT đề cập đến hiện tượng trong đó mô hình Generative Pre-training Transformer (GPT), giống như mô hình bạn hiện đang tương tác, tạo ra phản hồi không dựa trên thông tin thực tế hoặc không phù hợp với ngữ cảnh được cung cấp. Những ảo giác này xảy ra khi mô hình tạo ra văn bản có vẻ hợp lý nhưng thực sự không chính xác, gây hiểu lầm hoặc vô nghĩa.

Nói cách khác, khi bạn đào tạo LLM AI trên dữ liệu của thế giới, làm thế nào để bạn tránh hệ thống học dữ liệu không chính xác? Một mô hình ngôn ngữ lớn đang học và truyền lại thông tin sai lệch, cũng như các thuyết âm mưu thực sự có thể là một trong những cạm bẫy và mối đe dọa lớn nhất mà nhân loại phải đối mặt khi áp dụng LLM trên quy mô lớn. Đây thực sự có thể là một trong những mối đe dọa lớn hơn từ AGI, một mối đe dọa bị bỏ qua một cách đáng ngạc nhiên khi thảo luận về sự nguy hiểm của AGI.

Bằng chứng về trí thông minh của GPT-4

Bài báo minh họa rằng bất kể loại lời nhắc phức tạp nào được hướng tới nó, GPT-4 sẽ vượt quá mong đợi. Như đã nêu trong bài báo:

Khả năng làm chủ ngôn ngữ tự nhiên vô song của nó. Nó không chỉ có thể tạo ra văn bản trôi chảy và mạch lạc mà còn hiểu và vận dụng văn bản đó theo nhiều cách khác nhau, chẳng hạn như tóm tắt, dịch hoặc trả lời một loạt câu hỏi cực kỳ rộng. Hơn nữa, bằng cách dịch, chúng tôi không chỉ muốn nói giữa các ngôn ngữ tự nhiên khác nhau mà còn dịch theo giọng điệu và phong cách, cũng như trên các lĩnh vực như y học, luật, kế toán, lập trình máy tính, âm nhạc, v.v.

Các bài đánh giá kỹ thuật giả đã được đưa ra cho GPT-4, nó dễ dàng chuyển thành ý nghĩa trong bối cảnh này nếu đây là con người ở đầu bên kia thì họ sẽ ngay lập tức được thuê làm kỹ sư phần mềm. Một bài kiểm tra sơ bộ tương tự về năng lực của GPT-4 trong Bài kiểm tra luật đa bang cho thấy độ chính xác trên 70%. Điều này có nghĩa là trong tương lai chúng tôi có thể tự động hóa nhiều nhiệm vụ hiện đang được giao cho các luật sư. Trong thực tế có một số các công ty khởi nghiệp hiện đang làm việc để tạo ra các luật sư robot sử dụng GPT-4.

Sản xuất kiến thức mới

Một trong những lập luận trong bài báo là điều duy nhất còn lại để GPT-4 chứng minh mức độ hiểu biết thực sự là để nó tạo ra kiến thức mới, chẳng hạn như chứng minh các định lý toán học mới, một kỳ tích hiện vẫn nằm ngoài tầm với của các LLM.

Sau đó, một lần nữa, đây là chén thánh của AGI. Mặc dù có những mối nguy hiểm khi AGI bị kiểm soát trong tay kẻ xấu, nhưng lợi ích của việc AGI có thể nhanh chóng phân tích tất cả dữ liệu lịch sử để khám phá các định lý, phương pháp chữa trị và phương pháp điều trị mới là gần như vô tận.

AGI có thể là mối liên kết còn thiếu trong việc tìm ra phương pháp chữa trị các bệnh di truyền hiếm gặp hiện đang thiếu nguồn tài trợ của ngành tư nhân, hướng tới việc chữa khỏi bệnh ung thư một lần và mãi mãi, đồng thời tối đa hóa hiệu quả của năng lượng tái tạo để loại bỏ sự phụ thuộc của chúng ta vào năng lượng không bền vững. Trên thực tế, nó có thể giải quyết bất kỳ vấn đề hệ quả nào được đưa vào hệ thống AGI. Đây là những gì Sam Altman và nhóm tại OpenAI hiểu, một AGI thực sự là phát minh cuối cùng đó là cần thiết để giải quyết hầu hết các vấn đề và mang lại lợi ích cho nhân loại.

Tất nhiên, điều đó không giải quyết được vấn đề nút hạt nhân về việc ai kiểm soát AGI và ý định của họ là gì. bất kể điều này giấy thực hiện một công việc phi thường khi lập luận rằng GPT-4 là một bước nhảy vọt để đạt được giấc mơ mà các nhà nghiên cứu AI đã có kể từ 1956, khi hội thảo mùa hè Dự án Nghiên cứu Mùa hè Dartmouth về Trí tuệ Nhân tạo lần đầu tiên được khởi động.

Mặc dù vẫn còn tranh cãi liệu GPT-4 có phải là một AGI hay không, nhưng có thể dễ dàng lập luận rằng lần đầu tiên trong lịch sử loài người, đây là một hệ thống AI có thể vượt qua Phép thử Turing.

Sáng kiến mới của OpenAI: Chỉ đạo AI siêu thông minh đi đúng hướng

Đừng bỏ lỡ

Định luật Moore là gì và nó tác động đến AI như thế nào?

Antoine Tardif

Một đối tác sáng lập của unity.AI & một thành viên của Hội đồng Công nghệ Forbes, Antoine là một nhà tương lai học người đam mê tương lai của AI và robot.

Ông cũng là người sáng lập của Chứng khoán.io, một trang web tập trung vào đầu tư vào công nghệ đột phá.

đoàn kết.AI

GPT-4 có phải là bước nhảy vọt để đạt được AGI không?

Trí tuệ tổng hợp nhân tạo

GPT-4 có phải là bước nhảy vọt để đạt được AGI không?

Mục lục

Làm thế nào để tính toán trí thông minh GPT-4?

Hạn chế của GPT-4

Bằng chứng về trí thông minh của GPT-4

Sản xuất kiến thức mới

Tin Mới Nhất

đoàn kết.AI

GPT-4 có phải là bước nhảy vọt để đạt được AGI không?

Mục lục

Làm thế nào để tính toán trí thông minh GPT-4?

Hạn chế của GPT-4

Bằng chứng về trí thông minh của GPT-4

Sản xuất kiến ​​thức mới

Bạn có thể thích

Tin Mới Nhất

Sản xuất kiến thức mới