Lãnh đạo tư tưởng
Liệu GPT-4 Có Đưa Chúng Ta Gần Hơn Với Một Cuộc Cách Mạng Trí Tuệ Nhân Tạo Thật Sự?

Đã gần ba năm kể từ khi GPT-3 được giới thiệu, vào tháng 5 năm 2020. Kể từ đó, mô hình tạo văn bản AI đã thu hút được rất nhiều sự quan tâm vì khả năng tạo ra văn bản giống như được viết bởi con người. Giờ đây, nó đang trở thành phiên bản tiếp theo của phần mềm, GPT-4, chỉ còn vài bước chân, với ngày phát hành dự kiến là vào đầu năm 2023.
Mặc dù tin tức AI này được mong đợi cao, nhưng chi tiết chính xác về GPT-4 vẫn còn khá mập mờ. OpenAI, công ty đứng sau GPT-4, chưa công bố công khai nhiều thông tin về mô hình mới, chẳng hạn như tính năng hoặc khả năng của nó. Tuy nhiên, những tiến bộ gần đây trong lĩnh vực AI, đặc biệt là về Xử lý Ngôn ngữ Tự nhiên (NLP), có thể cung cấp một số manh mối về những gì chúng ta có thể mong đợi từ GPT-4.
GPT là gì?
Trước khi đi vào các chi tiết, điều hữu ích là đầu tiên thiết lập một baseline về GPT là gì. GPT là viết tắt của Generative Pre-trained Transformer và đề cập đến một mô hình mạng nơ-ron sâu được đào tạo trên dữ liệu có sẵn từ internet để tạo ra lượng lớn văn bản được tạo bởi máy. GPT-3 là thế hệ thứ ba của công nghệ này và là một trong những mô hình tạo văn bản AI tiên tiến nhất hiện có.
Hãy nghĩ về GPT-3 như một trợ lý giọng nói, chẳng hạn như Siri hoặc Alexa, chỉ trên một quy mô lớn hơn nhiều. Thay vì yêu cầu Alexa phát bài hát yêu thích của bạn hoặc yêu cầu Siri nhập văn bản, bạn có thể yêu cầu GPT-3 viết một cuốn sách điện tử trong vài phút hoặc tạo ra 100 ý tưởng đăng bài trên mạng xã hội trong ít hơn một phút. Tất cả những gì người dùng cần làm là cung cấp một lời nhắc, chẳng hạn như “Viết một bài viết 500 từ về tầm quan trọng của sự sáng tạo.” Miễn là lời nhắc rõ ràng và cụ thể, GPT-3 có thể viết gần như bất cứ điều gì bạn yêu cầu.
Kể từ khi phát hành cho công chúng, GPT-3 đã tìm thấy nhiều ứng dụng kinh doanh. Các công ty đang sử dụng nó cho tóm tắt văn bản, dịch ngôn ngữ, tạo mã và tự động hóa quy mô lớn gần như bất kỳ nhiệm vụ viết nào.
Tuy nhiên, trong khi GPT-3 chắc chắn rất ấn tượng trong khả năng tạo ra văn bản giống như con người, nó còn lâu mới hoàn hảo. Vấn đề thường phát sinh khi được yêu cầu viết những đoạn văn dài, đặc biệt là khi nói đến các chủ đề phức tạp đòi hỏi sự hiểu biết. Ví dụ, một lời nhắc để tạo mã máy tính cho một trang web có thể trả về mã chính xác nhưng không tối ưu, vì vậy một lập trình viên con người vẫn phải vào và cải thiện nó. Đó là một vấn đề tương tự với các tài liệu văn bản lớn: càng lớn, càng có khả năng xảy ra lỗi – đôi khi rất hài hước – cần được sửa chữa bởi một nhà văn con người.
Đơn giản nói, GPT-3 không phải là một sự thay thế hoàn chỉnh cho các nhà văn hoặc lập trình viên con người, và nó không nên được coi là một. Thay vào đó, GPT-3 nên được coi là một trợ lý viết, một thứ có thể giúp mọi người tiết kiệm rất nhiều thời gian khi họ cần tạo ra ý tưởng cho bài đăng trên blog hoặc phác thảo sơ bộ cho bản sao quảng cáo hoặc thông cáo báo chí.
Nhiều tham số = tốt hơn?
Một điều cần hiểu về các mô hình AI là cách chúng sử dụng tham số để đưa ra dự đoán. Các tham số của mô hình AI xác định quá trình học và cung cấp cấu trúc cho đầu ra. Số lượng tham số trong mô hình AI thường được sử dụng như một thước đo hiệu suất. Càng nhiều tham số, mô hình càng mạnh, mượt và có thể dự đoán được, ít nhất theo giả thuyết quy mô.
Ví dụ, khi GPT-1 được phát hành vào năm 2018, nó có 117 triệu tham số. GPT-2, được phát hành một năm sau đó, có 1,2 tỷ tham số, trong khi GPT-3 đã tăng số lượng này lên 175 tỷ tham số. Theo một cuộc phỏng vấn tháng 8 năm 2021 với Wired, Andrew Feldman, người sáng lập và CEO của Cerebras, một công ty hợp tác với OpenAI, cho biết GPT-4 sẽ có khoảng 100 nghìn tỷ tham số. Điều này sẽ khiến GPT-4 mạnh hơn 100 lần so với GPT-3, một bước nhảy vĩ đại về kích thước tham số mà, hiểu được, đã khiến nhiều người rất hào hứng.
Tuy nhiên, mặc dù Feldman có những tuyên bố cao cả, nhưng có lý do để nghĩ rằng GPT-4 sẽ không thực sự có 100 nghìn tỷ tham số. Càng lớn, mô hình càng trở nên tốn kém để đào tạo và tinh chỉnh do nhu cầu về sức mạnh tính toán khổng lồ.
Ngoài ra, có nhiều yếu tố hơn là chỉ số lượng tham số quyết định hiệu quả của mô hình. Hãy lấy ví dụ Megatron-Turing NLG, một mô hình tạo văn bản được xây dựng bởi Nvidia và Microsoft, có hơn 500 tỷ tham số. Mặc dù kích thước của nó, MT-NLG không đến gần GPT-3 về hiệu suất. Tóm lại, lớn hơn không nhất thiết là tốt hơn.
Có khả năng GPT-4 sẽ có nhiều tham số hơn GPT-3, nhưng vẫn còn phải xem liệu con số đó có lớn hơn một bậc hay không. Thay vào đó, có những khả năng thú vị khác mà OpenAI có thể đang theo đuổi, chẳng hạn như một mô hình tinh gọn tập trung vào cải tiến định lượng trong thiết kế thuật toán và căn chỉnh. Tác động chính xác của những cải tiến này là khó dự đoán, nhưng điều được biết là một mô hình thưa có thể giảm chi phí tính toán thông qua tính toán có điều kiện, tức là không tất cả các tham số trong mô hình AI sẽ hoạt động mọi lúc, tương tự như cách các nơ-ron trong não người hoạt động.
Vậy, GPT-4 sẽ có thể làm gì?
Cho đến khi OpenAI đưa ra một tuyên bố mới hoặc thậm chí phát hành GPT-4, chúng ta chỉ có thể suy đoán về cách nó sẽ khác với GPT-3. Dù vậy, chúng ta có thể đưa ra một số dự đoán
Mặc dù tương lai của phát triển học sâu AI là đa phương tiện, GPT-4 có khả năng vẫn chỉ là văn bản. Khi con người, chúng ta sống trong một thế giới đa cảm giác được lấp đầy bởi các đầu vào âm thanh, hình ảnh và văn bản khác nhau. Do đó, điều không thể tránh khỏi là sự phát triển AI sẽ cuối cùng tạo ra một mô hình đa phương tiện có thể kết hợp nhiều loại đầu vào.
Tuy nhiên, một mô hình đa phương tiện tốt là khó thiết kế hơn nhiều so với một mô hình chỉ có văn bản. Công nghệ đơn giản là chưa có và dựa trên những gì chúng ta biết về giới hạn kích thước tham số, có khả năng OpenAI đang tập trung vào việc mở rộng và cải thiện một mô hình chỉ có văn bản.
Cũng có khả năng GPT-4 sẽ ít phụ thuộc vào lời nhắc chính xác. Một trong những điểm yếu của GPT-3 là văn bản nhắc cần được viết cẩn thận để có được kết quả mong muốn. Khi lời nhắc không được viết cẩn thận, bạn có thể kết thúc với đầu ra không trung thực, độc hại hoặc thậm chí phản ánh quan điểm cực đoan. Đây là một phần của những gì được gọi là “vấn đề căn chỉnh” và nó đề cập đến những thách thức trong việc tạo ra một mô hình AI hoàn toàn hiểu ý định của người dùng. Nói cách khác, mô hình AI không được căn chỉnh với mục tiêu hoặc ý định của người dùng. Vì mô hình AI được đào tạo bằng cách sử dụng tập dữ liệu văn bản từ internet, rất dễ dàng cho các thành kiến, sai lầm và định kiến của con người tìm đường vào đầu ra văn bản.
Tuy nhiên, có lý do để tin rằng các nhà phát triển đang làm việc trên vấn đề căn chỉnh. Sự lạc quan này đến từ một số đột phá trong việc phát triển InstructGPT, một phiên bản tiên tiến hơn của GPT-3 được đào tạo trên phản hồi của con người để tuân theo hướng dẫn và ý định của người dùng chặt chẽ hơn. Các thẩm phán con người đã tìm thấy rằng InstructGPT ít phụ thuộc vào lời nhắc tốt hơn GPT-3.
Tuy nhiên, cần lưu ý rằng những thử nghiệm này chỉ được thực hiện với nhân viên OpenAI, một nhóm khá đồng nhất có thể không khác biệt nhiều về giới tính, tôn giáo hoặc quan điểm chính trị. Có khả năng GPT-4 sẽ trải qua quá trình đào tạo đa dạng hơn sẽ cải thiện căn chỉnh cho các nhóm khác nhau, mặc dù vẫn còn phải xem mức độ nào.
GPT-4 có thay thế con người?
Mặc dù GPT-4 có nhiều hứa hẹn, nhưng không chắc nó sẽ hoàn toàn thay thế nhu cầu về các nhà văn và lập trình viên con người. Vẫn còn rất nhiều công việc cần được thực hiện trên mọi thứ, từ tối ưu hóa tham số đến đa phương tiện đến căn chỉnh. Có thể sẽ mất nhiều năm trước khi chúng ta thấy một trình tạo văn bản có thể đạt được sự hiểu biết thật sự về sự phức tạp và tinh tế của kinh nghiệm thực tế.
Dù vậy, vẫn có lý do để hào hứng về sự ra đời của GPT-4. Tối ưu hóa tham số – chứ không chỉ tăng trưởng tham số – có khả năng sẽ dẫn đến một mô hình AI có nhiều sức mạnh tính toán hơn so với người tiền nhiệm. Và căn chỉnh cải tiến có khả năng sẽ làm cho GPT-4 trở nên thân thiện với người dùng hơn.
Ngoài ra, chúng ta vẫn chỉ đang ở giai đoạn đầu của sự phát triển và áp dụng các công cụ AI. Các trường hợp sử dụng công nghệ ngày càng được tìm thấy, và khi mọi người giành được nhiều niềm tin và thoải mái khi sử dụng AI trong nơi làm việc, gần như chắc chắn rằng chúng ta sẽ thấy việc áp dụng rộng rãi các công cụ AI trên gần như mọi lĩnh vực kinh doanh trong những năm tới.












