Trí tuệ nhân tạo

Auto-GPT & GPT-Engineer: Hướng Dẫn Chi Tiết Về Các Đại Diện AI Hàng Đầu Ngày Nay

mm

Khi so sánh ChatGPT với các đại diện AI tự động như Auto-GPT và GPT-Engineer, một sự khác biệt đáng kể xuất hiện trong quá trình ra quyết định. Trong khi ChatGPT yêu cầu sự can thiệp tích cực của con người để thúc đẩy cuộc trò chuyện, cung cấp hướng dẫn dựa trên các gợi ý của người dùng, quá trình lập kế hoạch chủ yếu phụ thuộc vào can thiệp của con người.

Các mô hình AI tạo sinh như transformer là công nghệ lõi hiện đại, thúc đẩy các đại diện AI tự động này. Những transformer này được đào tạo trên các tập dữ liệu lớn, cho phép chúng模拟 các khả năng suy luận và ra quyết định phức tạp.

Nguồn Gốc Mở Của Các Đại Diện Tự Động: Auto-GPT và GPT-Engineer

Nhiều đại diện AI tự động này bắt nguồn từ các sáng kiến mở do các cá nhân đổi mới dẫn đầu, biến đổi các quy trình làm việc truyền thống. Thay vì chỉ cung cấp gợi ý, các đại diện như Auto-GPT có thể xử lý các nhiệm vụ độc lập, từ mua sắm trực tuyến đến xây dựng các ứng dụng cơ bản. Trình thông dịch mã của OpenAI nhằm nâng cấp ChatGPT từ việc chỉ gợi ý ý tưởng đến việc giải quyết các vấn đề với những ý tưởng đó.

Cả Auto-GPT và GPT-Engineer đều được trang bị sức mạnh của GPT 3.5 và GPT-4. Nó nắm bắt logic mã, kết hợp nhiều tệp và tăng tốc quá trình phát triển.

Cốt lõi của chức năng Auto-GPT nằm trong các đại diện AI của nó. Những đại diện này được lập trình để thực hiện các nhiệm vụ cụ thể, từ những nhiệm vụ tầm thường như lập lịch đến các nhiệm vụ phức tạp hơn đòi hỏi quyết định chiến lược. Tuy nhiên, những đại diện AI này hoạt động trong phạm vi được người dùng đặt ra. Bằng cách kiểm soát quyền truy cập của chúng thông qua API, người dùng có thể xác định độ sâu và phạm vi của các hành động mà AI có thể thực hiện.

Ví dụ, nếu được giao nhiệm vụ tạo một ứng dụng trò chuyện web tích hợp với ChatGPT, Auto-GPT tự động chia nhỏ mục tiêu thành các bước có thể thực hiện, như tạo giao diện người dùng HTML hoặc lập trình một ứng dụng phía máy chủ bằng Python. Trong khi ứng dụng tự động tạo ra những gợi ý này, người dùng vẫn có thể giám sát và sửa đổi chúng. Như được thể hiện bởi người tạo AutoGPT @SigGravitas, nó có thể xây dựng và thực hiện một chương trình thử nghiệm dựa trên Python.

https://twitter.com/SigGravitas/status/1642181498278408193

Khi bên dưới mô tả một kiến trúc chung của một đại diện AI tự động, nó cung cấp cái nhìn sâu sắc vào các quá trình diễn ra sau hậu trường.

Kiến Trúc Đại Diện AI Tự Động như Autogpt, GPT Engineer

Kiến Trúc Đại Diện AI Tự Động

Quá trình được khởi đầu bằng việc xác minh khóa API của OpenAI và khởi tạo các tham số khác, bao gồm bộ nhớ ngắn hạn và nội dung cơ sở dữ liệu. Khi dữ liệu khóa được truyền đến Đại Diện, mô hình tương tác với GPT3.5/GPT4 để lấy lại phản hồi. Phản hồi này sau đó được chuyển đổi thành định dạng JSON, mà Đại Diện giải thích để thực hiện các chức năng khác nhau, như thực hiện tìm kiếm trực tuyến, đọc hoặc viết tệp, hoặc thậm chí chạy mã. Auto-GPT sử dụng một mô hình được đào tạo trước để lưu trữ những phản hồi này trong cơ sở dữ liệu, và các tương tác trong tương lai sử dụng thông tin lưu trữ này làm tham chiếu. Vòng lặp tiếp tục cho đến khi nhiệm vụ được coi là hoàn thành.

Hướng Dẫn Cài Đặt Cho Auto-GPT và GPT-Engineer

Cài đặt các công cụ tiên tiến như GPT-Engineer và Auto-GPT có thể giúp tối ưu hóa quá trình phát triển của bạn. Dưới đây là hướng dẫn cấu trúc để giúp bạn cài đặt và cấu hình cả hai công cụ.

Auto-GPT

Cài đặt Auto-GPT có thể xuất hiện phức tạp, nhưng với các bước đúng, nó trở nên đơn giản. Hướng dẫn này bao gồm quy trình cài đặt Auto-GPT và cung cấp thông tin về các kịch bản đa dạng của nó.

1. Điều Kiện Tiên Quyết:

  1. Môi Trường Python: Đảm bảo bạn đã cài đặt Python 3.8 hoặc phiên bản mới hơn. Bạn có thể tải Python từ trang web chính thức của nó.
  2. Nếu bạn dự định sao chép các kho lưu trữ, hãy cài đặt Git.
  3. Khóa API OpenAI: Để tương tác với OpenAI, bạn cần một khóa API. Hãy lấy khóa từ tài khoản OpenAI của bạn
Khóa API Open AI

Tạo Khóa API Open AI

Ứng Dụng Bộ Nhớ: Một ứng dụng bộ nhớ hoạt động như một cơ chế lưu trữ cho AutoGPT để truy cập dữ liệu thiết yếu cho các hoạt động của nó. AutoGPT sử dụng cả khả năng lưu trữ ngắn hạn và dài hạn. Pinecone, Milvus, Redis, và các lựa chọn khác có sẵn.

2. Cài Đặt Không Gian Làm Việc:

  1. Tạo một môi trường ảo: python3 -m venv myenv
  2. Kích hoạt môi trường:
    1. MacOS hoặc Linux: source myenv/bin/activate

3. Cài Đặt:

  1. Sao chép kho lưu trữ Auto-GPT (đảm bảo bạn đã cài đặt Git): git clone https://github.com/Significant-Gravitas/Auto-GPT.git
  2. Để đảm bảo bạn đang làm việc với phiên bản 0.2.2 của Auto-GPT, bạn sẽ muốn kiểm tra phiên bản đó: git checkout stable-0.2.2
  3. Di chuyển đến kho lưu trữ đã tải xuống: cd Auto-GPT
  4. Cài đặt các phụ thuộc cần thiết: pip install -r requirements.txt

4. Cấu Hình:

  1. Tìm tệp .env.template trong thư mục chính /Auto-GPT. Sao chép và đổi tên nó thành .env
  2. Mở .env và đặt khóa API OpenAI của bạn bên cạnh OPENAI_API_KEY=
  3. Tương tự, để sử dụng Pinecone hoặc các ứng dụng bộ nhớ khác, cập nhật tệp .env với khóa API Pinecone và khu vực của bạn.

5. Hướng Dẫn Dòng Lệnh:

Auto-GPT cung cấp một tập hợp phong phú các hướng dẫn dòng lệnh để tùy chỉnh hành vi của nó:

  • Sử Dụng Chung:
    • Hiển Thị Trợ Giúp: python -m autogpt --help
    • Điều Chỉnh Cài Đặt AI: python -m autogpt --ai-settings <filename>
    • Xác Định Ứng Dụng Bộ Nhớ: python -m autogpt --use-memory <memory-backend>
AutoGPT CLI

AutoGPT trong CLI

6. Khởi Chạy Auto-GPT:

Khi cấu hình hoàn tất, khởi chạy Auto-GPT bằng:

  • Linux hoặc Mac: ./run.sh start
  • Windows: .run.bat

Tích Hợp Docker (Phương Pháp Cài Đặt Khuyến Nghị)

Đối với những người muốn chứa Auto-GPT, Docker cung cấp một phương pháp tiếp cận được sắp xếp. Tuy nhiên, hãy lưu ý rằng việc cài đặt ban đầu của Docker có thể hơi phức tạp. Tham khảo hướng dẫn cài đặt Docker để được hỗ trợ.

Tiếp tục theo các bước dưới đây để sửa đổi khóa API OpenAI. Đảm bảo Docker đang chạy ở chế độ nền. Bây giờ, hãy đi đến thư mục chính của AutoGPT và thực hiện các bước sau trên终端 của bạn

  • Xây dựng hình ảnh Docker: docker build -t autogpt .
  • Chạy: docker run -it --env-file=./.env -v$PWD/auto_gpt_workspace:/app/auto_gpt_workspace autogpt

Với docker-compose:

  • Chạy: docker-compose run --build --rm auto-gpt
  • Để tùy chỉnh thêm, bạn có thể tích hợp các đối số bổ sung. Ví dụ, để chạy với cả –gpt3only và –continuous: docker-compose run --rm auto-gpt --gpt3only--continuous
  • Do sự tự động hóa rộng lớn mà Auto-GPT sở hữu trong việc tạo nội dung từ các tập dữ liệu lớn, có nguy cơ nó vô tình truy cập vào các nguồn web độc hại.

Để giảm thiểu rủi ro, hãy vận hành Auto-GPT trong một контейner ảo, như Docker. Điều này đảm bảo rằng bất kỳ nội dung nào có khả năng gây hại sẽ được giới hạn trong không gian ảo, giữ cho hệ thống và tệp của bạn an toàn. Ngoài ra, Windows Sandbox là một lựa chọn, mặc dù nó sẽ bị xóa sau mỗi phiên.

Để đảm bảo an toàn, hãy luôn chạy Auto-GPT trong một môi trường ảo, đảm bảo hệ thống của bạn được cách ly khỏi các đầu ra không mong muốn.

Cho dù vậy, vẫn có khả năng bạn sẽ không thể đạt được kết quả mong muốn. Người dùng Auto-GPT đã báo cáo các vấn đề lặp lại khi cố gắng viết vào một tệp, thường gặp phải các nỗ lực thất bại do tên tệp có vấn đề. Dưới đây là một lỗi như vậy: Auto-GPT (phiên bản 0.2.2) không thêm văn bản sau lỗi "write_to_file returned: Error: File đã được cập nhật

Các giải pháp để giải quyết vấn đề này đã được thảo luận trên luồng thảo luận GitHub để tham khảo.

GPT-Engineer

Lưu trình GPT-Engineer:

  1. Định Nghĩa Gợi Ý: Tạo một mô tả chi tiết về dự án của bạn bằng ngôn ngữ tự nhiên.
  2. Tạo Mã: Dựa trên gợi ý của bạn, GPT-Engineer bắt đầu tạo mã, từ các đoạn mã đến các ứng dụng hoàn chỉnh.
  3. Hoàn Thiện và Tối Ưu: Sau khi tạo mã, luôn có cơ hội để cải thiện. Các nhà phát triển có thể sửa đổi mã tạo để đáp ứng các yêu cầu cụ thể, đảm bảo chất lượng hàng đầu.

Quá trình cài đặt GPT-Engineer đã được rút gọn thành một hướng dẫn dễ theo dõi. Dưới đây là phân tích từng bước:

1. Chuẩn Bị Môi Trường: Trước khi bắt đầu, hãy đảm bảo bạn đã sẵn sàng thư mục dự án. Mở một终端 và chạy lệnh dưới đây

  • Tạo một thư mục mới tên ‘website’: mkdir website
  • Di chuyển vào thư mục: cd website

2. Sao Chép Kho Lưu Trữ:  git clone https://github.com/AntonOsika/gpt-engineer.git .

3. Di Chuyển và Cài Đặt Phụ Thuộc: Khi đã sao chép, hãy chuyển đến thư mục cd gpt-engineer và cài đặt tất cả các phụ thuộc cần thiết make install

4. Kích Hoạt Môi Trường Ảo: Tùy thuộc vào hệ điều hành của bạn, hãy kích hoạt môi trường ảo đã tạo.

  • Đối với macOS/Linux: source venv/bin/activate
  • Đối với Windows, nó hơi khác do thiết lập khóa API: set OPENAI_API_KEY=[khóa API của bạn]

5. Cấu Hình – Thiết Lập Khóa API: Để tương tác với OpenAI, bạn sẽ cần một khóa API. Nếu bạn chưa có, hãy đăng ký trên nền tảng OpenAI, sau đó:

  • Đối với macOS/Linux: export OPENAI_API_KEY=[khóa API của bạn]
  • Đối với Windows (như đã đề cập): set OPENAI_API_KEY=[khóa API của bạn]

6. Khởi Tạo Dự Án và Tạo Mã: Ma thuật của GPT-Engineer bắt đầu với tệp main_prompt trong thư mục projects .

  • Nếu bạn muốn bắt đầu một dự án mới: cp -r projects/example/ projects/website

Tại đây, hãy thay thế ‘website’ bằng tên dự án của bạn.

  • Chỉnh sửa tệp main_prompt sử dụng một trình soạn thảo văn bản của bạn, viết yêu cầu của dự án.

  • Khi bạn hài lòng với gợi ý, hãy chạy: gpt-engineer projects/website

Mã tạo của bạn sẽ nằm trong thư mục workspace trong thư mục dự án.

7. Sau Khi Tạo: Mặc dù GPT-Engineer mạnh mẽ, nó không phải lúc nào cũng hoàn hảo. Hãy kiểm tra mã tạo, thực hiện các thay đổi thủ công nếu cần, và đảm bảo mọi thứ chạy trơn tru.

Ví Dụ Chạy

Gợi Ý:

“Tôi muốn phát triển một ứng dụng Streamlit cơ bản trong Python để trực quan hóa dữ liệu người dùng thông qua các biểu đồ tương tác. Ứng dụng nên cho phép người dùng tải lên một tệp CSV, chọn loại biểu đồ (ví dụ: thanh, bánh, đường) và trực quan hóa dữ liệu một cách động. Nó có thể sử dụng thư viện như Pandas để xử lý dữ liệu và Plotly để trực quan hóa.”

Cài Đặt và Chạy GPT-Engineer

Cài Đặt và Chạy GPT-Engineer

Giống như Auto-GPT, GPT-Engineer đôi khi cũng gặp phải các lỗi ngay cả sau khi cài đặt hoàn tất. Tuy nhiên, trong lần thử thứ ba, tôi đã thành công truy cập vào trang web Streamlit sau. Hãy xem lại bất kỳ lỗi nào trên trang vấn đề chính thức của GPT-Engineer.

Ứng Dụng Streamlit Tạo Bằng GPT-Engineer

Ứng Dụng Streamlit Tạo Bằng GPT-Engineer

Điểm Hạn Chế Của Các Đại Diện AI

Chi Phí Hoạt Động

Một nhiệm vụ đơn lẻ được thực hiện bởi Auto-GPT có thể liên quan đến nhiều bước. Điều quan trọng là mỗi bước này có thể được tính phí riêng, làm tăng chi phí. Auto-GPT có thể bị kẹt trong các vòng lặp lặp lại, không thể cung cấp kết quả như mong đợi. Những sự cố này làm suy yếu tính tin cậy của nó và làm giảm đầu tư.

Hãy tưởng tượng bạn muốn tạo một bài luận ngắn với Auto-GPT. Độ dài lý tưởng của bài luận là 8K token, nhưng trong quá trình tạo, mô hình đi vào nhiều bước trung gian để hoàn thiện nội dung. Nếu bạn sử dụng GPT-4 với độ dài ngữ cảnh 8k, bạn sẽ bị tính phí $0.03 cho đầu vào. Và cho đầu ra, chi phí sẽ là $0.06. Giả sử mô hình chạy vào một vòng lặp không mong muốn, lặp lại một số phần nhất định nhiều lần. Không chỉ quá trình trở nên dài hơn, mà mỗi lần lặp lại cũng thêm vào chi phí.

Để bảo vệ chống lại điều này:
Đặt giới hạn sử dụng tại Giới hạn và Thanh toán OpenAI:

  • Giới Hạn Cứng: Hạn chế sử dụng vượt quá ngưỡng đã đặt.
  • Giới Hạn Mềm: Gửi cho bạn một email cảnh báo khi ngưỡng được đáp ứng.

Giới Hạn Chức Năng

Khả năng của Auto-GPT, như được mô tả trong mã nguồn của nó, đi kèm với một số ranh giới. Các chiến lược giải quyết vấn đề của nó được quản lý bởi các chức năng nội tại và khả năng truy cập được cung cấp bởi API của GPT-4. Đối với các cuộc thảo luận sâu hơn và các giải pháp có thể, hãy xem xét việc truy cập: Thảo Luận Auto-GPT.

Tác Động Của AI Đối Với Thị Trường Lao Động

Mối quan hệ giữa AI và thị trường lao động đang不断 thay đổi và được ghi lại rộng rãi trong bài nghiên cứu này. Một điểm quan trọng cần lưu ý là trong khi tiến bộ công nghệ thường mang lại lợi ích cho người lao động có kỹ năng, nó cũng đặt ra rủi ro cho những người tham gia vào các nhiệm vụ thường xuyên. Trên thực tế, tiến bộ công nghệ có thể thay thế một số nhiệm vụ nhưng đồng thời mở ra con đường cho các nhiệm vụ đa dạng và đòi hỏi lao động.

Thị Trường Lao Động và Đại Diện AI Tự Động

Khoảng 80% người lao động Mỹ có thể thấy rằng các mô hình học ngôn ngữ (LLM) ảnh hưởng đến khoảng 10% công việc hàng ngày của họ. Thống kê này nhấn mạnh sự kết hợp giữa AI và vai trò của con người.

Vai trò kép của AI trong lực lượng lao động:

  • Khía Cạnh Tích Cực: AI có thể tự động hóa nhiều nhiệm vụ, từ dịch vụ khách hàng đến tư vấn tài chính, mang lại sự giảm bớt cho các doanh nghiệp nhỏ không có đủ nguồn lực cho các đội chuyên dụng.
  • Lo Lắng: Lợi ích của tự động hóa làm dấy lên lo ngại về mất việc, đặc biệt là trong các lĩnh vực mà sự tham gia của con người là quan trọng, như hỗ trợ khách hàng. Cùng với đó là mê cung đạo đức liên quan đến việc AI truy cập vào dữ liệu bí mật. Điều này đòi hỏi một cơ sở hạ tầng mạnh mẽ đảm bảo tính minh bạch, trách nhiệm và sử dụng AI một cách đạo đức.

Kết Luận

Rõ ràng, các công cụ như ChatGPT, Auto-GPT và GPT-Engineer đang đứng ở tiền phong của việc thay đổi cách tương tác giữa công nghệ và người dùng. Với gốc gác từ các phong trào mở, những đại diện AI này thể hiện khả năng tự động hóa của máy móc, từ việc lên lịch cho đến phát triển phần mềm.

Khi chúng ta tiến vào một tương lai mà AI tích hợp sâu hơn vào thói quen hàng ngày của chúng ta, việc tìm kiếm sự cân bằng giữa việc khai thác khả năng của AI và bảo vệ vai trò của con người trở nên quan trọng. Trên quy mô rộng lớn hơn, động lực AI và thị trường lao động vẽ ra một bức tranh kép về cơ hội và thách thức, đòi hỏi sự tích hợp có ý thức về đạo đức công nghệ và minh bạch.

Tôi đã dành 5 năm qua để đắm mình trong thế giới hấp dẫn của Máy học và Học sâu. Đam mê và chuyên môn của tôi đã dẫn tôi đến việc đóng góp vào hơn 50 dự án kỹ thuật phần mềm đa dạng, với sự tập trung đặc biệt vào AI/ML. Sự tò mò liên tục của tôi cũng đã thu hút tôi đến với Xử lý Ngôn ngữ Tự nhiên, một lĩnh vực tôi渴望 khám phá thêm.