Kỹ thuật prompt
Làm Chủ Nghệ Thuật AI: Hướng Dẫn Cô Đọng Về Midjourney Và Kỹ Thuật Prompt

Giới Thiệu Về Nghệ Thuật Được Tạo Bởi AI MidJourney
AI đang nhanh chóng phá vỡ các rào cản của sự bất khả thi và gần đây nhất đã xâm nhập vào lĩnh vực nghệ thuật, biến đổi nó hoàn toàn. Giờ đây, bạn không cần phải là một nghệ sĩ bậc thầy hay một chuyên gia Photoshop để biến những hình ảnh trong trí tưởng tượng của mình thành hiện thực. Một prompt đơn giản, được diễn đạt rõ ràng là tất cả những gì bạn cần, nhờ vào Midjourney. Tất cả bắt đầu với sự ra mắt của các công nghệ đột phá như DALL-E, Midjourney và StableDiffusion vào năm 2022. Trong khi mỗi đổi mới này mang đến nét riêng biệt cho bức tranh của AI Tạo sinh, thì Midjourney, đặc biệt, vẫn tiếp tục hành trình hấp dẫn của mình, đạt được những bước tiến đáng chú ý. Midjourney hiện là trình tạo ảnh AI từ văn bản có độ phân giải cao hàng đầu trên thị trường và nó nổi bật với sự kết hợp độc đáo giữa tạo ảnh từ văn bản, chỉnh sửa và nâng cấp phương tiện, cùng quyền truy cập vào cộng đồng nghệ thuật sôi động, tất cả bắt đầu từ $10 mỗi tháng. Bộ tính năng toàn diện này tạo ra một bức tranh thú vị cho các nghệ sĩ, người đam mê công nghệ và chuyên gia AI, xây dựng một môi trường cho sự sáng tạo và đổi mới. Thế giới nghệ thuật chắc chắn đang chú ý, với AI tạo sinh trong thị trường nghệ thuật dự kiến sẽ chứng kiến mức tăng trưởng đáng kinh ngạc 40.5% CAGR. Midjourney đứng vững vàng không đối thủ trong việc tạo ra những hình ảnh chân thực và chất lượng cao nhất bằng AI. Kỹ thuật prompt hiệu quả vượt ra ngoài việc chỉ tạo ra; nó bao gồm các phương pháp hay nhất. Prompt cần phải rõ ràng, ngắn gọn nhưng cung cấp đủ hướng dẫn cho AI mà không quá áp đặt. Ngoài ra, đối tượng mục tiêu phải được xem xét trong quá trình thiết kế, tính đến các biến số như tuổi, giới tính và nền tảng văn hóa, trong số những yếu tố khác.
MidJourney Hoạt Động Như Thế Nào?
Mid-Journey tận dụng hai công nghệ học máy mới – mô hình ngôn ngữ lớn và mô hình khuếch tán. Mô hình ngôn ngữ, tương tự như các chatbot AI như ChatGPT, giúp Mid-Journey diễn giải ý nghĩa của prompt của bạn và chuyển chúng thành vector. Vector này sau đó hướng dẫn quá trình khuếch tán. Cách thức hoạt động bên trong của Midjourney phần lớn không được tiết lộ. Tuy nhiên, rõ ràng là nó sử dụng tạo ảnh từ văn bản từ hai công nghệ học máy tương đối mới: mô hình ngôn ngữ lớn và mô hình khuếch tán. Cái trước có lẽ quen thuộc với người dùng các nền tảng AI như ChatGPT, và cái sau là một bổ sung đầy hứa hẹn cho lĩnh vực tạo nghệ thuật AI. Toàn bộ hệ thống dựa trên bộ dữ liệu CLIP để đào tạo, có thể được tìm thấy trên trang nghiên cứu của OpenAI. Bất chấp thông tin hạn chế, có thể phác thảo một bức tranh rộng về mô hình khuếch tán của Midjourney, được đặt tên một cách thích hợp là ‘Stable Diffusion’. Về cơ bản, Stable Diffusion là một mô hình mã nguồn mở khéo léo biến đổi prompt văn bản thành hình ảnh với nhiều phong cách và nội dung khác nhau. Quy trình tinh vi này đạt được thông qua một mô hình khuếch tán, một mô hình tạo sinh kết nối sự phụ thuộc giữa đầu vào văn bản và đầu ra hình ảnh. Các mô hình khuếch tán được xây dựng dựa trên nền tảng của phương pháp Khử nhiễu Khuếch tán, một cách tiếp cận chịu ảnh hưởng của nhiệt động lực học không cân bằng. Phương pháp này có hệ thống phá vỡ cấu trúc của dữ liệu và sau đó khôi phục nó. Cách tiếp cận này đã được điều chỉnh để tạo ảnh bởi Ho et al. vào năm 2020, dẫn đến sự ra đời của các mô hình khuếch tán mà chúng ta thấy ngày nay. Việc đào tạo các mô hình khuếch tán liên quan đến hai giai đoạn chính. Ban đầu, quá trình thuận hoặc khuếch tán liên quan đến việc thêm dần nhiễu ngẫu nhiên vào hình ảnh đầu vào cho đến khi nó hoàn toàn biến thành nhiễu. Quá trình này được điều khiển bởi một chuỗi Markov cố định, liên tục thêm nhiễu Gaussian qua nhiều bước liên tiếp. 
Chi Phí Và Đăng Ký Mid-Journey
Trong khi nhiều chatbot như ChatGPT và Bing Chat cung cấp lượt sử dụng gần như không giới hạn miễn phí, thì kịch bản lại khác đối với các trình tạo ảnh như Mid-Journey. Do yêu cầu sức mạnh tính toán đáng kể, đặc biệt là từ các đơn vị xử lý đồ họa (GPU) và việc sử dụng bộ nhớ video cho quá trình khử nhiễu, dịch vụ của Mid-Journey đi kèm với một mức giá. Gói cơ bản bắt đầu từ $10 mỗi tháng, cung cấp khoảng 3.3 giờ thời gian GPU, đủ cho khoảng 200 lần tạo ảnh. Tuy nhiên, có các gói cao cấp hơn cung cấp hình ảnh không giới hạn ở chế độ Thư giãn, mặc dù với thời gian chờ đợi lâu hơn.
Thiết Lập MidJourney Của Bạn
- Bắt đầu với MidJourney liên quan đến việc đăng ký trên trang web chính thức của họ, đăng ký một gói và sau đó được chuyển hướng đến Discord.
- Khi bạn định vị kênh Mid-Journey trên Discord, hãy điều hướng đến Nhóm Người Mới ở phía bên trái. Từ đó, bạn có thể quan sát những người dùng khác tạo prompt, học cơ chế hoạt động của Mid-Journey và tương tác trong một môi trường sôi động.
- Sau khi làm quen với môi trường, hãy mời bot vào máy chủ riêng tư của bạn để tạo hình ảnh mà không bị làm phiền. Bot tạo ra bốn hình ảnh xem trước dựa trên prompt của bạn, cho phép bạn chọn hình ảnh phù hợp nhất với ý tưởng ban đầu và tinh chỉnh thêm hình ảnh.
Cấu Trúc Prompt Cho Midjourney
- Lệnh /imagine tại một kênh discord bên trong kênh Midjourney tạo ra một hình ảnh độc đáo từ một mô tả văn bản ngắn (Prompt).
- Để tái tạo một phong cách cụ thể trên nhiều hình ảnh khác nhau, chỉ cần nhập URL hình ảnh cùng với prompt văn bản của bạn. Đầu ra mới, nhất quán của bạn sẽ hợp nhất các yếu tố từ cả hình ảnh bạn chọn và văn bản. /imagine http://link-to-your-image <image description> –parameter1 –parameter2 Bạn có thể tạo liên kết đến hình ảnh của mình bằng cách tải nó lên kênh Discord. Sau khi tải lên, nhấp chuột phải vào hình ảnh và chọn ‘Copy Link’. Ở đây http://link-to-your-image và các tham số là tùy chọn.
- Tiếp theo, Bot bắt đầu làm việc trên hình ảnh của bạn, mất khoảng một phút để đưa ra bốn lựa chọn thay thế. Quá trình này liên quan đến việc sử dụng các Đơn vị Xử lý Đồ họa (GPU) mạnh mẽ để xử lý và diễn giải từng prompt.
- Theo dõi việc sử dụng GPU của bạn bằng cách sử dụng lệnh /info. Nó cho phép bạn kiểm tra ‘Fast Time Remaining’ và theo dõi thời gian GPU của gói đăng ký của bạn.
Nâng Cấp Và Thay Đổi Hình Ảnh
Để có hình ảnh tinh tế hơn, hãy sử dụng các nút ‘U’ bên dưới hình ảnh để nâng cấp lựa chọn ưa thích của bạn. Bạn cũng có thể sử dụng các nút ‘V’ để điều chỉnh các hình ảnh cụ thể. Để thay đổi thêm đối với một hình ảnh đã được nâng cấp, hãy sử dụng các tùy chọn ‘Make variations’, ‘Light Upscale Redo’ và ‘Beta Upscale Redo’. Nút ‘Web’ cho phép bạn xem hình ảnh ở kích thước lớn hơn trong một cửa sổ riêng biệt. Midjourney cho phép nâng cấp hình ảnh lên độ phân giải 2048×2048 (vuông) và 2720×1530 (màn hình rộng) thông qua tính năng beta upscale redo, với kích thước lưới tạo mặc định là 1024×1024 (vuông) và 1456×816 (màn hình rộng). Mỗi hình ảnh có thể được nâng cao hơn nữa thông qua các tùy chọn nâng cấp “U”, giúp cải thiện các phần cụ thể của hình ảnh. Hãy xem prompt này tạo ra tác phẩm nghệ thuật tuyệt vời với phiên bản V5.2 của Midjourney. /imagine Artwork portrays a solitary tree under a starlit sky, with a child reading beneath, in the hues of serene blue and warm orange, inspired by the brushstrokes of French Impressionism, Persian miniatures, Bauhaus simplicity, evocative of classic children’s fairy tale illustrations, achieving an asymmetrical harmony, expressed in an enchanting, folk/ naïve: –ar 15:19 –upbeta –q 2 
Tạo Tác Phẩm Nghệ Thuật AI Midjourney Đầu Tiên Của Bạn
- Xây Dựng Bản Phác Thảo Cơ Bản: Hãy nghĩ mình là một nghệ sĩ. Bắt đầu với một mô tả đơn giản, sống động về hình ảnh bạn mong muốn tạo ra. Phác thảo chủ thể chính, bầu không khí, hoặc thậm chí những chi tiết nhỏ bạn muốn nhúng vào. Sử dụng dấu câu như dấu phẩy, ngoặc đơn và dấu gạch ngang để cấu trúc suy nghĩ của bạn. Để cải thiện kết quả, hãy rõ ràng về ngữ cảnh và chi tiết thiết kế của bạn. Các yếu tố như chủ thể (ví dụ: Rồng, xe hơi cổ, Abraham Lincoln), phương tiện (ví dụ: nghệ thuật kỹ thuật số, phác thảo bút chì), môi trường (ví dụ: không gian ngoài vũ trụ, dưới nước, thành phố nhộn nhịp), ánh sáng (ví dụ: mềm mại, neon, ngược sáng), màu sắc (ví dụ: tông màu đất, rực rỡ, tối màu), tâm trạng (ví dụ: u sầu, kỳ ảo, yên bình) và bố cục (ví dụ: phong cảnh, cận cảnh, góc rộng) có thể rất quan trọng. Ví dụ:
- Một khu rừng yên bình tắm mình trong ánh nắng, một con đường mòn uốn lượn vào khoảng xa
- Một thành ph











