Kỹ thuật prompt

Mastering AI Art: A Concise Guide to Midjourney and Prompt Engineering

Published July 27, 2023

Updated April 28, 2026

Aayush Mittal Mittal

Giới thiệu về Nghệ thuật được tạo bởi Trí tuệ nhân tạo MidJourney

Trí tuệ nhân tạo đang nhanh chóng phá vỡ các rào cản của sự không thể và gần đây nhất đã xâm nhập vào lĩnh vực nghệ thuật, biến đổi nó hoàn toàn. Giờ đây, bạn không cần phải là một nghệ sĩ chuyên nghiệp hoặc một chuyên gia Photoshop để đưa những tưởng tượng của bạn vào cuộc sống. Một lời nhắc đơn giản, rõ ràng là tất cả những gì bạn cần, nhờ vào Midjourney.

Tất cả bắt đầu với sự giới thiệu của các công nghệ đột phá như DALL-E, Midjourney và StableDiffusion vào năm 2022. Mặc dù mỗi một trong những đổi mới này đã mang lại một nét riêng biệt cho canvas của Trí tuệ nhân tạo tạo sinh, Midjourney, đặc biệt, đã tiếp tục hành trình hấp dẫn của mình, đạt được những bước tiến đáng chú ý.

Midjourney hiện là nhà生成 hình ảnh văn bản cao cấp hàng đầu trên thị trường và nó đứng đầu với sự kết hợp độc đáo của việc tạo hình ảnh từ văn bản, chỉnh sửa và nâng cấp phương tiện, và quyền truy cập vào cộng đồng nghệ thuật tích cực, tất cả bắt đầu từ 10 đô la mỗi tháng. Bộ tính năng toàn diện này trình bày một bức tranh thú vị cho các nghệ sĩ, những người đam mê công nghệ và chuyên gia trí tuệ nhân tạo, xây dựng một môi trường cho sự sáng tạo và đổi mới.

Thế giới nghệ thuật chắc chắn đang chú ý, với trí tuệ nhân tạo tạo sinh trong thị trường nghệ thuật dự kiến sẽ chứng kiến sự tăng trưởng đáng kinh ngạc với 40,5% CAGR. Midjourney đứng đầu trong việc tạo ra các hình ảnh thực tế và chất lượng cao nhất bằng cách sử dụng trí tuệ nhân tạo.

Kỹ thuật nhắc hiệu quả đi beyond mere creation; nó bao gồm các phương pháp hay nhất. Các lời nhắc nên cung cấp sự rõ ràng, và được tóm tắt, nhưng cung cấp cho trí tuệ nhân tạo đủ hướng dẫn mà không cần quy định quá mức. Ngoài ra, đối tượng mục tiêu phải được xem xét trong quá trình thiết kế, tính đến các biến như tuổi, giới tính và nền tảng văn hóa, v.v.

Làm thế nào MidJourney hoạt động?

Mid-Journey tận dụng hai công nghệ học máy mới – ngôn ngữ lớn và mô hình khuếch tán. Mô hình ngôn ngữ, tương tự như các rô-bốt trò chuyện như ChatGPT, giúp Mid-Journey hiểu ý nghĩa của các lời nhắc của bạn và chuyển đổi chúng thành vectơ. Vectơ này sau đó hướng dẫn quá trình khuếch tán.

Các hoạt động nội bộ của Midjourney chủ yếu không được tiết lộ. Tuy nhiên, rõ ràng là nó sử dụng việc tạo hình ảnh từ văn bản từ hai công nghệ học máy tương đối mới: mô hình ngôn ngữ lớn và mô hình khuếch tán. Người dùng có thể tìm thấy mô hình ngôn ngữ trên các nền tảng trí tuệ nhân tạo như ChatGPT, và mô hình khuếch tán là một bổ sung đầy hứa hẹn cho lĩnh vực tạo hình ảnh trí tuệ nhân tạo. Toàn bộ hệ thống phụ thuộc vào CLIP dataset để đào tạo, có thể được tìm thấy trên trang nghiên cứu của OpenAI.

Mặc dù thông tin hạn chế, nhưng có thể phác họa một bức tranh rộng về mô hình khuếch tán của Midjourney, được đặt tên là ‘Stable Diffusion’. Về cơ bản, Stable Diffusion là một mô hình mã nguồn mở chuyển đổi các lời nhắc văn bản thành hình ảnh với nhiều phong cách và nội dung khác nhau. Quá trình tinh vi này được thực hiện thông qua mô hình khuếch tán, một mô hình tạo sinh kết nối các phụ thuộc giữa đầu vào văn bản và đầu ra hình ảnh.

Mô hình khuếch tán được xây dựng trên nền tảng của phương pháp khuếch tán làm giảm nhiễu, một phương pháp bị ảnh hưởng bởi nhiệt động lực học không cân bằng. Phương pháp này hệ thống phá vỡ cấu trúc của dữ liệu và sau đó khôi phục lại. Phương pháp này được áp dụng cho việc tạo hình ảnh bởi Ho et al. vào năm 2020, dẫn đến sự ra đời của các mô hình khuếch tán mà chúng ta thấy ngày nay.

Việc đào tạo mô hình khuếch tán bao gồm hai giai đoạn chính. Đầu tiên, quá trình khuếch tán hoặc tiến trình bao gồm việc thêm dần nhiễu ngẫu nhiên vào hình ảnh đầu vào cho đến khi nó hoàn toàn biến thành nhiễu. Quá trình này được quản lý bởi một chuỗi Markov cố định, liên tục thêm nhiễu Gaussian trên nhiều bước tiếp theo.

Sau đó, trong giai đoạn ngược hoặc tái tạo, mô hình khôi phục lại dữ liệu ban đầu từ trạng thái bị chi phối bởi nhiễu đạt được trong quá trình khuếch tán. Quá trình này được thúc đẩy bởi một chuỗi Markov với các chuyển tiếp Gaussian đã học, ngụ ý rằng dự đoán của mật độ xác suất tại bất kỳ thời điểm nào chỉ phụ thuộc vào trạng thái đạt được trong bước thời gian trước. Vì các ‘x1, …, xT’ chia sẻ cùng một kích thước với dữ liệu, mô hình khuếch tán được phân loại là mô hình biến latente.

Chi phí và Đăng ký của Mid-Journey

Trong khi nhiều rô-bốt trò chuyện như ChatGPT và Bing Chat cung cấp gần như không giới hạn việc sử dụng miễn phí, kịch bản khác nhau cho các máy tạo hình ảnh như Mid-Journey. Do công suất tính toán đáng kể được yêu cầu, đặc biệt là từ các đơn vị xử lý đồ họa (GPU) và sử dụng bộ nhớ video cho quá trình làm giảm nhiễu, dịch vụ của Mid-Journey đi kèm với một giá.

Kế hoạch cơ bản bắt đầu từ 10 đô la mỗi tháng, cung cấp khoảng 3,3 giờ thời gian GPU, đủ cho khoảng 200 lần tạo hình ảnh. Tuy nhiên, có các kế hoạch cao cấp hơn cung cấp hình ảnh không giới hạn trong chế độ Relaxed, mặc dù với thời gian chờ lâu hơn.

Thiết lập MidJourney của bạn

Bắt đầu với MidJourney liên quan đến việc đăng ký trên trang web chính thức của họ, đăng ký một kế hoạch và sau đó được chuyển hướng đến Discord.
Một khi bạn tìm thấy kênh Mid-Journey trên Discord, điều hướng đến các nhóm Newcomer trên phía bên trái. Từ đó, bạn có thể quan sát các người dùng khác tạo lời nhắc, học các cơ chế của Mid-Journey và tương tác trong một môi trường sôi động.
Sau khi làm quen với môi trường, mời bot vào máy chủ riêng của bạn để tạo hình ảnh không bị làm phiền. Bot tạo bốn hình ảnh xem trước dựa trên lời nhắc của bạn, cho phép bạn chọn kết quả phù hợp nhất với ý tưởng ban đầu của bạn và tinh chỉnh hình ảnh.

Cấu trúc Lời nhắc cho Midjourney

Lệnh /imagine tại một kênh Discord trong kênh Midjourney tạo ra một hình ảnh duy nhất từ một mô tả văn bản ngắn (Lời nhắc).
Để tái tạo một phong cách cụ thể trên nhiều hình ảnh, chỉ cần nhập URL hình ảnh cùng với lời nhắc văn bản của bạn. Các đầu ra mới nhất của bạn sẽ kết hợp các yếu tố từ cả hình ảnh được chọn và văn bản.
/imagine http://link-to-your-image –parameter1 –parameter2
Bạn có thể tạo liên kết đến hình ảnh của mình bằng cách tải nó lên kênh Discord. Một khi được tải lên, nhấp chuột phải vào hình ảnh và chọn ‘Copy Link’.
Đây http://link-to-your-image và các tham số là tùy chọn.
Sau đó, Bot bắt đầu làm việc trên hình ảnh của bạn, mất khoảng một phút để cung cấp bốn lựa chọn thay thế. Quá trình này liên quan đến việc sử dụng các đơn vị xử lý đồ họa mạnh mẽ để xử lý và diễn giải từng lời nhắc.
Theo dõi việc sử dụng GPU của bạn bằng cách sử dụng lệnh /info. Nó cho phép bạn kiểm tra ‘Thời gian còn lại’ và theo dõi thời gian GPU của đăng ký.

Upscale và Thay đổi Hình ảnh

Để có một hình ảnh tinh tế hơn, sử dụng các nút ‘U’ dưới hình ảnh để nâng cấp hình ảnh được chọn của bạn. Bạn cũng có thể sử dụng các nút ‘V’ để thực hiện các điều chỉnh đối với các hình ảnh cụ thể. Đối với các thay đổi thêm đối với một hình ảnh đã nâng cấp, sử dụng các tùy chọn ‘Tạo các biến thể’, ‘Làm lại nâng cấp ánh sáng’ và ‘Làm lại nâng cấp beta’. Nút ‘Web’ cho phép bạn xem hình ảnh trong một cửa sổ riêng với kích thước lớn hơn.

Midjourney cho phép nâng cấp hình ảnh lên 2048×2048 (hình vuông) và 2720×1530 (màn hình rộng) thông qua tính năng nâng cấp beta, với kích thước lưới tạo hình ảnh mặc định là 1024×1024 (hình vuông) và 1456×816 (màn hình rộng). Mỗi hình ảnh có thể được cải thiện thêm thông qua các tùy chọn nâng cấp “U”, giúp cải thiện các phần cụ thể của hình ảnh.

Hãy xem lời nhắc này tạo ra một tác phẩm nghệ thuật tuyệt vời với phiên bản V5.2 của Midjourney.

/imagine Artwork miêu tả một cây cối cô đơn dưới bầu trời sao, với một đứa trẻ đọc dưới gốc cây, trong các màu xanh lam yên tĩnh và cam ấm, lấy cảm hứng từ các nét brushstrokes của Trường phái Ấn tượng Pháp, tranh miniatures Ba Tư, sự đơn giản của Bauhaus, gợi nhớ đến các minh họa cổ điển trong truyện cổ tích cho trẻ em, đạt được sự hòa hợp không đối xứng, thể hiện trong một phong cách mê hoặc, dân gian / ngây thơ: –ar 15:19 –upbeta –q 2

Tạo tác phẩm nghệ thuật AI đầu tiên của bạn với Midjourney

Tạo bản thiết kế cơ bản: Hãy tưởng tượng bạn là một nghệ sĩ. Bắt đầu với một mô tả đơn giản, sinh động về hình ảnh bạn khao khát đưa vào cuộc sống. Phác thảo chủ đề chính, bầu không khí hoặc thậm chí các chi tiết nhỏ bạn muốn nhúng. Sử dụng dấu chấm câu như dấu phẩy, dấu ngoặc và dấu gạch chéo để cấu trúc suy nghĩ của bạn. Để có kết quả tốt hơn, hãy rõ ràng về bối cảnh và chi tiết của thiết kế. Các yếu tố như chủ đề (ví dụ: Rồng, xe hơi cổ điển, Abraham Lincoln), phương tiện (ví dụ: nghệ thuật kỹ thuật số, vẽ bằng bút chì), môi trường (ví dụ: không gian ngoài trời, dưới nước, thành phố tấp nập), ánh sáng (ví dụ: mềm, neon, ngược sáng), màu sắc (ví dụ: màu đất, tươi sáng, dịu), tâm trạng (ví dụ: buồn, kỳ lạ, yên bình) và bố cục (ví dụ: phong cảnh, cận cảnh, góc rộng) có thể quan trọng. Ví dụ:
- Một khu rừng idyllic được tắm trong ánh nắng mặt trời, một con đường mòn uốn lượn vào khoảng cách
- Một thành phố không bao giờ ngủ, với ánh đèn neon phản chiếu trên vỉa hè và một đám đông đa dạng đang tụ tập
Nhúng phong cách và từ khóa: Trí tuệ nhân tạo của Midjourney có khả năng minh họa hình ảnh trong nhiều phong cách như trừu tượng, siêu thực hoặc thực tế. Bằng cách tích hợp một phong cách hoặc từ khóa liên quan, bạn có thể hướng dẫn trí tuệ nhân tạo tạo ra một hình ảnh phản ánh tầm nhìn của bạn. Thử nghiệm với các phong cách và từ khóa khác nhau để khám phá sự kết hợp hoàn hảo. Ví dụ:
- Một bức tranh phong cảnh mô tả một sa mạc vào lúc bình minh, phản ánh phong cách của Georgia O’Keeffe, với bảng màu pastel và hình dạng hữu cơ.
- Một hình ảnh trừu tượng của một khu rừng yên bình, với các mẫu hình học tạo thành cây cối và lá cây, lấy cảm hứng từ các tác phẩm của Piet Mondrian.
Sử dụng các thiết lập nâng cao: Hãy xem Midjourney như một bộ công cụ sáng tạo của bạn, đầy ắp các thiết lập nâng cao cho phép bạn tinh chỉnh hình ảnh được tạo. Nó giống như việc sử dụng một cây đũa phép, cho phép bạn tạo ra sự cân bằng hoàn hảo giữa sự ngẫu nhiên, phong cách hóa và biến thể hình ảnh. Hãy phát huy khả năng sáng tạo của bạn bằng cách thử nghiệm với các thiết lập này cho đến khi bạn tìm thấy sự kết hợp hoàn hảo phù hợp với tầm nhìn của bạn. Ví dụ:
- Một khu vườn Nhật Bản yên tĩnh với một hồ nước phản chiếu cây hoa anh đào, -seed 22 -s 150 -c 40
- Một thành phố cyberpunk dystopian, được chiếu sáng bởi ánh đèn neon -seed 88 -s 600 -c 60
Làm nổi bật các yếu tố với trọng số: Hãy tưởng tượng hình ảnh của bạn như một bản giao hưởng, với mỗi yếu tố đóng góp vào bản tổng hợp lớn. Sử dụng ký hiệu “::”, bạn có thể chỉ định tầm quan trọng của các yếu tố khác nhau trong hình ảnh của mình, cho phép bạn kiểm soát sự chú ý. Ví dụ:
- [Một con peacock trang nhã]::3 đậu trên một [cây wisteria]::1 nở với những bông hoa tươi sáng
- [Một con voi vĩ đại]::2 đang tắm trong ánh sáng của một [mặt trời lặn]::1 trên savannah
Midjourney là một quá trình thử và sai: Thử nghiệm với các yếu tố và tính năng khác nhau là cần thiết. Mỗi lần lặp lại sẽ đưa bạn gần hơn đến hình ảnh bạn muốn đưa vào cuộc sống.

Thông số Mid-Journey

Mô hình của Midjourney hoạt động bằng cách sử dụng các thông số có thể điều chỉnh để kiểm soát kết quả của quá trình tạo hình ảnh. Các thông số này cho phép người dùng tinh chỉnh và tùy chỉnh hình ảnh được tạo, tinh chỉnh mô hình để tạo ra các đầu ra phù hợp hoàn hảo với mục tiêu của họ.

Dưới đây là các thông số cơ bản và nâng cao, chức năng của chúng và cách sử dụng chúng để tận dụng tối đa khả năng của Midjourney:

Tỷ lệ khung hình (–aspect hoặc –ar): Thông số này kiểm soát tỷ lệ giữa chiều rộng và chiều cao của hình ảnh được tạo. Ví dụ, tỷ lệ 16:9 là hoàn hảo cho các hình ảnh thumbnail trên YouTube, trong khi 1:1 tạo ra một hình ảnh vuông tuyệt vời cho Instagram.
Độ hỗn loạn (–chaos): Thông số này điều chỉnh sự đa dạng của lưới hình ảnh ban đầu và dao động từ 0 đến 100. Các giá trị hỗn loạn cao hơn sẽ mang lại kết quả độc đáo và không thể đoán trước, trong khi các giá trị thấp hơn sẽ đảm bảo kết quả nhất quán hơn.
Không (–no): Thông số này giúp bạn loại bỏ các yếu tố hoặc đặc điểm cụ thể khỏi hình ảnh được tạo. Ví dụ, nếu bạn muốn một hình ảnh không có màu đỏ, bạn có thể sử dụng “–no đỏ”.
Chất lượng (–quality hoặc –q): Cài đặt này điều chỉnh thời gian cần thiết để tạo một hình ảnh. Chất lượng cao hơn yêu cầu thời gian xử lý nhiều hơn nhưng mang lại chi tiết tinh tế. Thông số này có thể nhận các giá trị .25, .5, 1 hoặc 2.
Hạt giống (–seed): Thông số này quyết định nhiễu hình ảnh ban đầu, hoạt động như một baseline cho hình ảnh được tạo. Sử dụng cùng một số hạt giống với cùng một lời nhắc sẽ mang lại kết quả tương tự. Nó chấp nhận các giá trị整 số từ 0 đến 4294967295.
Dừng (–stop): Với thông số này, bạn có thể chấm dứt một công việc một cách sớm, tạo ra các kết quả ít chi tiết nhưng có thể thú vị. Phạm vi là 10-100. Ví dụ, nếu bạn chỉ định ‘–stop 50’, quá trình tạo hình ảnh sẽ dừng lại ở 50% hoàn thành, dẫn đến một hình ảnh ít chi tiết, có thể trừu tượng.
Phong cách hóa (–stylize hoặc –s): Thông số này kiểm soát mức độ áp dụng nghệ thuật trên hình ảnh được tạo. Các giá trị phong cách hóa thấp hơn sẽ mang lại kết quả gần giống với lời nhắc ban đầu, trong khi các giá trị cao hơn sẽ dẫn đến các giải thích nghệ thuật và trừu tượng hơn. Trong v5, giá trị mặc định là 100, nhưng bạn có thể đặt nó bất kỳ nơi nào từ 0 đến 1000.
Phiên bản mô hình: Bạn có thể chọn từ các phiên bản khác nhau của mô hình Midjourney bằng cách sử dụng thông số –version hoặc –v.
Niji: Một mô hình chuyên về hình ảnh theo phong cách anime. Nó có thể được truy cập bằng cách sử dụng thông số –niji.
Định nghĩa cao: Đối với hình ảnh trừu tượng và phong cảnh, thông số –hd kích hoạt một phiên bản mô hình cũ hơn mang lại hình ảnh lớn hơn và ít nhất quán hơn.
Mô hình thử nghiệm: Midjourney cung cấp các mô hình đặc biệt cho các trường hợp sử dụng cụ thể. –test và –testp kích hoạt các mô hình thử nghiệm tiêu chuẩn và tập trung vào nhiếp ảnh, tương ứng.
Nâng cấp hình ảnh: Thuật toán Midjourney bắt đầu với một lưới hình ảnh có độ phân giải thấp. Nó cung cấp nhiều mô hình nâng cấp để tăng kích thước và chi tiết của hình ảnh.
- Uplight: Một bộ nâng cấp ánh sáng thay thế (–uplight) cung cấp hình ảnh được nâng cấp mượt mà hơn nhưng ít chi tiết hơn.
- Upbeta: Thông số –upbeta dẫn đến hình ảnh có ít chi tiết bổ sung hơn, giữ nguyên hình ảnh lưới ban đầu.
- Upanime: Bộ nâng cấp –upanime được thiết kế đặc biệt để làm việc với mô hình Midjourney –niji.
Trọng số hình ảnh: Sử dụng –iw để điều chỉnh trọng số lời nhắc hình ảnh so với trọng số văn bản. Giá trị mặc định là 0,25.
Sameseed: Thông số –sameseed đảm bảo rằng tất cả hình ảnh trong lưới ban đầu sử dụng cùng một nhiễu ban đầu, tạo ra hình ảnh được tạo rất tương tự.
Video: Midjourney có thể lưu một video tiến trình của quá trình tạo lưới hình ảnh ban đầu bằng cách sử dụng thông số –video.
Sáng tạo: Với thông số –creative, các mô hình thử nghiệm và thử nghiệm nhiếp ảnh tạo ra hình ảnh đa dạng và sáng tạo hơn.

Midjourney liên tục tung ra các bản cập nhật để nâng cao trải nghiệm người dùng, với bản cập nhật mới nhất là phiên bản 5.2, được ra mắt vào tháng 6 năm 2023. Bằng cách thêm –v 5.2 vào lời nhắc của bạn hoặc chọn nó thông qua lệnh /settings, người dùng có thể truy cập mô hình tiên tiến này. Phiên bản 5.2 cung cấp chi tiết hình ảnh vượt trội và hiểu lời nhắc một cách trực quan hơn, mang lại màu sắc tươi sáng hơn và các bố cục được cải thiện.

Hiểu về Bản quyền cho Tác phẩm Nghệ thuật được tạo bởi Trí tuệ nhân tạo

Vào tháng 3 năm 2023, Văn phòng Bản quyền Hoa Kỳ đã làm rõ lập trường của mình về việc bản quyền các tác phẩm được tạo bởi trí tuệ nhân tạo. Chính sách này tuyên bố rằng trong khi các yếu tố do con người tạo ra trong các tác phẩm trí tuệ nhân tạo (như văn bản hoặc thiết kế độc đáo) có thể được bảo vệ, các hình ảnh được tạo ra bởi trí tuệ nhân tạo không đủ điều kiện để được bản quyền, tuân thủ các chuẩn mực toàn cầu rằng chỉ các tác phẩm do con người tạo ra mới đủ điều kiện để được bảo vệ bản quyền.

Trong bối cảnh nghệ thuật trí tuệ nhân tạo, bản quyền không đơn giản. Trong khi nghệ thuật kỹ thuật số có sự can thiệp của con người, nghệ thuật được tạo bởi trí tuệ nhân tạo được tạo ra mà không có sự can thiệp trực tiếp của con người, làm phức tạp vấn đề về quyền tác giả và quyền sở hữu. Theo Văn phòng Bản quyền Hoa Kỳ, quyền sở hữu ban đầu được cấp cho tác giả của tác phẩm – một người tạo ra. Tuy nhiên, vì trí tuệ nhân tạo không thể được coi là một tác giả, nghệ thuật được tạo bởi trí tuệ nhân tạo thiếu sự rõ ràng về quyền sở hữu.

Hướng dẫn mới nhất từ Văn phòng Bản quyền Hoa Kỳ cho phép bản quyền các tác phẩm trí tuệ nhân tạo chỉ khi chúng chứa đủ sự sáng tạo của con người. Mức độ ‘sự sáng tạo của con người’ vẫn chưa được định nghĩa và phụ thuộc vào mức độ tham gia của con người trong việc tạo ra tác phẩm nghệ thuật trí tuệ nhân tạo.

Đáng chú ý, Midjourney, một nền tảng trí tuệ nhân tạo để tạo hình ảnh, đã thiết lập các chính sách của riêng mình về quyền sử dụng. Người dùng thử nghiệm miễn phí có thể sử dụng hình ảnh cho mục đích phi thương mại theo Giấy phép Creative Commons Attribution-NonCommercial 4.0 Quốc tế (CC BY-NC 4.0), với sự ghi nhận đúng cách cho Midjourney. Tuy nhiên, người đăng ký trả phí có thể sử dụng hình ảnh cho bất kỳ mục đích nào, bao gồm cả mục đích thương mại, theo Điều khoản Thương mại Chung. Sự phát triển này trong không gian bản quyền trình bày một động lực thú vị giữa sáng tạo trí tuệ nhân tạo và con người.

Sử dụng Midjourney cho Thiết kế Giao diện Người dùng Động và Tạo Logo Sáng tạo

Từ thiết kế giao diện người dùng trực quan cho các trang web hoặc ứng dụng di động đến việc tạo ra các logo và biểu ngữ độc đáo, Midjourney trao quyền cho các nhà tạo nội dung bằng cách tạo ra nhiều lựa chọn thiết kế trong vài giây.

Đây là cách nó hoạt động. Mỗi thiết kế bắt đầu với một lời nhắc, đóng vai trò như một bản thiết kế cho trí tuệ nhân tạo để theo dõi. Giả sử bạn đang thiết kế giao diện người dùng cho một ứng dụng di động của nền tảng học trực tuyến. Một lời nhắc điển hình có thể là: “/imagine Giao diện người dùng của nền tảng học trực tuyến, Dribbble, Độ phân giải cao, 4K, giống như Khan Academy”.

Các kết quả ban đầu có thể không hoàn hảo. Ví dụ, thêm “Adobe XD” vào có thể giúp Midjourney điều chỉnh thiết kế của nó để tương thích hơn với Adobe XD. Một lời nhắc được tối ưu hóa sẽ là:

/imagine Giao diện người dùng của nền tảng học trực tuyến, Adobe XD, Dribbble, Độ phân giải cao, 4K, thiết kế tối giản

Logo hoặc Biểu ngữ được tạo bởi Lời nhắc Văn bản sử dụng Midjourney

Hãy khám phá cách tạo một biểu ngữ với một logo cho Unite.AI.

Trước tiên, bạn cần có một hình ảnh đơn giản của văn bản bạn muốn hiển thị. Bạn có thể tạo điều này bằng bất kỳ công cụ thiết kế đồ họa hoặc trình chỉnh sửa văn bản nào và tải nó lên kênh Discord của bạn.

: Một hình ảnh đơn giản của văn bản được sử dụng để tạo Logo UNITE

Lời nhắc để tạo biểu ngữ là:

/imagine Letters: UNITE trong một phông chữ tương lai, lấy cảm hứng từ trí tuệ nhân tạo, logo với các chữ cái UNITE –v 5 –ar 16:9

Hãy xem những lời nhắc ví dụ này để có thêm ý tưởng:

/imagine Một nhạc sĩ đơn độc biểu diễn một bản nhạc êm ái trên một thành phố nổi vào lúc hoàng hôn, phong cách nghệ thuật nouveau

/imagine Một hình ảnh của một người trong tương lai làm việc trên một bàn làm việc tương lai, được bao quanh bởi các màn hình holographic và công nghệ tiên tiến. Người đó mặc một bộ đồ jumpsuit bạc bóng và có kính thực tế ảo. Môi trường được lấp đầy bởi ánh đèn neon và các hologram nổi. Không khí là tương lai và công nghệ cao, với một cảm giác phấn khích và đổi mới. Máy ảnh là một máy ảnh kỹ thuật số độ phân giải cao, ghi lại mọi chi tiết với độ chính xác. Phong cách nghệ thuật là sự kết hợp giữa cyberpunk và tối giản, tập trung vào các đường thẳng và màu sắc nổi bật. Các giám đốc, nhà quay phim, nhiếp ảnh gia, nhà thiết kế thời trang, họa sĩ truyện tranh và nghệ sĩ hợp tác trong sự kết hợp độc đáo này là Christopher Nolan, Roger Deakins, Annie Leibovitz, Virgil Abloh, Hayao Miyazaki và Kaws.

/imagine Búp bê Barbie theo phong cách những năm 1940 như một y tá trong thời chiến, trong một môi trường bệnh viện quân đội cổ điển, chăm sóc các binh sĩ bị thương, theo phong cách của các minh họa Mattel kinh điển, với bầu không khí của nhiếp ảnh Thế chiến II sepia 8k –v 5 –ar 16:9

/imagine Khung của một người phụ nữ dựa vào một chiếc xe hoverbike cyberpunk, anime Nhật Bản, thành phố rộng lớn, 32k, không gian cảng phức tạp, lướt, các cảnh quan thành phố cao tầng, mượt mà

Các suy nghĩ cuối cùng: Điều hướng Thế giới Nghệ thuật Trí tuệ nhân tạo với Midjourney

Hãy nhớ, “Một bức tranh đáng giá hơn một nghìn lời”. Một mô tả chi tiết, sống động có thể làm việc kỳ diệu. Vâng, Midjourney không miễn phí để sử dụng. Tuy nhiên, nó đang cách mạng hóa thế giới nghệ thuật và mở rộng khả năng sáng tạo của chúng ta thông qua công nghệ trí tuệ nhân tạo văn bản-sang-hình ảnh tiên tiến. Với khả năng chuyển đổi một lời nhắc văn bản đơn giản thành một hình ảnh độ phân giải cao, nó là một công cụ hứa hẹn mang lại cơ hội không giới hạn, không chỉ cho các nghệ sĩ, mà còn cho các nhà thiết kế UI/UX, những người đam mê công nghệ và chuyên gia trí tuệ nhân tạo.

Dưới đây là một số điểm chính cần nhớ khi bạn bắt đầu cuộc phiêu lưu Midjourney của mình:

Học các cơ bản của lời nhắc Midjourney: Sử dụng các mô tả rõ ràng, tóm tắt và toàn diện để hướng dẫn trí tuệ nhân tạo một cách hiệu quả. Hãy nhớ xem xét đối tượng của bạn và đừng ngần ngại thử nghiệm với các phong cách, tâm trạng và bối cảnh khác nhau.
Sử dụng các thông số: Tăng cường trải nghiệm sáng tạo của bạn bằng cách tận dụng nhiều thiết lập nâng cao mà Midjourney cung cấp. Từ việc kiểm soát tỷ lệ khung hình đến việc điều chỉnh thông số hỗn loạn cho các kết quả độc đáo, mọi chi tiết có thể được tùy chỉnh theo sở thích của bạn.
Chấp nhận quá trình lặp lại: Tác phẩm nghệ thuật trí tuệ nhân tạo đầu tiên của bạn có thể không hoàn hảo. Chấp nhận quá trình lặp lại này và học cách tinh chỉnh và tối ưu hóa lời nhắc của bạn cho kết quả tốt hơn.
Hiểu các ý nghĩa về bản quyền: Trong khi các tác phẩm nghệ thuật được tạo bởi trí tuệ nhân tạo không đủ điều kiện để được bản quyền, các yếu tố do con người tạo ra trong chúng có thể được bảo vệ.

Về cơ bản, sự tích hợp của trí tuệ nhân tạo vào nghệ thuật đã dân chủ hóa sự sáng tạo và làm mờ ranh giới giữa các kiệt tác do con người và máy móc tạo ra. Khi chúng ta tiếp tục chứng kiến sự tăng trưởng đáng kinh ngạc của trí tuệ nhân tạo tạo sinh trong thị trường nghệ thuật, không thể phủ nhận rằng cuộc cách mạng nghệ thuật trí tuệ nhân tạo, được dẫn dắt bởi các nền tảng như Midjourney, chỉ mới bắt đầu.

Aayush Mittal

Tôi đã dành 5 năm qua để đắm mình trong thế giới hấp dẫn của Máy học và Học sâu. Đam mê và chuyên môn của tôi đã dẫn tôi đến việc đóng góp vào hơn 50 dự án kỹ thuật phần mềm đa dạng, với trọng tâm đặc biệt là AI/ML. Sự tò mò liên tục của tôi cũng đã thu hút tôi đến Xử lý Ngôn ngữ Tự nhiên, một lĩnh vực tôi渴望 khám phá thêm.