sơ khai Pixelmator mang đến độ phân giải siêu cao do AI điều khiển cho người dùng - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

Pixelmator mang đến độ phân giải siêu cao do AI điều khiển cho người dùng của nó

mm

Được phát hành

 on

Pixelmator gần đây đã cho phép chủ sở hữu Pixelmator Pro, một ứng dụng xử lý ảnh, sử dụng công cụ siêu phân giải được hỗ trợ bởi AI.

Độ phân giải siêu cao cho phép cải thiện ảnh mờ, độ phân giải thấp và độ phân giải của ảnh được cải thiện. Công nghệ siêu phân giải có thể làm sắc nét hình ảnh để tạo hiệu ứng ấn tượng, thường gợi lên cảm giác "nâng cao" thường thấy trong các chương trình tội phạm. Pixelmator gần đây đã công bố việc đưa công cụ “ML Super Resolution” vào phiên bản Pro của phần mềm chỉnh sửa ảnh. Pixelmator trình diễn một số kết quả có thể được nhìn thấy tại đây.

Các thử nghiệm ban đầu của công cụ này cho thấy rằng nó có thể giảm mờ trong nhiều loại hình ảnh, bao gồm văn bản, ảnh chụp và hình minh họa. BẰNG được báo cáo bởi The Verge, kết quả do chương trình tạo ra dường như cũng tốt hơn so với các công cụ nâng cấp hình ảnh khác, thường sử dụng các thuật toán như Hàng xóm gần nhất và thuật toán Bilinear.

Nhiều công ty công nghệ như Google, Microsoft và Nvidia đã thúc đẩy nghiên cứu về độ phân giải siêu cao. Nhiều công ty đã thiết kế các thuật toán siêu phân giải của riêng họ, nhưng phương pháp được sử dụng để đào tạo các thiết bị siêu phân giải khác nhau sử dụng các nguyên tắc cơ bản giống nhau.

Siêu phân giải ML và các công cụ siêu phân giải khác được đào tạo bằng cách sử dụng các cặp hình ảnh có độ phân giải thấp và độ phân giải cao. Hình ảnh có độ phân giải thấp thường chỉ là phiên bản thu nhỏ của hình ảnh thông thường có độ phân giải cao. Việc so sánh được thực hiện giữa hình ảnh có độ phân giải thấp và hình ảnh có độ phân giải cao, đồng thời thuật toán học máy sẽ tìm hiểu xem các vùng pixel trong hình ảnh có độ phân giải cao khác với hình ảnh có độ phân giải thấp như thế nào. Mục tiêu là các mạng thần kinh học cách phân biệt các mẫu pixel sẽ dẫn đến hình ảnh có độ phân giải cao hơn. Sau đó, nó có thể sử dụng các mẫu khác biệt này để dự đoán vị trí cần thêm pixel vào hình ảnh nhằm cải thiện độ phân giải khi nó được hiển thị với một hình ảnh không nhìn thấy được.

Các ứng dụng siêu phân giải có thể được tạo bằng nhiều phương pháp khác nhau. Ví dụ, một phương pháp siêu phân giải là việc sử dụng Mạng đối thủ chung (GAN). GAN thực chất là hai mạng thần kinh đọ sức với nhau, vay mượn các khái niệm từ Lý thuyết trò chơi như trò chơi có tổng bằng không và mô hình diễn viên-nhà phê bình. Về cơ bản, công việc của một mạng thần kinh là tạo ra những hình ảnh giả, trong khi công việc của mạng kia là phát hiện những hình ảnh giả này. Mạng tạo ra hàng giả được gọi là trình tạo, trong khi mạng phát hiện ra chúng là trình phân biệt đối xử.

Trong trường hợp công cụ Độ phân giải cao của Pixelmator, một mạng lưới thần kinh tích chập đã được tạo ra điều đó cũng đã triển khai một khối “phóng to” giúp nâng cấp hình ảnh sau khi 29 lớp chập quét hình ảnh. Mảng hình ảnh phóng to sau đó được xử lý hậu kỳ và chuyển đổi trở lại thành hình ảnh truyền thống với độ phân giải được cải thiện. Mạng cũng chứa các chức năng khử nhiễu hình ảnh và xử lý các tạo phẩm nén, để các khía cạnh này của hình ảnh không được nâng cấp. Các thuật toán của Pixelmator nhỏ hơn nhiều so với các thuật toán được sử dụng trong cài đặt nghiên cứu, để chúng có thể được đưa vào ứng dụng Pixelmator Pro và chạy trên nhiều loại thiết bị. Tập dữ liệu huấn luyện khá nhỏ khi so sánh với các tập dữ liệu khác được sử dụng cho các ứng dụng tương tự, chỉ 15000 mẫu được sử dụng để huấn luyện các thuật toán.

Theo The Verge, có những công cụ siêu phân giải khác dành cho người tiêu dùng. Chẳng hạn, Adobe cũng có công cụ siêu phân giải của riêng mình trong bộ Adobe Camera, nhưng công cụ của Pixelmator dường như tạo ra những hình ảnh có chất lượng cao nhất quán.