stub „Pixelmator“ naudotojams suteikia AI valdomą puikią raišką – Unite.AI
Susisiekti su mumis

Dirbtinis intelektas

„Pixelmator“ naudotojams suteikia AI valdomą puikią raišką

mm

paskelbta

 on

Neseniai „Pixelmator“ leido „Pixelmator Pro“ – nuotraukų manipuliavimo programėlės – savininkams naudotis itin didelės raiškos įrankiu, kurį maitina AI.

Didelė raiška leidžia pagerinti neryškias, mažos raiškos nuotraukas ir pagerinti vaizdo skyrą. Itin didelės raiškos technologija gali paryškinti vaizdus iki įspūdingo efekto, dažnai sukeldama „patobulintą“ tropą, dažnai matomą kriminalinėse laidose. „Pixelmator“ neseniai paskelbė apie „ML Super Resolution“ įrankio įtraukimą į nuotraukų redagavimo programinės įrangos „Pro“ versiją. Galima pamatyti kai kurių rezultatų demonstraciją „Pixelmator“. čia.

Ankstyvieji įrankio bandymai rodo, kad jis gali sumažinti kelių tipų vaizdų, įskaitant tekstą, nuotraukas ir iliustracijas, susiliejimą. Kaip pranešė „The Verge“., programos sukurti rezultatai taip pat atrodo geresni nei kiti vaizdo didinimo įrankiai, kuriuose dažnai naudojami tokie algoritmai kaip artimiausi kaimynai ir dvilinijiniai algoritmai.

Didžiosios raiškos tyrimus paskatino įvairios technologijų įmonės, tokios kaip „Google“, „Microsoft“ ir „Nvidia“. Kelios įmonės sukūrė savo itin didelės raiškos algoritmus, tačiau metodas, naudojamas lavinti skirtumus didelės raiškos įrenginiams, naudoja tuos pačius pagrindinius principus.

ML Super Resolution ir kiti itin didelės raiškos įrankiai yra mokomi naudojant mažos ir didelės skyros vaizdų poras. Mažos skyros vaizdai paprastai yra tik sumažintos įprastų didelės raiškos vaizdų versijos. Palyginami mažos ir didelės skyros vaizdai, o mašininio mokymosi algoritmai sužino, kaip didelės raiškos vaizdų pikselių sritys skiriasi nuo mažos skyros vaizdų. Tikslas yra, kad neuroniniai tinklai išmoktų atskirti pikselių modelius, kurie leis gauti didesnės raiškos vaizdą. Tada jis gali naudoti šiuos skirtumų modelius, kad nuspėtų, kur prie vaizdo pridėti pikselių, kad pagerintų skiriamąją gebą, kai pateikiamas nematytas vaizdas.

Didelės raiškos programas galima kurti įvairiais būdais. Pavyzdžiui, vienas itin didelės raiškos metodų yra naudojimas Generative Adversarial Networks (GAN). GAN iš tikrųjų yra du vienas prieš kitą susikertantys neuroniniai tinklai, pasiskolinę iš žaidimų teorijos koncepcijas, tokias kaip nulinės sumos žaidimas ir aktoriaus kritiko modelis. Iš esmės vieno neuroninio tinklo užduotis yra sukurti netikrus vaizdus, ​​o kito tinklo užduotis yra aptikti šiuos netikrus vaizdus. Tinklas, kuris sukuria klastotes, vadinamas generatoriumi, o juos aptinkantis tinklas yra diskriminatorius.

Pixelmator Super-Resolution įrankio atveju, buvo sukurtas konvoliucinis neuroninis tinklas kuri taip pat įdiegė „padidinimo“ bloką, kuris padidina vaizdo mastelį po to, kai 29 konvoliuciniai sluoksniai nuskaito vaizdą. Išdidintas vaizdo masyvas vėliau apdorojamas ir vėl paverčiamas tradiciniu patobulintos raiškos vaizdu. Tinkle taip pat yra funkcijų, kurios slopina vaizdą ir susidoroja su glaudinimo artefaktais, kad šie vaizdo aspektai nebūtų padidinami. „Pixelmator“ algoritmai yra daug mažesni nei tyrimų nustatymuose naudojami algoritmai, kad juos būtų galima įtraukti į „Pixelmator Pro“ programą ir paleisti įvairiuose įrenginiuose. Mokymo duomenų rinkinys yra gana mažas, palyginti su kitais duomenų rinkiniais, naudojamais panašioms programoms, algoritmams mokyti buvo panaudota tik 15000 XNUMX pavyzdžių.

„The Verge“ teigimu, yra ir kitų itin didelės raiškos įrankių, kuriuos gali naudoti vartotojai. Pavyzdžiui, „Adobe“ taip pat turi savo aukščiausios raiškos įrankį „Adobe Camera“ rinkinyje, tačiau atrodo, kad „Pixelmator“ įrankis sukuria nuosekliausiai aukštos kokybės vaizdus.