Kunstig intelligens

Kina foreslår økt regulering av deepfakes og andre AI-syntesesystemer

mm

Cyberspace Administration of China (CAC) har foreslått en ny sett med utkast til reguleringer for å styre AI-basert syntesesystemer, inkludert deepfakes, virtuelle virkelighets-scener, tekstgenerering, lyd og andre undersektorer av AI-mediesyntese – et felt hvor Kina produserer et stort antall akademiske artikler og innovative forskningsprosjekter hver måned.

En post (Google Oversettelse, original her) på CACs offisielle nettsted setter ut de foreslåtte forpliktelsene, og karakteriserer berørte tjenester som ‘dypt syntesetjenesteleverandører’, og inviterer borgere til å delta ved å bidra med kommentarer til utkastforslagene, med en frist på 28. februar.

Ikke bare deepfakes

Selv om de foreslåtte reguleringene har blitt rapportert i sammenheng med deres potensielle innvirkning på skapning og spredning av deepfakes, prøver dokumentet å omfatte alle mulige typer innhold som kan tolkes i den bredt forståtte betydningen av ‘media’.

Artikkel 2 erklærer den planlagte omfanget av reguleringene over seks sektorer*:

(1) Teknikker for å generere eller redigere tekstinnhold, som kapittelgenerering, tekststilomforming og spørsmål-og-svar-dialog;

(2) Teknologier for å generere eller redigere lydinnhold, som tekst-til-tale, taleomforming og taleattributediting;

(3) Teknologier for å generere eller redigere ikke-lydinnhold, som musikkgenerering og scenelydredigering;

(4) Ansiktsgenerering, ansiktsutskifting, karakterattributediting, ansiktsmanipulering, gestmanipulering og andre teknologier for å generere eller redigere biometriske trekk som ansikter i bilder og videoinnhold;

(5) Teknikker for å redigere ikke-biologiske trekk i bilder og videoinnhold, som bildeforbedring og bilde restaurering;

(6) Teknologier for å generere eller redigere virtuelle scener, som 3D-rekonstruksjon.

Deepfake-regulering

Kina kriminaliserte bruken av AI for spredning av feilaktige nyheter ved slutten av 2019, da CAC uttrykte bekymring over de potensielle implikasjonene av deepfake-teknologi, og mange trodde at den kinesiske regjeringen ville forbyle deepfake-teknologi fullstendig.

Men dette ville innebære at Kina offisielt oppga en av de mest politisk og kulturelt betydningsfulle utviklingene i mediegenereringshistorien, AI og selv politikk, og kutte seg selv av fra fordelen av global og åpen vitenskapelig samarbeid.

Derfor ser det ut til at Kina nå er bestemt på å eksperimentere med å kontrollere i stedet for å forbyle den potensielt ustyrlige teknologien, som mange tror vil til slutt migrere ut av sin porn akseleratorfase og inn i en legitim og utnyttbar sett med brukstilfeller, særlig i underholdning.

NeRF inkludert

Artikkel 2.6 omhandler generering eller redigering av virtuelle scener, som 3D-rekonstruksjon, en mer ny teknologi enn deepfake-impersonasjon, og en som har oppnådd mest prominens over de siste to årene gjennom introduksjonen av Neural Radiance Fields (NeRF), hvor fotogrammetri brukes til å syntetisere hele scener i den utforskbare latente rommet til maskinlæringsmodeller.

Men NeRF utvider raskt sin rekkevidde utover tableauer av modeller og gjennomgang av miljøer til generering av fullkroppsvideo, med kinesiske forskere som har fremmet enkelte større innovasjoner i denne hensikt.

ST-NeRF

Kinas ST-NeRF i aksjon.

Selv om NeRF har produsert en snøstorm av ny forskning siden dens annonsering i 2020, har dens implementering i VR- eller AR-systemer, eller dens egnet til å bruke i visuelle effektpipelines, fortsatt mange bemerkelsesverdige utfordringer og tekniske flaskehalser å krysse. NeRFs økende evne til å gjenopprette og redigere komplette menneskelige fysiognomier har ennå ikke inkorporert noen av de standard identitets-transformerende deepfake-egenskapene som har karakterisert nyhetsoverskrifter over de siste to årene.

Audio deepfakes en prioritet?

Hvis en skal ta Artikkel 2s listeorden som en indikasjon på de dypt synteseteknologiene som Kina er mest bekymret for å kontrollere og regulere, ville dette antyde at tekstbasert AI-generert feilaktig nyheter er av primær bekymring, med tale-syntese foran video-deepfakes i termer av deres potensielle innvirkning.

Hvis så, stemmer dette overens med det faktum at deepfake-video ennå ikke har blitt brukt i noen kriminalitet ikke relatert til pornografi (Asia har ikke nølt å kriminalisere deepfake-porn), mens deepfake-lyd har blitt foreslått som en aktiv teknologi i minst to større finansielle kriminalitet, i Storbritannia i 2019, og i De forente arabiske emirater i 2021.

De nye utkast til reguleringer forplikter brukere som ønsker å utnytte en persons identitet via bruk av maskinlærings-systemer til å søke skriftlig tillatelse fra personen. I tillegg må syntetisk media vise noen typer ‘prominent’ logo eller vannmerke, eller andre midler hvorved personen som forbruker materialet kan bli gjort å forstå at innholdet er endret eller helt fabrikkert. Det er ikke fullstendig klart hvordan dette kan oppnås i tilfelle av audio-deepfakes.

Registrering

Hvis ratifisert, ville utkastforslagene forplikte dypt syntesetjenesteleverandører til å registrere sine pertinente applikasjoner hos staten, i henhold til de eksisterende bestemmelsene om administrasjon av algoritme-anbefalinger for internett-informasjonstjenester, og å være i samsvar med alle nødvendige registreringsprosedyrer. Dypt syntesetjenesteleverandører vil også være påkrevd til å samarbeide fritt i termer av tilsyn og inspeksjon, og å produsere ‘nødvendig teknisk og data-støtte og assistanse’ på forespørsel.

Videre vil slike leverandører være påkrevd til å etablere brukervennlige porter for klage, og å publisere forventede tidsbegrensninger for behandling av slike klager, samt å være påkrevd til å tilby ‘rykte-tilbakevendende mekanismer’ – selv om forslagene ikke gir detaljer i forhold til implementeringen av dette.

Overtradelser kunne utløse bøter på mellom 10 000 og 100 000 yuan ($1 600 og $16 000), samt eksponere overtredende selskaper for sivile og straffesaker.

 

* Oversettelse ved Google Oversettelse, se lenke tidlig i artikkel.

Først publisert 28. januar 2022.

Forfatter på maskinlæring, domeneekspert på menneskesynthese. Tidligere leder for forskningsinnhold på Metaphysic.ai.