Menneskelig kunst ved kunstig intelligens

Menneskelig kunst ved kunstig intelligens

Det følgende er et uddrag af Du ligner en ting, og jeg elsker dig: Hvordan kunstig intelligens fungerer, og hvorfor det gør verden til et mærkeligere sted af Janelle Shane. Lyt til et radiointerview med Janelle Shane om de fejl, kunstig intelligens kan begå.


Algoritmisk kreativitet?

Vil fremtidens musik, film og romaner blive skrevet af AI? Måske i det mindste delvist.
AI-genereret kunst kan være slående, mærkelig og foruroligende: tulipaner, der ændrer sig uendeligt; glitchy mennesker med halvsmeltede ansigter; himlen fuld af hallucinerede hunde. PÅ. rex kan blive til blomster eller frugt; det Mona Lisa kan tage et fjollet grin; et klaverriff kan blive til en elektrisk guitarsolo. AI-genereret tekst kan antage kvaliteten af ​​surrealistisk performancekunst.



Når du bliver bedt om det med følgende tekst: 'Mine 10 yndlingsdyr er: I.' det neurale netværk GPT-2 tilføjede denne liste:

|_+_|
  1. |_+_|
  2. |_+_|
  3. |_+_|
  4. |_+_|
  5. razorbill med vinger hængende omkring 4 inches fra ens ansigt og en hjerte tatovering på en frø.

Læs bogen: Du ligner en ting, og jeg elsker dig: Hvordan kunstig intelligens fungerer, og hvorfor det gør verden til et mærkeligt sted

Købe

Ligesom AI-problemløsning kunne AI-kreativitet nok bedst beskrives som 'AI-støttet.'

For at et GAN kan producere et maleri, skal det først have et datasæt, og et menneske vælger, hvad det datasæt skal være. Nogle af de mest interessante GAN-resultater opstår, når kunstnere giver algoritmerne deres egne malerier eller deres eget fotografi at lære af. Kunstneren Anna Ridler brugte for eksempel et forår på at tage ti tusinde billeder af tulipaner, og brugte derefter sine billeder til at træne en GAN, der producerede en endeløs række af næsten fotorealistiske tulipaner, hver tulipans stribelighed knyttet til prisen på Bitcoin. Kunstneren og softwareingeniøren Helena Sarin har produceret interessante GAN-remixer af sine egne akvareller og skitser, og omdannet dem til kubistiske eller underligt teksturerede hybrider. Andre kunstnere bliver inspireret til at vælge eksisterende datasæt som renæssanceportrætter eller landskaber i det offentlige domæne og se, hvad en GAN kan lave med dem. At kurere et datasæt er også en kunstnerisk handling, tilføje flere malestile, og en hybrid eller beskadiget kunst kan resultere. Beskær et datasæt til en enkelt konsistent vinkel, stil eller type belysning, og det neurale net vil have lettere ved at matche det, det ser, for at producere mere realistiske billeder. Start med en model, der er trænet på et stort datasæt, og brug derefter transfer learning til at fokusere på et mindre, men mere specialiseret datasæt, for at få endnu flere måder at finjustere resultaterne på.

Folk, der træner tekstgenererende algoritmer, kan også kontrollere deres resultater via deres datasæt. Science fiction-forfatteren Robin Sloan er en af ​​få forfattere, der eksperimenterer med neurale netværksgenereret tekst som en måde at injicere noget uforudsigelighed i hans forfatterskab. Han byggede et brugerdefineret værktøj, der reagerer på hans egne sætninger ved at forudsige den næste sætning i sekvensen baseret på dens viden om andre science fiction-historier, videnskabsnyhedsartikler og endda bevaringsnyhedsbulletiner. Demonstrerer sit værktøj i et interview med New York T jeg m og s , Sloan fodrede den med sætningen 'Bisonerne er samlet omkring canyonen', og den svarede med 'ved den bare himmel.' Det var ikke en perfekt forudsigelse i den forstand, at der var noget mærkbart galt ved algoritmens sætning. Men til Sloans formål var det dejligt underligt. Han havde endda afvist en tidligere model, han havde trænet på 1950'erne og 1960'ernes science fiction-historier, og fandt dens sætninger for klichéfyldte.

Ligesom at indsamle datasættene er træning af AI en kunstnerisk handling. Hvor længe skal træning vare? En ufuldstændig trænet AI kan nogle gange være interessant, med mærkelige fejl eller forvansket stavning. Hvis AI'en sætter sig fast og begynder at producere forvansket tekst eller mærkelige visuelle artefakter som multiplikation af gitter eller mættede farver (en proces kendt som modekollaps), skal træningen så starte forfra? Eller er denne effekt lidt cool? Som i andre applikationer skal kunstneren også se for at sikre, at AI ikke kopierer sine inputdata for tæt. Så vidt en AI ved, er en nøjagtig kopi af dens datasæt lige hvad den bliver bedt om, så den vil plagiere, hvis den overhovedet kan.

Og endelig er det den menneskelige kunstners opgave at kurere AI'ens output og gøre det til noget værd. GAN'er og tekstgenererende algoritmer kan skabe praktisk talt uendelige mængder af output, og det meste af det er ikke særlig interessant. Noget af det er endda forfærdeligt, husk på, at mange tekstgenererende neurale net ikke ved, hvad deres ord betyder (jeg ser på dig, neurale net, der foreslog at navngive katte Mr. Tinkles og Retchion). Når jeg træner neurale net til at generere tekst, er kun en lille brøkdel - en tiendedel eller en hundrededel af resultaterne værd at vise. Jeg kuraterer altid resultaterne for at præsentere en historie eller et interessant punkt om algoritmen eller datasættet.

Det er den menneskelige kunstners opgave at kurere AI'ens output og gøre det til noget værd.

I nogle tilfælde kan kurering af output fra en AI være en overraskende involveret proces. Jeg brugte BigGAN i kapitel 4 til at vise, hvordan billedgenererende neurale net kæmper, når de trænes på billeder, der er for varierede - men jeg talte ikke om en af ​​dens fedeste funktioner: at generere billeder, der er en blanding af flere kategorier.

Tænk på 'kylling' som et punkt i rummet og 'hund' som et punkt i rummet. Hvis du tager den korteste vej mellem dem, passerer du andre punkter i rummet, der er et sted mellem de to, hvor hønsehunde har fjer, floppy ører og slyngende tunger. Start ved 'hund' og rejs mod 'tennisbold', og du vil passere gennem et område med uklare grønne kugler med sorte øjne og næser, der kan boopes. Dette enorme multidimensionelle visuelle landskab af muligheder kaldes latent rum. Og da BigGANs latente rum var tilgængeligt, begyndte kunstnere at dykke ind for at udforske. De fandt hurtigt koordinater, hvor der var overfrakker dækket af øjne og trenchcoats dækket af fangarme, hundefugle med kantet ansigt med begge øjne på den ene side af deres ansigter, billede perfekte hobbitlandsbyer komplet med udsmykkede afrundede døre og flammende svampeskyer med munter hvalp ansigter. (ImageNet har mange hunde i sig, som det viser sig, så BigGAN's latente rum er også fyldt med hunde.) Metoder til at navigere i latent rum bliver i sig selv kunstneriske valg. Skal vi rejse i lige linjer eller kurver? Skal vi holde vores lokaliteter tæt på vores oprindelsespunkt eller tillade os selv at bevæge os ud i ekstreme fjerne hjørner? Hver af disse valg påvirker drastisk, hvad vi ser. De temmelig utilitaristiske kategorier af ImageNet blander sig i fuldstændig underlighed.

Er al denne kunst AI-genereret? Absolut. Men er AI det, der laver det kreative arbejde? Ikke ved et langt skud. Folk, der hævder, at deres AI'er er kunstnerne, overdriver AI'ernes muligheder - og sælger kort deres egne kunstneriske bidrag og dem fra de mennesker, der har designet algoritmerne.


Uddrag fra DU LIGNER EN TING, OG JEG ELSKER DIG: HVORDAN KUNSTIG INTELLIGENS FUNGERER, OG HVORFOR DET GØR VERDEN TIL ET MERE STED COPYRIGHT 2019. Tilgængelig fra Voracious, et aftryk fra Hachette Book Group, Inc.