Kontrowersje wokół Stable Diffusion, Midjourney i DALL-E – komu przysługują prawa autorskie do dzieł stworzonych przy użyciu sztucznej inteligencji?

Prompt: scene with two characters, one is an artist and the other is a robot, they are in love and happy, they shine softly, rembrandt style, wygenerowane przez autorkę artykułu przy użyciu Stable Diffusion.

Sztuka sztucznej inteligencji.

Za jeden z pierwszych istotnych generatorów obrazów uważany jest ARRON, będący zbiorem programów komputerowych stworzonych przez artystę Harolda Cohena w latach 1972-2010.

Jego motywacja była potężna – Cohen postrzegał AARONa jako przedłużenie samego siebie, gdyż chciał być pierwszym artystą w historii, który będzie miał pośmiertną wystawę nowych prac. W tym momencie wszyscy prawnicy na sali mdleją lub krzyczą „to nie możliwe, gdyż to się w głowie nie mieści!”. Niemożliwe okazało się jednak możliwe i ku konsternacji wielu rozwija się w astronomicznym tempie.

AARON został zaprojektowany by tworzyć obrazy na żądanie, bez żadnych konkretnych instrukcji. W tym celu,  Cohen zaprogramował AARONa tak, by ten mógł operować technikami malarskimi, które pozwalają maszynie mieszać farby i nakładanie je na płótno. Wyposażył go również w wystarczającą wiedzę o podstawowych formach, aby maszyna mogła malować obrazy przedstawiające martwą naturę i portrety ludzi bez potrzeby korzystania ze zdjęć lub innych odniesień. W rezultacie, AARON mógł tworzyć obrazy samodzielnie, często podczas snu Cohena, i nie wymagał żadnych instrukcji odnośnie tego, co ma namalować lub jakich kolorów użyć. Można powiedzieć, że sam AARON w swojej istocie jest projektem artystycznym ekscentrycznego artysty malującym obrazy „za niego”, jednostkowym przypadkiem nie mającym większego znaczenia dla ogółu społeczeństwa.  Nic bardziej mylnego. Od czasu jego powstania obserwujemy dynamiczny rozwój „narzędzi” pozwalających na przyspieszenie i usprawnienie procesów twórczych – począwszy od popularnych programów takich jak Photoshop a skończywszy na generatorach obrazów takich jak DALL-E, które dopiero wchodzą do powszechnego użycia.

Wszyscy wskazują na konieczność wprowadzenia nowych przepisów w celu dostosowania obowiązującego prawa do nowych technologii, jednakże w międzyczasie wciąż mnożą się pytania dotyczące autorstwa dzieł powstałych przy użyciu generatorów AI i ich ochrona prawnoautorską.

W celu odpowiedzi na to pytanie należy na początku określić co dokładnie podlega ochronie prawnoautorskiej, następnie zaś wskazać na zasady pozwalające na określenie autora, któremu takie prawa przysługują.

Kiedy dzieło podlega ochronie prawnoautorskiej?

Zgodnie z prawem obowiązującym w Unii Europejskiej i orzecznictwem Trybunału Sprawiedliwości Unii Europejskiej, stworzona przez człowieka praca artystyczna jest objęta ochroną prawnoautorską jeżeli jest oryginalna, zachowuje minimalny poziom „kreatywności”, oraz została ustalona np. w formie cyfrowej (ochrona nie obejmuje nieustalonych pomysłów). Wymóg „oryginalności” jest spełniony, jeżeli autor mógł wyrazić swoje zdolności twórcze przy tworzeniu utworu, dokonując swobodnych i twórczych wyborów. Jednocześnie nie wydaje się on jednak wymagać, aby twórczość lub osobowość autora („osobiste piętno”) były obiektywnie dostrzegalne w powstałym utworze. Z powyższego wynika, że wystarczy, aby przyszli autorzy korzystali ze swoich wolnych i twórczych wyborów i w ten sposób wyrażali swoją osobowość (Sprawa o sygn. akt: C-145/10 – Eva-Maria Painer (2011); Sprawa o sygn. akt:  C-604/10 – Football Dataco Ltd i Inni v. Yahoo! UK Ltd Inni (2012)).

Dotychczasowe sprawy z zakresu prawa autorskiego rozstrzygane przez TSUE nie dają zbyt wielu wskazówek, jak ocenić „kreatywnosc” i nie określają jej minimalnego standardu. Wymóg oryginalności lub twórczości nie pociąga za sobą testu wartości artystycznej lub jakości estetycznej, czy aspektu nowatorskości.

Dla niniejszego artykułu wielkie znaczenie ma przesłanka ekspresji – związana z ustaleniem utworu, oznaczająca, że twórczość człowieka ma być „wyrażona” w ostatecznym dziele. Wykorzystanie przez twórcę jego wolności twórczej musi być w jakiś sposób odczuwalne w wypowiedzi autora. TSUE wielokrotnie potwierdzał, że ekspresja jest warunkiem sine qua non ochrony praw autorskich. Autor musi być w stanie „wyrazić swoje zdolności twórcze przy tworzeniu utworu, dokonując swobodnych i kreatywnych wyborów” (Sprawa o sygn. akt: C-145/10 – Eva-Maria Painer (2011)). Utworem w rozumieniu dyrektywy 2001/29 może być „tylko coś, co jest wyrazem własnej twórczości intelektualnej autora” (Sprawa o sygn. akt: C-469/17 , Funke Medien NRW GmbH v Bundesrepublik Deutschland (2019)).

W/w wymóg ekspresji zakłada związek przyczynowy między aktem twórczym autora (korzystaniem z jego wolności twórczej) a jego wyrazem w postaci powstałego dzieła. Nadal  jednak pozostaje niejasne to, czy i w jakim stopniu oryginalne cechy takiego dzieła powinny być z góry założone lub z góry zaplanowane przez autora. Koncepcja utworu jako „własnej intelektualnej twórczości autora” zdaje się wymagać nie tylko ludzkiego działania lub interwencji, ale także pewnego stopnia autorskiej intencji.

Utwór musi być „stworzony” przez ludzkiego „autora”, a następnie „wyrażony”, to pojęcie to w oczywisty sposób nie może obejmować całkowicie przypadkowych dzieł natury, takich jak kształt kwiatu lub zastygłego strumienia lawy.

Powyższa definicja wydaje się przejrzysta, jednakże życie płata nam nieustannie niespodzianki, które stanowią wyzwanie dla pojęć, które do tej pory wydawały się oczywiste. Poniżej mogą Państwo podziwiać zdjęcie małpy, a dokładniej makaka, który miał ukraść aparat fotograficzny i zrobić sobie selfie:

Żródło: https://en.wikipedia.org/wiki/Monkey_selfie_copyright_dispute
Żródło: https://en.wikipedia.org/wiki/Monkey_selfie_copyright_dispute

Afera związana z publikacją tego zdjęcia podgrzała dyskusję o tym, co oznacza “ludzkie autorstwo”. Przypisywał je sobie właściciel aparatu fotograficznego, którym zrobione zostało zdjęcie – brytyjski fotograf przyrody David Slater. Seria sporów z jego udziałem miała miejsce w latach 2011-2018 i dotyczyła Wikimedia Commons i bloga Techdirt, gdzie udostępniano  zdjęcia, po ich publikacji w gazetach, w lipcu 2011 r. Dodatkowym smaczkiem była fantazyjna interwencja PETA, która twierdziła, że prawa autorskie należą się makakom.

Slater wywodził swoje prawa autorskie z faktu, że  to on stworzył sytuację, która zaowocowała zdjęciami, podróżując do Indonezji, zaprzyjaźniając się z grupą dzikich makaków i ustawiając swój sprzęt fotograficzny w taki sposób, aby powstało zdjęcie typu „selfie”. Wikimedia Foundation odmówiła zaś usunięcia w/w zdjęć z Wikimedia Commons stojąc na stanowisku, że prawa autorskie przysługują twórcy, że twórca niebędący człowiekiem nie może posiadać praw autorskich, a zatem zdjęcia znajdują się w domenie publicznej. W grudniu 2014 roku United States Copyright Office stwierdził, że utwory stworzone przez nie-człowieka, takie jak zdjęcie zrobione przez małpę, nie podlegają prawu autorskiemu.

Wielu ekspertów twierdzi, że o wyniku sprawy przesądziły wypowiedzi samego Slatera, który twierdził, że makak „musiał zrobić setki zdjęć do czasu, gdy odzyskałem swój aparat”, wskazując na to , że małpa ukradła sprzęt i wykorzystała go wedle swojego uznania. Potem wskazywał na inny przebieg zdarzeń, wedle którego małpy kradnące aparat były osobnym incydentem, który miał miejsce przed zrobieniem „selfies”, a przedmiotowe zdjęcia powstały przy użyciu aparatu na statywie, z bardzo szerokokątnym obiektywem, ustawieniami skonfigurowanymi tak, jak przewidujący autofokus, n lampa błyskowa, by uchwycić zbliżenie pyszczków bawiących się zwierząt.

Zmiana narracji ma ogromne znaczenie w związku ze wskazanymi powyżej wymogami dotyczącymi ekspresji twórczej. Gdyby fotograf intencjonalnie zaaranżował sytuację tak, by małpy mogły podejść do aparatu fotograficznego, nie musiałby stać za obiektywem by zostać uznanym za autora. Założenie twórcze osiągnięcia pewnego efektu i przygotowanie otoczenia w sposób umożliwiający jego osiągnięcie byłoby wystarczające do objęcia zdjęcia ochroną prawnoautorską. Inaczej rzecz się ma w przypadku w którym małpa z własnej nieprzymuszonej woli kradnie aparat, a zdjęcia są jedynie skutkiem zdarzenia w którego kreowaniu fotograf nie brał udziału. Sytuacja z małpą może wydawać się niektórym analogiczna do tej z dziełami wykreowanymi przez AI, jednakże nie należy zapominać o tym, że w drugim przypadku mamy do czynienia z sytuacją w całości wykreowana przez człowieka.

Czy AI może być autorem?

Powyższa koncepcja pociąga za sobą szereg konsekwencji dotyczących kwestii „autorstwa” maszyn. Podzielając zdanie wielu znamienitych przedstawicieli doktryny, stoję na stanowisku, że nawet najbardziej zaawansowane technologicznie maszyny są narzędziami ludzi, którzy je projektują lub ich używają. Pytanie o to, czy komputer może być autorem, jest zatem „złym” pytaniem; „właściwe” pytanie dotyczy tego, jak definiować prawa ludzi zaangażowanych w przygotowanie lub używanie maszyn, które „tworzą”. W niektórych przypadkach to osoba, która programuje i szkoli maszynę tak, aby wyprodukowała dzieło będzie podmiotem praw autorskich, w innych, będzie to ktoś kto co prawda używa takiej maszyny do procesu twórczego, lecz jest wystarczająco zaangażowany w koncepcję i wykonanie powstałego dzieła, aby rościć sobie prawo do autorstwa. Zdarzą się również sytuacje w których wkłady twórcze  projektanta i użytkownika będą równe, wobec czego staną się oni współautorami dzieła, lub tak znikome, że nikt nie będzie mógł być uznany za autora (J.C. Ginsburg and L.A. Budiardjo Authors and Machines Berkeley Technol Law J 34:343).

Oczywistym wydaje się, że dzieło powstałe przy użyciu kamery, nawet tej najbardziej wyszukanej jest wytworem jej operatora. Odmiennie sprawa się ma z efektami twórczości wygenerowanymi przez sztuczną inteligencję, które wciąż budzą wątpliwości.

Dzieje się tak, gdyż użytkownik AI  niekoniecznie jest autorem dzieła, dlatego, że projektant AI  wywiera większy twórczy wpływ na powstałe dzieło niż projektant typowego narzędzia (jak aparat fotograficzny). Idea maszyny generatywnej, jaką jest AI zakłada, że jest ona czymś więcej niż tylko zwykłym narzędziem, za pomocą którego użytkownik wyraża swoje pomysły. W przeciwieństwie do takich narzędzi, z których korzystanie odzwierciedla twórczy wkład ich użytkowników, rezultaty korzystania z narzędzi generatywnych mogą odzwierciedlać twórczy wkład projektanta narzędzia lub mogą odzwierciedlać spleciony twórczy wkład projektanta i użytkownika.

Należy przy tym pamiętać, że żadna maszyna, nawet ta będąca sztuczną inteligencją nie jest sama w sobie źródłem kreatywności. Bez wpływu na powyższe pozostają również sytuacje w których dzieło wygenerowane przy pomocy takiej maszyny zaskakuje ludzi, którzy ją zaprogramowali, wyszkolili lub obsługiwali.  Należy pamiętać, że każdy nieprzewidziany wynik pracy maszyny wynika bezpośrednio z jakiejś ludzkiej instrukcji w niej zaprogramowanej. Projektant AI może napisać skomplikowaną sieć kodu, który nakazuje maszynie analizować zbiór danych, „uczyć się” wzorców, a następnie wykorzystywać te wzorce do tworzenia wyników. Może on również zaprogramować proces imitujący przypadkowość, aby zróżnicować dane wyjściowe maszyny i jej procesy. Dzieło stworzone przy jej pomocy, nawet jeśli jest unikalne i całkowicie nieprzewidywalne, jest bezpośrednim rezultatem procesu zaprogramowanej maszyny, który z kolei jest nieuchronnie pomysłem jakiegoś ludzkiego twórcy lub użytkownika.

Przedstawiciele doktryny dopuszczają również możliwość powstania w takim procesie dzieł nie chronionych prawami autorskimi w przypadku w którym ani projektant AI ani użytkownik nie mają wpływu na kształt powstałego dzieła.

Alexander Calder, Stegosaurus, 1972, kolekcja: Ella Burr McManus Trust, źródło: Calder Foundation, https://calder.org/works/monumental-sculpture/stegosaurus-1972/
Alexander Calder, Stegosaurus, 1972, kolekcja: Ella Burr McManus Trust, źródło: Calder Foundation, https://calder.org/works/monumental-sculpture/stegosaurus-1972/

Powyższe powiązane jest z tzw. probelmem „czarnej skrzynki”. Generatywne AI są narzędziami swoich programistów lub swoich użytkowników, a zrozumienie lub możliwość wyjaśnienia tego, jak przebiegają ich wewnętrzne procesy nie jest warunkiem autorskiej kontroli nad narzędziem. Zrozumienie przez Jacksona Pollacka sił grawitacji i bezwładności nie ma znaczenia dla uznania autorstwa jego obrazów kroplowych. Fotograf nie musi rozumieć, jak jego aparat cyfrowy przekształca fotony w cyfrowe pliki graficzne, aby „kontrolować” aparat i tym samym być właścicielem praw autorskich do swoich zdjęć, a Alexander Calder nie musi w pełni rozumieć zawiłości spawania metalu, aby rościć sobie prawo do autorstwa swoich monumentalnych rzeźb, mimo że do ich wykonania potrzebuje biegłych spawaczy (J.C. Ginsburg and L.A. Budiardjo Authors and Machines Berkeley Technol Law J 34:343).

Kiedy dzieło stworzone z wykorzystaniem AI podlega ochronie prawnoautorskiej?

Aby korzystać z ochrony prawnoautorskiej, dzieło stworzone przy wykorzystaniu AI musi posiadać autora, który dokonał twórczych wyborów i które znajdują odzwierciedlenie w końcowym wyniku prac. W ich ocenie bierze się pod uwagę twórcze wybory w trzech fazach procesu produkcji: koncepcji, realizacji i redakcji.

Faza koncepcji obejmuje podejmowanie szeregu decyzji dotyczących dzieła, takich jak wybór  gatunku, stylu, materiału i techniki jego wykonania, jak również  wybór systemu AI, i „danych wejściowych”/ „promptu” (informacji potrzebnych AI do wygenerowania dzieła).


Faza realizacji  obejmuje przekształcenie projektu lub planu w wersje robocze dzieła. W tej fazie system AI będzie często odgrywał dominującą rolę w procesie twórczym, podczas gdy użytkownik będzie pełnił rolę operacyjną, nakierowując system AI w stronę pożądanego rezultatu. Wykorzystanie AI nie oznacza jednak, że w tej fazie podejmowanie kreatywnych wyborów przez użytkownika zostanie zawsze wykluczone.


Faza redakcji polega na przetwarzaniu i przerabianiu wersji roboczych w dzieło przed jego, np: formatowanie, redagowanie i inne działania „postprodukcyjne”. W przypadku działań wspomaganych przez AI, w tej fazie użytkownik będzie często dokonywał kreatywnych wyborów.

W każdej z w/w faz może zajść proces twórczy determinujący to, czy dane dzieło posiada autora i kto nim jest. Jako przykład dzieła, które prawdopodobnie nie posiada autora może posłużyć poniższy obrazek i proces jego wygenerowania:

Jest to grafika wykreowana przy użycia narzędzia Stable Diffusion po wpisaniu przeze mnie frazy (tzw. promptu) „confused lawer”.  Nie miałam koncepcji związanej z końcowym wynikiem prac, nie opisałam również w żaden sposób jak wyobrażam sobie skonfundowanego prawnika, nie dokonałam żadnych wyborów (np. dot. stylu, kolorystyki, postaci czy światła). Stable Diffusion jako AI zostało zaprojektowane w taki sposób, by „uczyło się” samo, więc można śmiało założyć, że jego twórcy również nie przyłożyli się do powstania tego konkretnego obrazka.

Czy process twórczy może zachodzić na etapie wprowadzania promptu? Moim zdaniem tak – jest to faza koncepcji. W praktyce, po ocenie osiągniętego wyniku, często modyfikujemy prompt w taki sposób, by grafika czyniła zadość naszym oczekiwaniom (faza realizacji).

Podczas w/w procesu użytkownik podejmuje szereg wyborów (moim zdaniem twórczych) mających decydujący wpływ na kształt końcowy dzieła. Im więcej wkładu twórczego w polecenie wydawane AI, tym bardziej prawdopodobne, że będzie autorem dzieła będącego efektem prac. Po prawej stronie widać obrazek, mogący ilustrować w/w sytuację, stworzony przeze mnie przy użyciu generatora DALL-E po wpisaniu Promptu: female lawer in a grey suit is brutally fighting using rubber chicken as a weapon with a humanoid robot from 60’s movies on a circus scene, in the background the audience consists of frightened CEO’s, clowns and famous painters cheering and shouting, situated on the top edge of the picture gods are wathing the fight sitting on a cloud softly glowing:

Czytajmy regulaminy.

W wypadku w którym uznamy, że dane dzieło posiada autora, którym może być użytkownik, lub twórca narzędzia, w celu uniknięcia wątpliwości można uregulować te kwestie za pomocą umowy, którą można zawrzeć również godząc się na warunki regulaminu korzystania z usługi AI. Jeżeli chcą Państwo wykorzystywać wygenerowane za pomocą AI dzieła w sposób komercyjny, warto przed rozpoczynaniem procesu twórczego, zapoznać się z regulaminem wybranej usługi. Poniże przedstawiam skrót z regulaminów najpopularniejszych generatorów AI aktualnych na moment publikacji tego wpisu.

DALL-E

W pierwszej wersji regulacji, właściciel oprogramowania – amerykańska spółka OpenAi LP zastrzegła sobie wszelkie prawa do obrazów generowanych przy pomocy DALL-E. Potem zmieniła podejście i dziś to użytkownik posiada pełne prawa do generowanych obrazów (bez względu na to, czy korzysta z wersji płatnej czy darmowej). Zgodnie z obowiązującym regulaminem, OpenAI przenosi na użytkownika wszelkie prawa do „materiałów wyjściowych”, z tym, że zastrzega sobie prawo do ich wykorzystywania w zakresie niezbędnym do świadczenia i utrzymania swoich usług, przestrzegania obowiązującego prawa i egzekwowania zasad użytkowania systemu DALL-E. Dodatkowo, aby pomóc OpenAI w świadczeniu i utrzymaniu Usług, użytkownik zgadza się na to, by wygenerowane przez niego treści były wykorzystywane do rozwijania i ulepszania Usług, jednakże może odwołać tę zgodę kontaktując się z support@openai.com.

MidJourney

Użytkownicy korzystający z darmowej wersji usług Midjourney mogą wykorzystywać stworzone przez siebie przy użyciu Ai dzieła na podstawie udzielonej im licencji Creative Commons Noncommercial 4.0 Attribution International License (https://creativecommons.org/licenses/by-nc/4.0/legalcode).

Użytkownik korzystający z płatnej wersji usługi jest właścicielem wszystkich stworzonych przez siebie przy użyciu AI dzieł, jednakże udziela Midjourney licencji, która pozwala innym na używanie i modyfikowanie tworzonych przy użyciu AI dzieł i promptów, gdy są one publikowane w przestrzeni publicznej. Domyślnie, wszystkie dzieła użytkowników są publicznie dostępne i można je modyfikować. Użytkownik korzystający z płatnych wersji usługi może ominąć niektóre z tych domyślnych ustawień udostępniania publicznego.

Stable Diffusion Online

Dzieła stworzone za pośrednictwem Stable Diffusion Online są w pełni open source (każdy może z nich korzystać), podlegając pod CC0 1.0 Universal Public Domain Dedication (No Copyright: https://creativecommons.org/publicdomain/zero/1.0/).

Powyższe przykłady w jaskrawy sposób pokazują jak bardzo różnią się prawa użytkowników korzystających z poszczególnych usług. W zależności od tego, czy chcemy użyć jakiejś grafiki jednorazowo – jak ja we wpisie na blogu, czy też dążymy do stworzenia czegoś, co będzie wykorzystane w sposób komenrcyjny (np. wyszukaną grafikę do komiksu), w wyborze narządzia powinniśmy uwzględnić również prawa do mających powstać dzieł.