Sztuczna inteligencja (AI) to technologia, która coraz częściej i skuteczniej potrafi tworzyć obrazy na podstawie opisów (tzw. promptów), szkiców, czy nawet niewielkich fragmentów zdjęć. Niektóre z tych obrazów są coraz bardziej realistyczne i przekonujące, że trudno je odróżnić od prawdziwych fotografii. Czy to oznacza, że sztuczna inteligencja może zagrozić pracy i pasji wielu fotografów? Czy nadchodzi czas, kiedy aparaty fotograficzne staną się zbędne, a zdjęcia będą tworzone przez algorytmy? Czy fotografia jako sztuka i sposób wyrażania się straci na znaczeniu i wartości?
W tym poście postaram się odpowiedzieć na te i inne pytania, analizując możliwości i ograniczenia sztucznej inteligencji w dziedzinie fotografii. Przyjrzymy się, jak sztuczna inteligencja wpływa na różne rodzaje fotografii, takie jak fotografia stockowa, produktowa, krajobrazowa, portretowa, czy artystyczna. Zobaczymy, jakie są zalety i wady korzystania ze sztucznej inteligencji do tworzenia obrazów. Spróbujemy też przewidzieć, jak sztuczna inteligencja może zmienić rynek i kulturę fotograficzną w przyszłości.
Czy AI może zostać fotografem?
Pół roku temu nagrałem odcinek na moim kanale na YouTube i rozważałem taki temat jak: „Czy AI może zostać fotografem?”
Zapraszam Cię do obejrzenia tego odcinka, a dziś rozwinę ten temat pod kątem tego jaki AI może mieć wpływ na rynek pracy fotografa i czy wszyscy musimy pakować się już do domu?
Jak AI tworzy obrazy na podstawie opisów, szkiców lub fragmentów zdjęć?
Sztuczna inteligencja (AI) to technologia, która potrafi nauczyć się tworzyć obrazy na podstawie różnych danych wejściowych, takich jak opisy tekstowe, szkice, czy fragmenty zdjęć. Aby to zrobić, sztuczna inteligencja wykorzystuje specjalne modele matematyczne, które potrafią analizować, generować i optymalizować obrazy. Aby stworzyć takie obrazy, sztuczna inteligencja musi mieć bazę danych (w postaci dobrze opisanych zdjęć), z których będzie się uczyć i wiedzieć, że „kot” to kot.
Dall-e
Jednym z popularnych modeli AI do tworzenia obrazów na podstawie opisów jest DALL-E, stworzony przez firmę OpenAI. DALL-E jest oparty na sieci neuronowej, która uczy się na podstawie wielu przykładów obrazów i tekstów znalezionych w Internecie. Dzięki temu, DALL-E potrafi zinterpretować dowolny opis tekstowy i wygenerować obraz, który pasuje do niego. Na przykład, jeśli wpiszemy „kot w kapeluszu”, DALL-E stworzy obraz kota w kapeluszu, a jeśli wpiszemy „kot w kapeluszu na księżycu”, DALL-E stworzy obraz kota w kapeluszu na księżycu.
Adobe Firefly
Innym modelem AI do tworzenia obrazów jest Adobe Firefly, stworzony przez firmę, która tworzy Photoshopa – najpopularniejsze narzędzie wykorzystywane przez fotografów i grafików. Adobe Firefly jest oparty na technologii GAN (generative adversarial network), która polega na współpracy dwóch sieci neuronowych: jedna tworzy obrazy, a druga ocenia ich jakość. Dzięki temu, Adobe Firefly potrafi zamienić proste szkice lub fragmenty zdjęć w realistyczne obrazy, naśladując różne style malarskie, takie jak akwarela, olej, czy pastel.
Adobe Firefly wydaje się być najskuteczniejszym AI do tworzenia obrazów, ponieważ używa bazy danych z Adobe Stock, które przecież mają tysiące zdjęć opisanych słowami kluczowymi w metadanych. Tym sposobem, sztuczna inteligencja wie, co przedstawia dany obrazek i może takie obrazki „interpretować”.
Co to są GAN’y?
Zapraszam do obejrzenia mojego filmiku na YouTube, który stworzyłem omawiając czym są GAN’y.
Inne AI tworzące obrazy
Mamy także popularny MidJourney czy getimg, który sam używam, i który można zaprogramować (nauczyć) by generował obrazy z wykorzystaniem Twojej twarzy bądź przedmiotu.
Oczywiście mówimy tu o stanie na rok 2023. Jednak technologia się ta rozwija, sztuczna inteligencja się uczy, a więc kwestią czasu będzie aż obrazy staną się jakościowo lepsze i 'bezbłędne’ (np. ręka z 7 palcami).
Jakie są zalety i wady korzystania z AI do tworzenia obrazów?
Zalety:
- AI może tworzyć obrazy na podstawie dowolnych opisów, szkiców, czy fragmentów zdjęć, co daje użytkownikom dużą swobodę i kreatywność. Teraz nawet w Photoshopie jest funkcja, która pozwala za pomocą sztucznej inteligencji zmieniać fragmenty obrazu na inne, według podanego opisu. Bardzo rozszerza to możliwości użytkowania takiego narzędzia.
- AI może tworzyć obrazy w różnych stylach malarskich, takich jak akwarela, olej, czy pastel, co pozwala na uzyskanie ciekawych i oryginalnych efektów. Przydatne np. gdy chce się stworzyć logotyp swojej firmy.
- AI może tworzyć obrazy szybko i łatwo, a w niektórych wypadkach za darmo, co oszczędza czas i wysiłek użytkownikom, którzy nie mają umiejętności graficznych lub dostępu do profesjonalnych narzędzi. Bardzo przydatne gdy chcę się tworzyć obrazy do swojego biznesu, na bloga, okładki na płyty muzyczne czy książki, czy jako ikony na YouTube, a nie ma się budżetu.
- AI może tworzyć obrazy wysokiej jakości i rozdzielczości, co zapewnia dobrą prezentację i estetykę.
- Każdy może poczuć się „Artystą”.
Wady:
- AI może tworzyć obrazy, które naruszają prawa autorskie, prawo do wizerunku, czy etykę, jeśli nie są sprawdzane i filtrowane przez użytkowników. Ten punkt omówię szerzej w dalszej części postu.
- AI może tworzyć obrazy, które są niezgodne z rzeczywistością, niepoprawne lub nieadekwatne, jeśli nie są poprawiane i dopasowywane przez użytkowników. To akurat kwestia czasu, aż sztuczna inteligencja przestanie generować 7 palców u dłoni czy dodatkowe kończyny.
- AI może tworzyć obrazy, które są nudne, powtarzalne lub niewyraźne, jeśli nie są urozmaicane i dopracowywane przez użytkowników – odkąd ludzie zaczęli bawić się sztuczną inteligencją, Internet został zalany jeszcze większą ilością zdjęć niż gdy fotografia cyfrowa stała się ogólnodostępna. Ja sam już czuję lekkie znudzenie tego typu obrazkami – po prostu się nimi nasyciłem. Nie zachwycam się już nimi jak pół roku temu, gdy sam eksplorowałem możliwości sztucznej inteligencji.
- AI może tworzyć obrazy, które zagrażają pracy i pasji wielu fotografów, grafików i artystów, jeśli nie są doceniane i szanowane przez użytkowników. Ten punkt omówię szerzej w dalszej części tego postu.
- Każdy może poczuć się „Artystą” – jest to wada i zaleta, ponieważ Artyści spędzają wiele lat na ćwiczeniu swojej estetyki i warsztatu, a wpisanie promptu, który wygeneruje całkiem przyzwoity obrazek zajmuje kilka minut. Z resztą można użyć innej sztucznej inteligencji stworzonej stricte do zadań tekstowych – by wygenerował taki prompt. No i trudno powiedzieć, czy wygenerowany obrazek przez sztuczną inteligencję jest tak na prawdę Twoim obrazkiem czy nie. Ja osobiście mam opory by z dumą stwierdzić i pochwalić się, że namalowałem obrazek, który został wygenerowany za pomocą AI. Po prostu czuję, że to nieuczciwe.
Jakie są etyczne i prawne aspekty korzystania z AI do tworzenia obrazów?
Kwestie prawa autorskiego
Warto zadać sobie pytanie: Kto jest autorem obrazka, które zostało wygenerowane przez sztuczną inteligencję?
I tu zależy to od przypadku. W jednym jest to firma, która zaprojektowała maszynę, zgodnie z regulaminem, który trzeba było zaakceptować podczas zakładania konta w serwisie. W innym wypadku jest to użytkownik, który napisał prompt, co też jest przedstawione w regulaminie korzystania ze sztucznej inteligencji. A czasami to nie jest do końca jasne i zależy od jurysdykcji gdzie znajduje się firma, która udostępnia usługę.
Są też głosy sprzeciwu, że część praw autorskich może należeć do autorów obrazów, którymi posłużyła się sztuczna inteligencja w procesie nauki. Ale trudno to stwierdzić, z których konkretnie obrazów sztuczna inteligencja się uczyła, no i czy w ogóle nie może tego robić. Bo przecież, człowiek też ogląda setki czy tysiące obrazów, które w głowie mieli i poszczególne elementy implementuje w swoje dzieła. Często zdarza się tak, że trzeba coś zobaczyć najpierw, by to później powtórzyć, a następnie zmienić – pod swoje dzieło.
Prawo wizerunku
Jeżeli ja mogłem nauczyć sztuczną inteligencję swojej twarzy, na podstawie ok. 30 zdjęć mnie samego – to samo może zrobić każdy, z każdym człowiekiem, który jest rozpoznawalny – czyli jest osobą publiczną. Wtedy ilość zdjęć w Internecie, aby nasycić bazę danych pod naukę sztucznej inteligencji jest gigantyczna.
Wystarczy spojrzeć na materiał poniżej jako przykład:
Więc mamy zdjęcia papieża Franciszka z karabinem, w stroju Balenciaga, itd. Nie ma więc problemu by wygenerować papieża Franciszka w niekorzystnej dla niego sytuacji – jego czy jakiejkolwiek innej znanej globalnie postaci. Jeżeli zdjęcie pójdzie w świat, należy się zastanowić jakie szkody dla danego człowieka może wyrządzić taki obrazek. A w konsekwencji od sytuacji, jak taki obrazek może wyrządzić szkodę dla społeczeństwa.
A co w przypadku publikacji prawdziwych zdjęć? Społeczeństwo może zakwestionować prawdziwość prawdziwego zdjęcia, sądząc, że to sprawka sztucznej inteligencji i jakiegoś trolla. Wydaje się, że siła fotografii może gasnąć, przez kwestionowanie jej prawdziwości z obu stron.
I tu przechodzimy do:
Odpowiedzialność za treść i wiarygodność informacji
Wyobraźmy sobie sytuację gdzie światowej sławy polityk ogłasza coś, co początkuje światowy konflikt, np. nuklearny. A później okazuje się, że to było nagranie DEEP FAKE, stworzone przy pomocy sztucznej inteligencji, które stało się viralem. Możemy mieć nadzieje, że w takim wypadku zaadresowana strona będzie działać rozważnie i postara się zweryfikować takie nagranie czy informację. W przeciwnym wypadku jesteśmy o krok przed wojna nuklearną i gigantyczną tragedią.
Trochę na śmieszno:
Bardziej na poważnie:
Niestety uważam, że kwestią czasu będzie aż możemy się znaleźć właśnie w sytuacji gdzie będziemy o krok, od poważnego kryzysu spowodowanego przez Deep Fake, czy obrazy wygenerowane przez sztuczną inteligencję. Fotografia jest wykorzystywana jako narzędzie, które z założenia przedstawia rzeczywistość i to, co rzeczywiste – przez swoje wierne odwzorowanie – jeszcze za czasów Daguerre’a czy Talbota. Piszę o tym m.in. tutaj: Ewolucja Sztuki Światłoczułej: Od Camera Obscura do Fotografii Daguerre’a czy innych postach związanych z Dagerotypią.
Może się okazać, że w sprawach sądowych, ktoś mógłby wykorzystać fałszywe dowody, np. zdjęcia wygenerowane przez sztuczną inteligencję, aby potwierdzić swoją tezę podczas rozprawy.
Przykładów może być sporo i trudno nawet przewidzieć, co, gdzie i jak.
Social Media
Jeżeli myślałeś, że Social Media nie mogą okazać się bardziej nieautentyczne przez kreowane wrażenia lifestyle’i tworzonych przez influencerów na Instagramie czy innych Social Media – to teraz nadchodzi kolejny level. Sztuczna inteligencja już działa na smartfonach i potrafi lepiej wygładzić skórę twarzy niż dawne filtry, odchudzić czy dodać mięśni. Nie zdziwiłbym się, gdybyś szukał dziewczyny na Tinderze, która na zdjęciach wygląda jak milion dolarów, a w realu to zupełnie nie ta osoba. Tak samo jak rano, gdy się budzisz w jej pokoju, po nakrapianej nocy, gdy ona wychodzi z toalety bez makijażu.
To staje się jeszcze większym wyzwaniem w perspektywie co dziś jest prawdziwe i autentyczne w naszym świecie.
Jeżeli prognozy staną się faktem, że Metaverse wejdzie w nasze życie, a młodzi ludzie będą tam spędzali większość swojego czasu, to człowiek zostanie zawieszony między dwoma światami i będzie miał dwa oblicza.
Jedno metaversowe, gdzie jest doskonały, taki jaki pragnie.
Drugie rzeczywiste, gdzie może nie akceptować swoich wad i tego kim jest.
Hipotetyczna sytuacja
Alex. Dziewczyna z Instagrama, którą możesz spotkać w Metaverse. Świetnie Ci się z nią rozmawia, jest zabawna, jej avatar ma fajne, śliczne ciałko. Pojawia się „chemia”. Chcesz czegoś więcej.
Może kiedyś się okazać, że po latach wychodzi na jaw, że Alex, to facet o imieniu Aleksander.
A co w tym kontekście z dzieciakami? Nie będzie problemu wygenerować kilku zdjęć tej samej małej koleżanki, by móc przekonać dziecko, że jest jej/jego rówieśniczką, i że w sumie możemy się gdzieś razem „pobawić”.
Ciarki przechodzą prawda?
Regulacje prawne
Myślę, że kwestią czasu jest aż powstaną regulacje prawne, wskutek jakiejś skrajnej – w skali światowej – akcji przy użyciu sztucznej inteligencji typu Deep Fake. Nie zdziwiłoby mnie, gdyby się okazało, że treści generowane za pomocą sztucznej inteligencji, będą musiały być w jakiś sposób sygnowane, że zostały wygenerowane przy pomocy sztucznej inteligencji – pod karą grzywny lub więzienia.
Inną sprawą będzie musiała być społeczna dyskusja na temat tej obiecującej, ale niosącej pewne zagrożenia technologii.
Jak AI może zmienić rynek i kulturę fotograficzną w przyszłości?
Jestem zdania, że sztuczna inteligencja nie wyprze, nie zlikwiduje całkowicie zawodu fotografa. Tu jestem spokojny.
Jednak sztuczna inteligencja sprawi, że część fotografów będzie musiała się przestawić na coś innego lub samemu zająć się pracą ze sztuczną inteligencją i obrazem.
Myślę, że fotografowie, którzy tworzą stocki, mogą zostać zredukowani. Zostaną najbardziej oryginalni. Reszta zacznie być Inżynierami promptów – będą generowali obrazki do stocków.
Z resztą to już się dzieje – przez moment obserwowałem gościa na Instagramie, który publikował piękne minimalistyczne zdjęcia „budynków” w Niemczech, z kolorowymi drzwiami i małymi drzewkami – w sam raz na obrazek na ścianie. Takie obrazki szły do druku i w ramę. Z początku myślałem, że to zdjęcia, ale gdy dowiedziałem się, że obrazki zostały wygenerowane, poczułem się zawiedziony i opuściłem profil, szukając czegoś oryginalniejszego.
Fotograficy, którzy przy pomocy fotografii tworzą grafiki dla klientów też mogą oberwać, ale nadzieją dla nich może być przestawienie się na obsługę sztucznej inteligencji i pisanie promptów (j.w.), dzięki którym będą otrzymywać wymagane obrazy.
Już dziś mamy wtyczki do Photoshopa (pomijając samą funkcję AI Generative fill), które szybciej retuszują skórę, poprawiają ciało i ubiór. To znacznie ułatwia pracę i redukuje koszta, a nawet otwiera wcześniej trudniej dostępną gałąź retuszerską (wcześniej trzeba było coś umieć, czegoś się nauczyć, mieć tablet wacom’a by zrobić fajny dobry retusz, a teraz wystarczy kilka kliknięć).
Są Artyści, którzy tworzą swoje dzieła przy pomocy sztucznej inteligencji – np. dodając do rzeczywistych zdjęć elementy graficzne wygenerowane przez sztuczną inteligencję. I słusznie byłoby nazywać to mixed-art jako sztukę mieszaną – przy użyciu różnych narzędzi.
Jednym z takich artystów jest Michael Vincent Manalo:
https://www.facebook.com/MVMArtworks
Wszystko to, co można robić taśmowo, co jest powtarzalne na swój sposób, co można zautomatyzować – tam będzie dominowała sztuczna inteligencja i te aspekty pracy fotografa są zagrożone.
Nadzieją jest autentyczność
Jest i dobra wiadomość.
W perspektywie wojny z podróbkami i imitacją w fotografii – prognozuję, że wyjściem z sytuacji będzie autentyczność – podobnie jak w świecie Social Mediów zresztą.
Fani sztucznej inteligencji zawsze się znajdą i dużo ludzi będzie się cieszyć jej tworami.
Ale Ci, którzy będą pragneli quality over quantity, będą szukali rzeczy wyjątkowych.
Prawem popytu i podaży część gałęzi zostanie zdominowana przez sztuczną inteligencję i tak już zostanie, ale w przesycie i zalewie tymi obrazami, jak i łatwości w generowaniu takich obrazów, użytkownicy, konsumenci, będą szukali czegoś oryginalnego, niż to, co tak łatwe jest i dostępne.
Sztuczna inteligencja, zrobi obraz na Instagram czy na LinkedIn, zaraz po tym jak przeskanuje 30 selfików naszej twarzy.
Ale sztuczna inteligencja nie zrobi sesji sensualnej, ślubu, nie da przede wszystkim doświadczenia i fun’u z sesji (a czasami przecież sesje są po to, aby osoba portretowana poczuła się szczególnie). Nie da też autorskiego podejścia, które tylko da fotograf.
Podobnie w reportażu czy dokumencie – sztuczna inteligencja nie zrobi reportażu na miejscu zdarzenia wypadku, czy artykułu nt. np. Śląskich cyganów – gdzie trzeba dłuższego procesu aby taki temat zrealizować. Tam gdzie ważna będzie autentyczność, tam sztuczna inteligencja nie da rady. Ponieważ sztuczna inteligencja nie istnieje w świecie fizycznym, a cyfrowym. Może kiedyś, gdy będziemy mieli roboty czy androidy, czy humanoidy – to wtedy jest szansa, że śluby nie będą realizować ludzie. Ale… kiedy to będzie…?
Ale znów, część zleceniodawców – ludzi – będzie chciała, aby to człowiek robił zdjęcia na ich ślubie, a nie maszyna. Wystarczy posłuchać ilu ludzi jest sceptycznie nastawionych wobec nowych technologii czy technologii w ogóle. Młodsze pokolenia możliwe, żeby weszły w taki deal, ponieważ są bardziej zżyci z technologią niż moje pokolenie – np. z ciekawości, czy aby pochwalić się, że im ślub robiła sztuczna inteligencja i paaa, jakie to faajne. Jednak odbiorca ostateczny nie jest robotem i perfekcyjne mechaniczne wykonanie będzie dla nas nienaturalne, tak samo jak bity muzyczne robione maszynowo – gdzie specjalnie przestawia się o frakcję sekundy uderzenia bębnów czy talerzy aby „wydawało” nam się naturalne.
Uważam też, że osoba, która będzie pisać prompty (czyli będzie programować sztuczną inteligencję celem uzyskania jakiegoś obrazu), a nie będzie miała wiedzy nt. sztuki, nie zobaczy tysięcy obrazów, nie zna się na kompozycji, na barwie, na symbolice – nie będzie w stanie tak dobrze używać sztucznej inteligencji, jak fotograf czy grafik. To odsuwa część osób z ulicy, z puli twórców cyfrowych.
Ale jest druga strona medalu, bo są odbiorcy, którzy chcą kogoś na poziomie good enough, na zasadzie: przyjdź cyknąć kilka foteczek na urodzinach mojej cioci za kawusię i dasz se do portfolio, elo.
Jakie nastroje na przyszłość?
Umówmy się, fotografowie to nie jedyny zawód, który stoi pod znakiem zapytania w obliczu zmian technologicznych związanych ze sztuczną inteligencją.
Wciąż jestem zdania, że fotografowie wciąż będą robić zdjęcia, choć pewnie nie wszyscy, albo będą musieli przesiąść się na inną gałąź, zmienić styl pracy. Warto jednak, moim zdaniem, wcześniej zacząć interesować się generowaniem obrazów przez sztuczną inteligencję, czy używaniem jej do modyfikacji swoich, aby nie zostać w tyle, gdy rzesze konkurencji będą chciały… czy musiały dostosować się do rynku.
Używanie sztucznej inteligencji przyspieszy workflow, obniży ceny i udostępni możliwości ludziom z poza branży. Ale człowiek bez odpowiedniej wiedzy i wykształcenia oraz umiejętności, z narzędziem, do końca nie będzie wiedział jak zmaksymalizować wyniki używania tego narzędzia.
Na razie mamy wolną amerykankę jeżeli chodzi o używanie sztucznej inteligencji. Ale prędzej czy później pojawią się regulacje, a przyspieszy to, gdy nie daj Boże, będziemy mieli incydent przy użyciu Deep Fake.
Z mojej perspektywy, w czasach gdzie trudno szukać autentyczności (np. w Social Media), to właśnie autentyczność będzie na wagę złota. Pewnie wszyscy się zachłyśniemy tą obiecującą technologią, ale od przesytu wrócimy do jakiegoś stopnia, do tego, co było kiedyś.