Művészeti nyomozás az AI nyomában

Tippek, trükkök - 2024. április 11.

Írta: Prievara Tibor

Ma egy művészeti nyomozásra hívjuk a nyájas olvasót, természetesen az AI lesz ismét terítéken. Azon gondolkoztam, hogy a képgenerátorok használatát hogyan tudnám órán úgy megtanítani, hogy ezzel együtt - amellett, hogy szórakoztató is legyen az óra - segítse a diákokban a kritikus gondolkodás kialakulását (AI téren persze). Az eredmény egy remek kis óravázlat lett, amit akár részenként (elemekként, vagy ha úgy tetszik 'modulárisan') is lehet használni, hátha csak 10 percünk van rá.

Nyelvtanárként a képleírás igencsak fontos feladat. Egy kép, mint tudjuk, felér 1000 szóval, szóval a képek használatának értékajánlata igencsak pozitív és kecsegtető. Az AI erre is egy újabb szintet húzott fel, de amennyire pusztító ez a hatás, annyira lehet hasznos is, ha megtanuljuk megfelelően alkalmazni a tanórán.

Az óra elején képeket mutattam, ahol ki kellett találni, hogy ember vagy AI csinálta. Ez - az írás pillanatában - még elég könnyű volt, nem is kellett hozzá különösebb megfigyelő tehetség, felismerhetőek voltak a képek. Ezt úgy csináltam, hogy fogtam a hírekből vett képeket, és promptokat készítettem belőlük, így az AI-val gyakorlatilag legeneráltattam ugyanazokat a képeket . Ez még izgalmasabb volt így, hiszen először csak az egyiket vagy a másikat mutattam meg (AI vagy ember), beszélgetni kellett nekik róluk párban, majd mind az 5 képe esetében megnéztük a másik verziót is, és ezeket összehasonlítottuk).

A következő feladat az volt, hogy az eredeti 'emberi' képeket dolgozták fel párokban, kisebb csoportokban (5 kép volt összesen, minden csoportnak 1 jutott), és elmondtam nekik, hogyan készültek az AI verziók - úgy ti., hogy promptokat készítettem az eredeti kép alapján, és megpróbáltam reprodukáltatni az eredetit. Minden csoportnak az volt itt a feladata, hogy megírja a saját képéhez a promptokat, és megpróbáljon engem 'legyőzni', azaz jobban hasonlító képez készíteni az AI alkalmazással. Mindösszesen 2 lehetőséget kaptak, azaz nem engedtem, hogy sokáig promptolják a Microsoft Designer-t, mert elment vele az óra. Így remek, részletes, a lényeget összefoglaló promptok születtek, és ezeket aztán a Designer-rel el is készítették a diákok.

Ez természetesen egy újabb feladatot inspirált, hiszen a diákok spontán elkezdtek 'versenyezni', hogy kinek sikerült a legjobban a feladat. Ez kiváló vitához vezetett, ahol a kép mechanikus leírása mellett egyre nagyobb szerepet kapott a kép 'szellemisége'. vagyis hogy mire gondolhatott a művész :) Ezt, ha hagyom, önmagában elvitte volna az órát, élénk beszélgetésbe merült diákokkal.

De itt már engem is vitt a lendület, úgyhogy léptünk gyorsan tovább! Egy nyomozós játékot találtam ki, ahol nem volt elég 'holisztikusan' azt mondani, hogy 'ja, ez tuti AI', hanem megkértem a diákokat, hogy ezt próbálják megfogalmazni. Az összkép a részletekből áll össze, és egy kép AI-ságának azért vannak nagyon jól tetten érhető jelei. Íme egy lista, amelyben 10 olyan 'analitikusan' felismerhető jel van, ami lebuktathat egy AI-val készült képet:

1 Keressünk rendellenességeket a részletekben! Az AI gyakran hibázik apró részletekben, mint például a kéz ujjainak száma, vagy az arc szimmetriája. Egy generált képen például az emberek ujjai hihetetlenül torzulhatnak, vagy túlságosan soknak tűnhetnek.

A szövegek is árulkodóak lehetnek. Ha a képen lévő szöveg olvashatatlan, vagy értelmetlen karakterek jelennek meg, az jó jel lehet. Emlékezhetünk a híres AI által generált "kávézó" táblára, amelyen a betűk össze-vissza voltak kuszálva.

A minták ismétlődése. AI által generált képeken gyakran előfordulnak ismétlődő minták, mint például a csempe vagy a bőr textúrája. Ezek az ismétlődések természetellenesnek tűnhetnek, mintha csak egy sablont használtak volna többször.

Természetellenes fényviszonyok és árnyékok. Az AI által létrehozott képek gyakran tartalmaznak furcsa fényeffekteket és árnyékokat, amelyek nem követik a fizikai világ törvényeit. Egy AI által generált portré például furcsán világíthat a sötét háttér előtt.

Ellenőrizzük a háttér koherenciáját! Az AI néha hibázik a háttér logikus felépítésében, így olyan elemek jelenhetnek meg együtt, amelyek valóságban soha nem fordulnának elő.

Az arckifejezések és testtartások vizsgálata. Az AI generálta arcok és testek gyakran mutathatnak természetellenes arckifejezéseket vagy testtartásokat, amelyek emberi alkotás esetén kevésbé lennének valószínűek.

A kompozíció értelme. Az AI által létrehozott művekben gyakran hiányzik a kompozíciós egyensúly vagy értelmezési mélység, amit emberi művészek gyakran belecsempésznek munkáikba.

Személyek és objektumok méretei. Néha az AI által generált képeken a méretarányok teljesen el vannak rontva, így a személyek vagy tárgyak aránytalanul nagyok vagy kicsik lehetnek a kép többi eleméhez képest.

Hasonlítsuk össze ismert művekkel! Ha egy kép stílusa vagy technikája túlságosan hasonlít egy neves művész munkájához, lehet, hogy egy AI próbálta utánozni azt a stílust.

Használjunk technológiai eszközöket! Számos online eszköz áll rendelkezésre, amelyek segítenek azonosítani az AI által generált tartalmakat, mint például az amperének feltűnő "ujjlenyomatai", amelyek az AI jelenlétét jelzik. Ilyen lehet például EZ AZ ESZKÖZ, de rengeteg ehhez hasonló van, mondjuk ez annyira nem megbízható, de kiszűrte az AI képeket, bár csak 60%-ban gondolta AI-nak. Ez is egy remek játék lehet (bár ezt nem próbáltam ki) ... olyan képet generáltatni az AI-val, amely a leghatékonyabban képes átverni az AI kép detektort.

Összességében véve nem kétség, hogy az AI térnyerése komoly problémákat okoz már most is - hát még a jövőben - a képzőművészeknek, filmművészeknek. Hatékony eszköze lehet az AI azonban a tanórákon a képleírások, illetve általában a vizuális 'promptok' újragondolásának. Talán így elmondhatjuk, hogy egy kép több, mint 1000 szó valóban.

Mit szólsz hozzá?