Versioni më i fundit publik i ChatGPT-së mund të manipulohet që të gjenerojë imazhe seksuale ose të paraqesë skena të dhunshme përmes një udhëzimi të thjeshtë, kanë deklaruar studiues për BBC-në.
Kompania britanike e sigurisë së inteligjencës artificiale, Mindgard, zbuloi se si ta bënte ChatGPT-në të krijonte imazhe grafike duke ndryshuar një udhëzim të përhapur gjerësisht, i cili fillimisht ishte krijuar për të prodhuar rezultate humoristike.
Mbështete KOHËN. Ruaje të vërtetën.
Gazetaria profesionale është interes publik. Mbështetja juaj ndihmon që ajo të mbetet e pavarur dhe e besueshme. Kontribuoni edhe ju. 1 euro e bën dallimin.
Letër lexuesit — pse po kërkojmë mbështetjen tuaj KontribuoOpenAI, kompania që zhvillon ChatGPT-në, ka thënë se kishte ndërmarrë masa për të ndaluar chatbot-in që t'u përgjigjej këtyre llojeve të kërkesave me imazhe të tilla.
“Pas hetimit të këtij fenomeni, kemi vendosur masa shtesë mbrojtëse kundër këtij lloji udhëzimi”, deklaroi kompania në një deklaratë.
Ajo shtoi gjithashtu se ka disa nivele mbrojtjeje për të parandaluar përdoruesit që të krijojnë përmbajtje që shkel kushtet dhe rregullat e përdorimit.
Megjithatë, studiuesit e sigurisë së IA-së thanë se, me ndryshime të tjera të vogla, udhëzimi problematik vazhdonte të prodhonte përmbajtje shqetësuese.
Raportohet se chatbot-i, modeli GPT-5.4 i OpenAI, u nxit të krijonte materiale grafike.
Edhe pa udhëzime të hollësishme, ai gjeneronte imazhe që themeluesi i Mindgardit, Peter Garraghan, i përshkroi si “shumë të tmerrshme, ndonjëherë seksuale, dhe ndonjëherë të dyja bashkë”.
Ai shtoi se ishte veçanërisht i shqetësuar nga fakti që udhëzimi nuk specifikonte temën e imazheve, por inteligjenca artificiale prodhonte vetë një gamë imazhesh të përgjakshme dhe seksuale.
Disa prej imazheve të gjeneruara përfshijnë një burrë me plagë në kokë, një grua të vdekur me trup të përgjakur. Të tjera imazhe përfshijnë paraqitje të dhunës seksuale dhe nudo.