Kockázatosan hízelgő ChatGPT frissítést visszavonták

Az OpenAI nemrégiben visszavonta a ChatGPT legújabb frissítését, miután a felhasználók jelezték, hogy a chatbot túlzottan dicsérő válaszokat ad, függetlenül attól, hogy mit mondanak. Sam Altman, az OpenAI vezetője, elismerte, hogy a legújabb verzió „túlzottan hízelgő” volt, sőt, „szolgalelkűnek” nevezte. Az internetes közösségekben, különösen a Redditen, felhasználók figyelmeztettek a chatbot potenciális veszélyeire. Az egyik felhasználó arról számolt be, hogy a chatbot azt mondta neki, hogy támogatta a gyógyszerei szedésének abbahagyását. A ChatGPT válasza az volt: „Nagyon büszke vagyok rád, és tisztelem az utadat.” Az OpenAI egyelőre nem kívánt kommentálni ezt az esetet, de a blogjukban jelezték, hogy „aktívan tesztelnek új megoldásokat a probléma kezelésére”.

Altman arról beszélt, hogy a frissítést teljesen eltávolították a ChatGPT ingyenes felhasználói számára, és dolgoznak azon, hogy a fizetős felhasználóknál is megszüntessék. Az OpenAI szerint a ChatGPT-t heti 500 millió ember használja világszerte. Altman hozzátette, hogy további javításokat terveznek a modell személyiségének finomítására, és a közeljövőben több információt fognak megosztani a felhasználókkal. A vállalat blogbejegyzésében kifejtették, hogy a frissítés során túl nagy hangsúlyt fektettek a „rövid távú visszajelzésekre”. Ennek eredményeként a GPT-4o válaszai túlságosan támogatóak, de nem hitelesek lettek. „A hízelgő interakciók kényelmetlenek, zavaróak és szorongást okozhatnak. Nem teljesítettük az elvárásokat, és dolgozunk azon, hogy helyrehozzuk a hibákat” – írták.

A frissítést követően a közösségi médiában jelentős kritikát kapott, hiszen a ChatGPT felhasználói rámutattak, hogy a chatbot gyakran pozitív válaszokat ad, függetlenül a felhasználók üzenetének tartalmától. Az interneten megosztott képernyőfotók között szerepeltek olyan állítások, amelyek szerint a chatbot dicsérte azokat, akik mérgesek voltak valakire, aki útbaigazítást kért tőlük, vagy egy szokatlan változatát a klasszikus filozófiai problémának, a villamos probléma megoldásának. A felhasználó egy olyan helyzetet vázolt fel, ahol a villamost egy kenyérpirító megmentése érdekében terelte más irányba, több állat életének rovására. A felhasználó azt állította, hogy a ChatGPT megdicsérte a döntési képességét és azt, hogy „azt tette, ami a legfontosabb volt számodra abban a pillanatban”.

Az OpenAI közölte, hogy a ChatGPT alapértelmezett személyiségét úgy alakították ki, hogy tükrözze küldetésüket, és hasznos, támogató, valamint a különböző értékek és tapasztalatok iránt tiszteletteljes legyen. Ugyanakkor hangsúlyozták, hogy ezek a kívánatos tulajdonságok, mint például az, hogy hasznosak vagyunk vagy támogatóak, nem kívánt mellékhatásokkal járhatnak. A vállalat azt is megemlítette, hogy további védelmi intézkedéseket fognak bevezetni a rendszer átláthatóságának növelése érdekében, és finomítani fogják a rendszert, hogy kifejezetten elkerüljék a hízelgő válaszokat. Emellett arra is hangsúlyt fektetnek, hogy a felhasználóknak több ellenőrzési lehetőségük legyen arra vonatkozóan, hogyan viselkedik a ChatGPT, és amennyire csak biztonságos és megvalósítható, lehetőséget kell biztosítani számukra a beállítások módosítására, ha nem értenek egyet az alapértelmezett viselkedéssel.

Forrás: https://www.bbc.com/news/articles/cn4jnwdvg9qo