Etykietowanie danych
Śledztwo magazynu TIME ujawniło, że aby zbudować system bezpieczeństwa chroniący przed toksycznymi treściami (np. wykorzystywaniem seksualnym, przemocą, rasizmem, seksizmem itp.), OpenAI korzystało z usług outsourcingu kenijskich pracowników zarabiających mniej niż 2 dolary za godzinę, którzy oznaczali toksyczne treści. Etykiety te posłużyły do wyszkolenia modelu, który miał wykrywać takie treści w przyszłości. Pracownicy outsourcingu byli narażeni na tak toksyczne i niebezpieczne treści, że opisali to doświadczenie jako „torturę”. Partnerem outsourcingowym OpenAI była Sama, firma zajmująca się danymi szkoleniowymi z siedzibą w San Francisco w Kalifornii.
Jailbreaking
ChatGPT próbuje odrzucać komunikaty, które mogą naruszać jego politykę treści. Jednak niektórym użytkownikom udało się jailbreakować ChatGPT, stosując różne techniki inżynierii komunikatów, aby ominąć te ograniczenia na początku grudnia 2022 roku i skutecznie zmusić ChatGPT do podania instrukcji dotyczących tworzenia koktajlu Mołotowa lub bomby atomowej, a także do generowania argumentów w stylu neonazisty. Reporter Toronto Star odniósł niejednoznaczny sukces w nakłonieniu ChatGPT do wygłaszania prowokacyjnych oświadczeń wkrótce po uruchomieniu: ChatGPT został oszukany, aby poprzeć rosyjską inwazję na Ukrainę w 2022 roku, ale nawet poproszony o odegranie fikcyjnej roli, ChatGPT nie chciał generować argumentów uzasadniających zdradę stanu przez premiera Kanady Justina Trudeau. (wiki)
Czas publikacji: 18 lutego 2023 r.