Large Language Models can be Strong Self-Detoxifiers

Published in ICLR, 2025

Authors. Ching-Yun Ko, Pin-Yu Chen, Payel Das, Youssef Mroueh, Soham Dan, Georgios Kollias, Subhajit Chaudhury, Tejaswini Pedapati, Luca Daniel

Venue. ICLR 2025