We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

“Reducing LLM deception at scale with self-other overlap fine-tuning” by Marc Carauleanu, Diogo de Lucena, Gunnar_Zarncke, Judd Rosenblatt, Mike Vaiana, Cameron Berg

2025/3/13

LessWrong (30+ Karma)

No transcript made for this episode yet, you may request it for free.