We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

“Alignment Faking Revisited: Improved Classifiers and Open Source Extensions” by John Hughes, abhayesian, Akbir Khan, Fabien Roger

2025/4/8

LessWrong (30+ Karma)

No transcript made for this episode yet, you may request it for free.