모든 공개 기록
라이언의 꿀팁백과에서 사용할 수 있는 모든 기록이 표시됩니다. 기록 종류나 사용자 이름(대소문자 구별) 또는 영향을 받는 문서(대소문자 구별)를 선택하여 범위를 좁혀서 살펴볼 수 있습니다.
- 2026년 3월 3일 (화) 19:33 Ryanyang 토론 기여님이 Reinforcement Learning from Human Feedback 문서를 만들었습니다 (새 문서: A short introduction to RLHF and post-training focused on language models by Nathan Lambert https://rlhfbook.com/ 분류:2026 분류:AI 분류:Book 분류:인공지능 분류:RLHF 분류:강화학습 분류:Reinforcement Learning) 태그: 시각편집기