Heloowird
Blog
GitHub
#RLHF
2023-03-12
InstructGPT 与 RLHF:大模型如何学会听懂人话