Heloowird
Blog
GitHub
#指令微调
2023-03-12
InstructGPT 与 RLHF:大模型如何学会听懂人话