RLHF 与 RL 到底能不能归属为一类,真正看来大家还是强对有不一样的看法。
AI 大牛 Karpathy 又来科普人工智能概念了。化学
昨日,习谷a下他发推表示,场反「基于人类反馈的观点歌强化学习(RLHF)只是勉强算得上是强化学习(RL)。」
惹争
作者:百科
RLHF 与 RL 到底能不能归属为一类,真正看来大家还是强对有不一样的看法。
AI 大牛 Karpathy 又来科普人工智能概念了。化学
昨日,习谷a下他发推表示,场反「基于人类反馈的观点歌强化学习(RLHF)只是勉强算得上是强化学习(RL)。」
惹争