RLHF 与 RL 到底能不能归属为一类,真正看来大家还是强对有不一样的看法。
AI 大牛 Karpathy 又来科普人工智能概念了。化学
昨日,习谷a下他发推表示,场反「基于人类反馈的观点歌强化学习(RLHF)只是勉强算得上是强化学习(RL)。」
Copyright © 2016 Powered byKarpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对,北道主人网sitemap