您现在的位置是:知识>>正文
超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI
知识48773人已围观
简介超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI 2024年07月17日 16:54快科技 ...
快科技7月17日消息,频NA苹据媒体报道,巨头据训包括NVIDIA、被曝苹果、违规Salesforce和Anthropic在内的用数多家科技巨头,被曝光涉嫌违规使用数据,超万用于训练其AI模型。个视果
这些公司被发现使用了超过173536个YouTube视频的频NA苹字幕数据,而这些数据的巨头据训获取并未得到视频创作者的许可。
这些公司所使用的被曝数据集名为“YouTube Subtitles”,由非营利组织EleutherAI创建,违规该数据集包含了来自超过48000个频道的用数视频文本。
其中不乏知名教育机构和媒体公司的超万内容,例如可汗学院、麻省理工学院、哈佛大学等,此外,一些广受欢迎的YouTube创作者,如MrBeast等的视频也被包括在内。
此前,EleutherAI发布了名为“Pile”的数据汇编,其中的大部分数据集都是对公众开放的,包括YouTube Subtitles。
不过值得注意的是,苹果在使用Pile数据集训练OpenELM模型时,并未直接下载数据,因此在技术层面上,是EleutherAI违反了YouTube的使用条款。
YouTube明确禁止未经授权从平台获取素材,同时这些数据不仅用于训练AI,还可能涉及到版权和隐私问题。
创作者们也对此表示震惊和不满,因为他们并未被告知自己的作品被用于商业目的,更遑论从中获得任何补偿。
Tags:
相关文章
美国在国际对抗赛接连败退 总统杯是挽回颜面稻草?
知识美国在国际对抗赛接连败退 总统杯是挽回颜面稻草?2024年09月04日 12:10新浪体育缩小字体放大字体收藏微博微信分享0腾讯QQQQ空间 ...
【知识】
阅读更多扎波罗热核电站:乌军向反应堆附近道路投掷弹药
知识扎波罗热核电站:乌军向反应堆附近道路投掷弹药2024年08月17日 16:56新京报缩小字体放大字体收藏微博微信分享0腾讯QQQQ空间 据央视新闻 ...
【知识】
阅读更多持有还是套现?红利资产背后的大逻辑!
知识持有还是套现?红利资产背后的大逻辑!2024-08-18 07:38:39来源: 券商中国 广东 举报 ...
【知识】
阅读更多