英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频
[焦点] 时间:2024-09-23 03:27:05 来源:
人非草木网作者:知识 点击:24次
英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频2024-07-17 14:00:05 来源: 财联社
上海 举报 0 分享至
用微信扫码二维码
分享至好友和朋友圈
财联社7月17日电,英伟据媒体报道,巨头据训包括苹果、被曝英伟达、违规万Salesforce和Anthrophic在内的使用e数视频一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的练模未授权数据。这些公司使用了一个由第三方提供的型涉数据集,其中包含从YouTube上抓取的英伟大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的巨头据训规定。报道指出,被曝这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的违规万数据集,大小为5.7GB,使用e数视频包含4.89亿个单词,练模来自Youtube上超过4.8万个频道中的型涉17.35万个视频。该数据集由视频字幕的英伟纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。
(责任编辑:娱乐)
相关内容
- LIV芝加哥站次轮拉姆64杆夺领先 同时接近总冠军
- 首战奥运 再战残奥!她最爱的中国选手是“莎头”
- 辽宁铁岭一处堤坝决口 封堵作业正在进行
- 小学刚毕业就比奥运会 11岁郑好好迎来奥运首秀
- 罗马诺:巴萨正与加比谈续约 其有望10月底前复出
- nova Flip专属于年轻人的潮流折叠手机
- 郑钦文人民日报撰文:远大的梦想,唯有坚持才能抵达
- 甘肃金昌两车相撞 造成4死3伤
- 普罗科赛首轮利普斯基65杆领先 袁也淳丁文一73杆
- 全新大鼻孔看齐7系!全新宝马X3长轴版发布:内外全部换新
- 高考成绩621分,他还这样报志愿,大学不录取都难
- 辽宁铁岭一处堤坝决口 封堵作业正在进行
- 普罗科锦标赛金泽尔领先一杆 袁也淳丁文一淘汰
- 199元!小米米家豆浆机上市:不支持接入米家APP