英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频
英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频2024-07-17 14:00:05 来源: 财联社
上海 举报 0 分享至
用微信扫码二维码
分享至好友和朋友圈
财联社7月17日电,英伟据媒体报道,巨头据训包括苹果、被曝英伟达、违规万Salesforce和Anthrophic在内的使用e数视频一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的练模未授权数据。这些公司使用了一个由第三方提供的型涉数据集,其中包含从YouTube上抓取的英伟大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的巨头据训规定。报道指出,被曝这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的违规万数据集,大小为5.7GB,使用e数视频包含4.89亿个单词,练模来自Youtube上超过4.8万个频道中的型涉17.35万个视频。该数据集由视频字幕的英伟纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。
相关文章:
- 解读郑蕴和:转职业第2场亚巡获前四 目标绿夹克
- 未发先火!华为三折叠屏MateXT渠道目前已炒到4万 货源少未来会到10万+
- 全新英特尔酷睿Ultra处理器为AI PC时代带来开创性卓越性能和非凡效率
- 全新英特尔酷睿Ultra处理器为AI PC时代带来开创性卓越性能和非凡效率
- 解读郑蕴和:转职业第2场亚巡获前四 目标绿夹克
- 全新英特尔酷睿Ultra处理器为AI PC时代带来开创性卓越性能和非凡效率
- 全球AI手机销量排名:小米14暂列第六 三星苹果占据前五
- 2024上半年线上学习平板销量激增45.5% 小度销量第四
- 美网第4日辛纳赢赛季第50胜 阿尔卡拉斯爆冷出局
- 华硕推出新款 VivoBook 14/16 Flip 笔记本,搭载 Ultra 7 258V