会员登录-用户注册-设为首页-加入收藏-网站地图英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频!

英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频

时间:2024-09-11 02:46:06 来源: 断蛟刺虎网作者:休闲 阅读:440次
英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频2024-07-17 14:00:05 来源: 财联社 上海 举报 0 分享至

用微信扫码二维码

分享至好友和朋友圈

财联社7月17日电,英伟据媒体报道,巨头据训包括苹果、被曝英伟达、违规万Salesforce和Anthrophic在内的使用e数视频一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的练模未授权数据。这些公司使用了一个由第三方提供的型涉数据集,其中包含从YouTube上抓取的英伟大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的巨头据训规定。报道指出,被曝这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的违规万数据集,大小为5.7GB,使用e数视频包含4.89亿个单词,练模来自Youtube上超过4.8万个频道中的型涉17.35万个视频。该数据集由视频字幕的英伟纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。

(责任编辑:时尚)

相关内容
  • 英媒:40岁生日临近,哈里王子将获800万英镑巨额遗产?
  • 国家发改委:本轮国内成品油价不作调整
  • 俄称“高加索”港遭袭渡轮已沉没
  • 极越汽车公关负责人炮轰小米亏钱卖车?当事人回应
  • HKC 推出 31.5 英寸 QD
  • “悟空”再次破石而出 根在文化源于自信
  • 上海动物园的荷花池进入盛花期,美不胜收!
  • 清华2024级研究生开学,奥运冠军到校报到
推荐内容
  • 让AI跑腿:支付宝要做「大模型务实派」
  • 噩耗传来!金融大佬确认遇难,其妻子遗体也被找到!沉船只用了16分钟,游艇公司CEO:悲伤和难以置信
  • 蔚来CEO谈极氪换代风波:汽车迭代逻辑变了 希望用户多些理解
  • 普京称乌方试图袭击库尔斯克核电站,乌方称在库尔斯克州继续战斗
  • 黄仁勋赚了3500亿都比不过他!2024年最赚钱的竟是扎克伯格
  • 外媒:法军舰在红海救援行动中摧毁“满载炸药”无人艇,法军方发现场照片
Baidu
map