综合

英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频

字号+作者:多多益善网来源:综合2024-10-03 06:31:32我要评论(0)

英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频2024-07-17 14:00:05来源: 财联社 上海

英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频2024-07-17 14:00:05 来源: 财联社 上海 举报 0 分享至

用微信扫码二维码

分享至好友和朋友圈

财联社7月17日电,英伟据媒体报道,巨头据训包括苹果、被曝英伟达、违规万Salesforce和Anthrophic在内的使用e数视频一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的练模未授权数据。这些公司使用了一个由第三方提供的型涉数据集,其中包含从YouTube上抓取的英伟大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的巨头据训规定。报道指出,被曝这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的违规万数据集,大小为5.7GB,使用e数视频包含4.89亿个单词,练模来自Youtube上超过4.8万个频道中的型涉17.35万个视频。该数据集由视频字幕的英伟纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 深圳生二孩奖8万元?回应来了!

    深圳生二孩奖8万元?回应来了!

    2024-10-03 06:15

  • 外媒:拜登竞选团队X账号已从“拜登总部”更名为“卡玛拉总部”,并发图问责特朗普

    外媒:拜登竞选团队X账号已从“拜登总部”更名为“卡玛拉总部”,并发图问责特朗普

    2024-10-03 05:39

  • 背靠“小家电代工大王”,如何托起家族“品牌梦”——新宝“厂二代”解锁创业新关卡

    背靠“小家电代工大王”,如何托起家族“品牌梦”——新宝“厂二代”解锁创业新关卡

    2024-10-03 05:32

  • 南通移动强化反诈宣传,全力筑牢网络安全防线

    南通移动强化反诈宣传,全力筑牢网络安全防线

    2024-10-03 04:45

网友点评
Baidu
map