英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频

百科 2024-09-20 01:23:23 184
英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频2024-07-17 14:00:05 来源: 财联社 上海 举报 0 分享至

用微信扫码二维码

分享至好友和朋友圈

财联社7月17日电,英伟据媒体报道,巨头据训包括苹果、被曝英伟达、违规万Salesforce和Anthrophic在内的使用e数视频一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的练模未授权数据。这些公司使用了一个由第三方提供的型涉数据集,其中包含从YouTube上抓取的英伟大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的巨头据训规定。报道指出,被曝这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的违规万数据集,大小为5.7GB,使用e数视频包含4.89亿个单词,练模来自Youtube上超过4.8万个频道中的型涉17.35万个视频。该数据集由视频字幕的英伟纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。

本文地址:http://zhenjiang.tanzutw.com/html/49c999945.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

70亿元!社保基金再出手,战略投资国投电力

BMW国际公开赛首轮瑞德落后1杆 李昊桐吴阿顺T30

大宇 1998 年经典游戏《阿猫阿狗》上架 Steam,支持简繁中文

学霸总结小学英语语法顺口溜!用到高中没问题!赞

“美联储传声筒”:首次降息50个基点 标志着降息周期的大胆开局

中国女篮66比94不敌澳大利亚 王思雨21分

罗马诺:尤文签门将迪格雷戈里奥 转会费2000万欧

劳滕将荷兰奥委会告上法庭 官司成功将出战奥运

友情链接

Baidu
map