英伟达等巨头被曝违规使用YouTube数据训练模型 涉17万个视频
用微信扫码二维码
分享至好友和朋友圈
财联社7月17日电,英伟据媒体报道,巨头据训包括苹果、被曝英伟达、违规万Salesforce和Anthrophic在内的使用e数视频一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的练模未授权数据。这些公司使用了一个由第三方提供的型涉数据集,其中包含从YouTube上抓取的英伟大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的巨头据训规定。报道指出,被曝这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的违规万数据集,大小为5.7GB,使用e数视频包含4.89亿个单词,练模来自Youtube上超过4.8万个频道中的型涉17.35万个视频。该数据集由视频字幕的英伟纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。
相关文章:
- 苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力
- Netflix 回应动画泄露事件:后期公司遭入侵导致,已积极采取行动
- 8天任务延长8个月!美国滞留太空宇航员回不来 NASA发报告痛批波音
- 新PyTorch API:几行代码实现不同注意力变体,兼具FlashAttention性能和PyTorch灵活性
- 苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力
- 巴黎奥运会闭幕,马克龙社交媒体发文:“不可能的任务,我们法国人”
- 8天任务延长8个月!美国滞留太空宇航员回不来 NASA发报告痛批波音
- 今年 7 月全球平均地表气温 16.91°C,结束连续 13 个月破高温纪录状态
- 容声509升双系统循环变频一级能效冰箱3599元入手
- 波士顿动力人形机器人大秀俯卧撑,一口气 8 个!转型后首次曝光成果
相关推荐:
- 1799元!OPPO发布新机K12 Plus:6400mAh电池加持
- 定档 2025 年 12 月 19 日,《阿凡达》新电影《Avatar: Fire and Ash》官宣
- 佛州黑哥为抢Switch游戏机暴打女老师获刑引热议:这是歧视黑人
- Netflix 回应动画泄露事件:后期公司遭入侵导致,已积极采取行动
- 台积电第三季度净利润3253亿元台币,高于预期
- 烽火通信副总熊伟成是“博士研究生”24岁工作?去年薪酬112万
- 中国姑娘跑出奥运会大众马拉松第1
- 配天观点:具身智能商业化落地之路,道阻且长,但行则必至!
- 中国排名:鲁婉遥刘钰曾莉棋收获世界积分排名上升
- 什么操作?美国最新隐形无人机,加了驾驶舱