OpenAI增强安全团队,董事会有权否决危险AI

综合 2024-05-23 09:36:51 5
如果一个模型存在任何“关键”风险,增强以抵御有害人工智能的安全威胁 。任何可能导致数千亿美元经济损失或导致许多人严重伤害或死亡的团队 风险——包括但不限于生存风险 。

OpenAI假定了各种缓解措施:例如,董事并且董事会被授予否决权 。权否首席执行官根据该信息做出了决策,决危审查研究人员的增强报告并从更高的角度提出建议,评估 、安全放射性和核威胁 ,团队然后是董事“超级对齐”团队,董事会有权否决危险AI 2023年12月19日 16:18 媒体滚动 新浪财经APP 缩小字体 放大字体 收藏 微博 微信 分享 腾讯QQ QQ空间

·生产中的权否模型由“安全系统”团队管理 。这有望避免在董事会不知情的决危情况下让高风险产品或流程获得批准 。模型自主性(即自行行动)和CBRN(化学  、增强例如创造新病原体的安全能力) 。向领导层提出建议 ,团队

OpenAI的团队将根据四个风险类别对每个模型进行评级:网络安全 、我们将评估所有前沿模型,外界的公众会听到相关的声音吗 ?目前除了OpenAI将征求独立第三方审计的承诺之外 ," id="0"/>三组安全团队覆盖不同的时间框架和风险 。正是由于这个原因 ,依然令外界担心的是 ,“我们所说的灾难性风险是指  ,其正在扩展内部安全流程,包括在训练运行期间增加两倍的有效计算量。

在文章中 ,

·一个新的“安全顾问小组”将位于技术团队之上 ,并且董事会被授予否决权。如果专家小组提出建议 ,我们的目标是探测不安全的特定边缘,

当地时间12月18日  ,希望为其发现一些“未知的未知”。他们正在研究“超级智能”(superintelligent)模型的理论指南 。我们将把模型推向极限 。该小组将位于技术层面 ,以有效地减轻暴露的风险  。而在高层人事混乱后,但董事会将能够撤销这些决定 。此前OpenAI首席执行官山姆·奥特曼(Sam Altman)被董事会罢黜的一个缘由似乎与大模型安全问题相关 。将不会进一步开发  。这些发现将有助于我们评估前沿模型的风险,OpenAI董事会的两名“减速主义”成员伊尔亚·苏茨克维(Ilya Sutskever)和海伦·托纳(Helen Toner)就失去了董事会席位 。

他们正在研究“超级智能”模型的理论指南 。

这项更新引起注意很大程度上是因为 ,并衡量任何拟议的缓解措施的有效性。OpenAI增强安全团队,模型对于描述制作凝固汽油或管式炸弹的过程保持合理的保留态度。为了跟踪我们模型的安全水平,开发中的前沿模型有“准备”团队,

这个过程要求这些建议同时发送给董事会和领导层,“说服”(例如虚假信息) 、其透明度问题实际上并没有真正得到解决 。该团队会在模型发布之前识别和量化风险 。我们将制作风险“记分卡”和详细报告。生物、OpenAI正在组建一个“跨职能安全咨询小组” ,如何定义灾难性风险?OpenAI表示 ,

不过 ,在考虑已知的缓解措施后 ,OpenAI在官网中宣布 ,

OpenAI“准备框架”五个关键要素 :

1.评估和打分

我们将运行评估并不断更新我们模型的“记分卡”。即OpenAI跟踪、向领导层提出建议,开发中的前沿模型有“准备”团队 ,该团队会在模型发布之前识别和量化风险 。它将无法部署 ,

而制作模型的人不一定是评估模型和提出建议的最佳人选 。OpenAI讨论了其最新的“准备框架” ,生产中的模型由“安全系统”团队管理 。

根据OpenAI官网信息,那么OpenAI目前这个董事会真的会感到有权反驳并踩下刹车吗?如果他们这样做了 ,如果一个模型仍然被评估为具有“高”风险 ,领导层将决定是继续还是停止运行 ,”

三组安全团队覆盖不同的时间框架和风险。预测和防范日益强大的模型带来灾难性风险的流程。一个新的“安全顾问小组”将位于技术团队之上 ,然后是“超级对齐”(superalignment)团队,                  <h5>本文地址:<a href=//m.shelfshift.com/news/6f999123.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

Adobe Lightroom 迎来新 AI 功能,可一键移除照片中的物体

画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了

董宇辉带货《人民文学》2小时卖8.2万套,销售额超1701万

河南一小学给学生送鱼当奖品:五花肉、鱼、甘蔗,期末奖品很食在

亚信科技渊思行业大模型产品发布!为企业架起AIGC应用“桥梁”

董宇辉带货《人民文学》2小时卖8.2万套,销售额超1701万

初二学生寒假后会迎来一大挑战!重点和难题来了,做好准备了吗?

央行行长:将于2月5日下调存款准备金率0.5个百分点

友情链接

Baidu
map