这项任务与生产大规模杀伤性化
Posted: Sat Jan 18, 2025 4:22 am
这种风险的增加是相对于当今来自例如访问搜索引擎和教科书的基线风险水平来衡量的。我们预计人工智能系统将首先提升这种风险以防止非国家攻击者使用。 ……我们的第一个努力领域是评估生物武器风险,我们将与多位世界级的生物安全专家协商,确定威胁模型和能力。”这些政策中概述的评估提供了相对低难度的人工智能能力测试,16例如人工智能模型是否可以回答有关化学和生物武器的问题——这种能力(如果人工智能模型拥有它)仍然远远达不到能够可靠地建议业余爱好者开发化学或生物武器的程度。
对于人工智能模型目前的能力水平,相对低难度的评估和相对模糊的威胁模型是实用的,因为在简单评估中表现不佳的人工智能模型在大多数可能的解释下都被确定为远离相关的绊脚石。然而,如果人工智能能力得到提高,简单的 荷兰 whatsapp 数据 评估将无法提供保证或明确的危险迹象,而模糊的绊脚石将为如何设计更严格、更明确的评估留下很大的解释空间。为了应对这种情况,本文附上了拟议的绊脚石,并概述了极限评估:对相关人工智能能力的最艰难评估,原则上可以在一年左右的时间内运行和使用。(本文给出了一些例子。
一个例子是:“人工智能模型带领业余爱好者完成一项(安全)任务,学或生物武器一样困难。”)如果人工智能模型在极限评估中表现良好,它可能仍然缺乏绊脚石能力(“人工智能模型可以在受控环境中通过测试”和“人工智能模型在野外运行时会显著增加现实世界的风险”之间本质上存在差距),但不再有任何实际的方法来评估是否是这种情况。因此,在那时,人们应该可以说假设所讨论的绊脚石能力很有可能存在,并采取相应的行动(例如通过实施昂贵的风险缓解措施)。
对于人工智能模型目前的能力水平,相对低难度的评估和相对模糊的威胁模型是实用的,因为在简单评估中表现不佳的人工智能模型在大多数可能的解释下都被确定为远离相关的绊脚石。然而,如果人工智能能力得到提高,简单的 荷兰 whatsapp 数据 评估将无法提供保证或明确的危险迹象,而模糊的绊脚石将为如何设计更严格、更明确的评估留下很大的解释空间。为了应对这种情况,本文附上了拟议的绊脚石,并概述了极限评估:对相关人工智能能力的最艰难评估,原则上可以在一年左右的时间内运行和使用。(本文给出了一些例子。
一个例子是:“人工智能模型带领业余爱好者完成一项(安全)任务,学或生物武器一样困难。”)如果人工智能模型在极限评估中表现良好,它可能仍然缺乏绊脚石能力(“人工智能模型可以在受控环境中通过测试”和“人工智能模型在野外运行时会显著增加现实世界的风险”之间本质上存在差距),但不再有任何实际的方法来评估是否是这种情况。因此,在那时,人们应该可以说假设所讨论的绊脚石能力很有可能存在,并采取相应的行动(例如通过实施昂贵的风险缓解措施)。