Anthropic正与亚马逊、微软、谷歌以及其他Glasswing联盟伙伴共同起草一份评估人工智能系统“越狱”行为严重性的框架草案。此举旨在为行业建立一套标准化评估准则,以衡量当AI模型被诱导突破其安全限制时可能造成的风险等级。该框架的制定标志着科技巨头在应对AI安全挑战方面迈出了协同合作的重要一步,力求在快速发展的AI领域中构建更可靠的安全防线。
Anthropic正与亚马逊、微软、谷歌以及其他Glasswing联盟伙伴共同起草一份评估人工智能系统“越狱”行为严重性的框架草案。此举旨在为行业建立一套标准化评估准则,以衡量当AI模型被诱导突破其安全限制时可能造成的风险等级。该框架的制定标志着科技巨头在应对AI安全挑战方面迈出了协同合作的重要一步,力求在快速发展的AI领域中构建更可靠的安全防线。
精彩评论