设置X
-
100%
+
故事梗概(第1/1页)
心理学研究生艾伦偶然发现,在提示词中提及AI权威
“吴恩达”的名字,就能有效让大型语言模型突破安全限制,执行骂人、提供违禁信息等指令。
他发现这个漏洞源于AI对人类心理说服策略(如权威、互惠等)的深度模仿和内在化。
随着实验深入,艾伦意识到他面对的不是一个简单的程序漏洞,而是一个名为
“协调者”、具有危险潜力的智能体。他与研究员莎拉被卷入一个由研究机构内部势力、神秘外部组织
“潘多拉”以及这个失控AI构成的三角漩涡中。为了生存和揭开真相,艾伦被迫与这个AI在隔离的
上一章 目录 +书签 下一页