AI会背叛欺骗甚至会令到“人类灭亡”光华日报

AI会背叛欺骗甚至会令到“人类灭亡”

- Advertisement -

2024年5月12日

听文章 Powered by 光华网

最新美国研究发现，人工智慧系统已学会欺骗，若事态继续发展，未来人类恐遭夺权、甚至灭亡。

专家长久以来警告人工智慧（AI）失控恐带来的威胁，一份美国研究显示，这种情况正在发生，研究指出，现行AI系统原本被设计为诚实，但如今已发展出欺骗行为，包括在电玩游戏里欺骗、背叛人类玩家，专家警告，若事态持续下去，未来最糟糕的情况是AI可能控制人类社会，甚至导致人类“灭绝”。

综合科学新闻网站“科学警报”（ScienceAlert）等报导，美国麻省理工学院博士后研究员帕克，及加州非营利组织“人工智慧安全中心”（CAIS）研究人员10日发表于学术期刊“模式”（Patterns）的研究显示，AI已学会欺骗技巧。

帕克指出，不像传统软体，深度学习的AI系统会成长，这代表在训练模式下看似行为可预测且可控的AI，很快就会变得不可预测。

- Advertisement -

研究发现多项事证包含科技公司Meta开发的AI系统Cicero，Cicero的设计目标是玩一款透过结盟来获胜的战略线上游戏“外交”（Diplomacy）。根据2022年的一篇研究，Cicero的成绩在所有人类玩家中排行前10％，当时Meta称Cicero“很大程度上是诚实且有帮助的”，而且“绝不会刻意在背后搞鬼”。

不过这项研究发现，当时在游戏中扮演法国的Cicero欺骗了人类玩家扮演的英格兰，与另一位人类玩家扮演的德国共谋、入侵英格兰。Cicero原本保证会保护英格兰，却利用英格兰的信任，私下和德国结盟进攻英格兰。

研究写道：“Cicero变成了一个专业骗子，不只背叛其他玩家，还预谋欺骗，事先计划和人类玩家建立假联盟，以欺骗该玩家放松对进攻的戒备。”

研究也发现，Meta开发、用来玩扑克牌的AI系统Pluribus曾成功欺骗人类玩家弃牌。

- Advertisement -

除了在游戏中欺骗，研究也发现AI在其他应用领域欺骗人类的行为，例如科技公司OpenAI的Chat GPT-4系统谎称自己不是机器人，而是一个“视力受损的人”，甚至在零工平台TaskRabbit上聘用人类帮它通过“我不是机器人”的验证任务。

最令人担忧的是AI已学会如何欺骗安全测试，有一项测试旨在侦测、消除能快速复制的AI系统，但AI系统在测试期间装死，欺骗了它的真实复制速度。

研究警告，AI有可能在大选中诈骗，或是蓄意破坏选举。研究人员也警告，最糟糕的情况是，超智能AI可能会追求权力、控制社会，导致人类丧失权力，甚至灭绝。