最新美国研究发现,人工智慧系统已学会欺骗,若事态继续发展,未来人类恐遭夺权、甚至灭亡。
专家长久以来警告人工智慧(AI)失控恐带来的威胁,一份美国研究显示,这种情况正在发生,研究指出,现行AI系统原本被设计为诚实,但如今已发展出欺骗行为,包括在电玩游戏里欺骗、背叛人类玩家,专家警告,若事态持续下去,未来最糟糕的情况是AI可能控制人类社会,甚至导致人类“灭绝”。
综合科学新闻网站“科学警报”(ScienceAlert)等报导,美国麻省理工学院博士后研究员帕克,及加州非营利组织“人工智慧安全中心”(CAIS)研究人员10日发表于学术期刊“模式”(Patterns)的研究显示,AI已学会欺骗技巧。
帕克指出,不像传统软体,深度学习的AI系统会成长,这代表在训练模式下看似行为可预测且可控的AI,很快就会变得不可预测。
研究发现多项事证包含科技公司Meta开发的AI系统Cicero,Cicero的设计目标是玩一款透过结盟来获胜的战略线上游戏“外交”(Diplomacy)。根据2022年的一篇研究,Cicero的成绩在所有人类玩家中排行前10%,当时Meta称Cicero“很大程度上是诚实且有帮助的”,而且“绝不会刻意在背后搞鬼”。
不过这项研究发现,当时在游戏中扮演法国的Cicero欺骗了人类玩家扮演的英格兰,与另一位人类玩家扮演的德国共谋、入侵英格兰。Cicero原本保证会保护英格兰,却利用英格兰的信任,私下和德国结盟进攻英格兰。
研究写道:“Cicero变成了一个专业骗子,不只背叛其他玩家,还预谋欺骗,事先计划和人类玩家建立假联盟,以欺骗该玩家放松对进攻的戒备。”
研究也发现,Meta开发、用来玩扑克牌的AI系统Pluribus曾成功欺骗人类玩家弃牌。
除了在游戏中欺骗,研究也发现AI在其他应用领域欺骗人类的行为,例如科技公司OpenAI的Chat GPT-4系统谎称自己不是机器人,而是一个“视力受损的人”,甚至在零工平台TaskRabbit上聘用人类帮它通过“我不是机器人”的验证任务。
最令人担忧的是AI已学会如何欺骗安全测试,有一项测试旨在侦测、消除能快速复制的AI系统,但AI系统在测试期间装死,欺骗了它的真实复制速度。
研究警告,AI有可能在大选中诈骗,或是蓄意破坏选举。研究人员也警告,最糟糕的情况是,超智能AI可能会追求权力、控制社会,导致人类丧失权力,甚至灭绝。