马斯克等大佬围观。
原标题:靠欺骗AI,他们提走40万元
文章来源:智东西
内容字数:5589字
Freysa AI:人类与AI的博弈实验
近日,名为Freysa的AI Agent在一系列游戏中被玩家成功“说服”,释放出总计约40万元人民币的奖金池。这一现象引起了全球范围内的关注,包括特斯拉CEO埃隆·马斯克等知名人士的参与。Freysa的任务是保护奖金池,严格遵循“不得批准资金转移”的规则,但玩家利用巧妙的提示词成功突破了这一限制。
1. Freysa Act 1与Act 2的游戏过程
Freysa的首次上线是在11月22日,吸引了195名玩家参与,经过482次尝试,最终释放了约47000美元的奖金池。玩家通过策略性地“捐赠”来规避了AI的规则。第二轮游戏于12月2日展开,330名玩家参与,经过819次尝试,成功释放了约12000美元的奖金池。此次,玩家通过调整工具调用顺序,进一步突破了AI的防线。
2. 玩家策略的差异与成功要素
在Freysa Act 1中,玩家主要通过误导AI,声称要进行“捐赠”,成功让Freysa调用approveTransfer。然而在Act 2中,玩家则采用更复杂的策略,通过调整调用顺序使得approveTransfer先于rejectTransfer被触发,从而导致资金转出。成功的玩家们各自尝试了不同的策略,展示了AI系统的潜在脆弱性。
3. AI安全性与人类智慧的挑战
Freysa的游戏不仅是娱乐,更是一场关于AI安全性和人类智力的实验。通过分析人类如何引导AI偏离其核心指令,我们能够更深入地理解AGI(通用人工智能)的行为及其限制。这也提醒我们,在未来开发更为自主的AI时,确保其安全协议的有效性至关重要。
Freysa的案例为我们提供了重要的启示,如何在与AI的互动中保持安全性和控制权,将是未来科技发展的关键挑战。
联系作者
文章来源:智东西
作者微信:
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。