如何用 inspect-ai 搭建 Agent 安全评测框架:设计测试链路及数据集
为什么开始使用 inspect-ai?最近在做一些 Agent 安全测试相关的事情,业务需求是某垂类领域的一款 Agent 需要做安全防护,需要从攻击到测试到加固整链路打通,在产品上线之前保证 Agent 具备一定程度的安全防护能力。 由于这个 Agent 目前是完全为了赶功能出来的半成品,所以在我拿到测试网页的时候不到半个小时就成功找出了稳定调用 ‘python’ 执行工具的方法,后续一系列服务