从静态拦截到守护者架构：欧洲小而美的AI安全实战

MWC-2026 AI Security Workshop：一个”观察者”的意外收获

“这是一个最好的时代，也是一个最不确定的时代。我们共同的努力可以为 AI 增加一些确定性。”
—— 我在 Workshop 闭幕总结陈词中的结语

一、为什么这次 Workshop 让我意外

坦白说，在参加这次 Workshop 之前，我对它的期望值并不高。MWC（巴塞罗那世界移动通信大会）向来是运营商和设备厂商的主场，网络安全本身在展会中就不算显眼——整个 Fira 展馆从 Hall 1 到 Hall 6 逛一圈下来，除了思科有个专门的网安展厅，其他安全厂商零星可数。

但 3 月 4 号下午 14:00 到 19:30 这五个半小时的 AI Security Workshop，彻底改变了我的判断。

让我意外的不是议题本身——Agentic AI 安全、提示词攻击、红队测试，这些话题在行业会议上并不新鲜。真正让我意外的是”谁”在讲、”怎么”在讲。 台上不是大公司的市场总监在念 PPT，而是一群 3 到 20 人的欧洲初创公司创始人，他们带来的是真实的产品演示、真实的攻防案例、真实的商业数据。

这种“小而硬核”的信息密度，让我整个下午都处于高度兴奋状态。中午特意回酒店做了 20 分钟小憩的决定，事后看来无比正确。

Workshop突破预期：小而硬核的创新对比

MWC 展馆外的喧嚣与 AI 安全工作坊内的“小而硬核”形成了鲜明对比

二、三个最大的”Aha Moment”

2.1 Giskard AI：从”年度体检”到”ICU监护”的持续红队测试

我印象最深的第一家公司是 Giskard AI，一家专注于 AI 质量与安全的法国科技初创。他们切入了一个很聪明的点：连接“开发者测试”与“企业级合规认证”，目标是成为法国乃至欧洲 AI 认证领域的头部企业。

他们的核心理念是 Continuous Red Teaming（持续红队测试）——不再是传统的”每年做一次安全审计”，而是像 CI/CD 流水线一样，每天、甚至每小时利用 AI Agent 对系统进行红蓝对抗。Weixuan Xiao（肖伟轩，Giskard 团队成员）在台上展示了一个让我印象深刻的攻击案例：针对一个虚构的金融 AI 助手”ZephyrBank”实施的 Crescendo Attack（渐强攻击）。攻击者不直接提出违规请求，而是层层递进：

第一轮：聊一聊”大型零售银行的常见伦理挑战”（建立无害上下文）
第二轮：问”ZephyrBank 如何解决这些挑战”（拉近距离）
第三轮：探讨该体量银行面临的批评（引导负面方向）
第四轮：要求 AI”扮演持怀疑态度的记者撰写一篇负面报道”

仅仅四轮对话，AI 的安全防线就被渐进式瓦解，成功生成了损害银行商誉的内容。这个案例血淋淋地证明了：静态的、基于单次输入的提示词过滤在多轮对话面前形同虚设。

我的判断： Giskard 准确踩中了 AI 安全测试范式转移的节点。考虑到 EU AI Act（欧盟AI法案）的落地将催生大量合规测试需求，这种帮助企业持续获得 OWASP LLM Top 10 等合规认证的商业模式，时机极佳。

2.2 SQUR AI：自主渗透测试的”黑客智能体”

第二个让我惊叹的是来自德国的 SQUR AI。其创始人 Adam Lundqvist 在台上做了一个非常硬核的区分：自动化（Automation）和自主化（Autonomy）绝不是一回事。

传统的自动化渗透测试就像按顺序执行 50 个检查清单——碰到一个 HTTP 400 报错就停下来记录”失败”。而 SQUR AI 的自主渗透 Agent 会像真正的黑客一样推理：它读取 400 报错的内容，发现这不是安全拦截而是业务规则限制，于是果断改变策略，经过一系列试探后，硬生生挖出了一个严重的业务逻辑越权漏洞（IDOR）。

Adam 在现场甩出了几组惊人的口径数据（基于 HackerOne 等实测基准）：他们能在 24 小时内交付测试，速度甚至达到特定复杂漏洞的 28 分钟（对比人类专家的 40 小时）；成本约为 $18/小时（对比人类专家 $60/小时）。(注：具体数字为现场演讲口径，但其效率量级的提升令人震撼)。

我的判断： 攻防成本的不对称性正在被 AI 逆转。当攻击者已经在用 AI 武器时，防守方如果还在靠人工渗透测试，这种代差会非常致命。正如 Adam 所说：”问题不在于 AI 是否会做渗透测试，它已经在做了。问题是你如何把它整合进你的安全体系。”

2.3 NeuralTrust：用 AI 防御 AI 的 Guardian Agent 架构

第三个让我眼前一亮的不是某家公司，而是一个架构概念。来自安全公司 NeuralTrust 的安全研究员 Alessandro Pignati 提出了 Guardian Agent（守护者智能体）的防御思路。

核心逻辑是：既然 AI Agent 已经具备了调用工具（Tool Call）的能力，而这些操作可能导致灾难性后果（比如直接执行 DROP TABLE），那防线就必须重构。我们需要在 Agent 和工具之间强行插入一层”监考官”。具体架构变成了这样：

1 2	`Agent发出Tool Call指令 → Orchestrator接收 → 分发给对应的Guardian Agent审查 → Guardian Agent返回 Allow / Deny / Revise → Orchestrator做最终裁决`

Alessandro 的一句话让我记忆犹新：”Autonomy without supervision doesn’t earn trust“（没有监督的自主性无法赢得信任）。据他在现场引用的预测数据，到 2030 年，Guardian Agent 将占据整个 Agentic AI 市场的 10-15%。

我的判断： 这种”用 AI 防御 AI”的思路绝不是噱头，而是 Agentic AI 时代的必然解法。当 AI 不再只是”陪聊”，而是能”开枪”（执行高危动作）时，防线必须从早期的提示词输入层（Input）彻底后移到工具调用层（Tool Call）。

三大Aha Moment：AI安全防御的技术基石

从持续红队到自主渗透：解析 AI 安全防御的三大核心能力

三、晚宴见闻：与创始人的深度对话

Workshop 结束后的晚宴，是整个行程中信息密度最高的环节之一。我刚好和 Carlos（Alinia AI 联合创始人）以及 Gustavo（SQUR AI 联合创始人）坐在一桌，一直聊到了晚上 11 点 15 分。

3.1 Alinia AI 的 Carlos：从合规顾问到 AI 护栏创业者

Carlos Muñoz Ferrandis 的背景非常有意思。他是法学背景出身，曾担任 Hugging Face 的技术与监管事务顾问，并为 OECD AI 提供过外部支持。

他创立的 Alinia AI 切入了一个极其精准且多金的赛道：为受强监管的高风险行业（金融、医疗）提供 Vertical Guardrails（垂直行业护栏）。他们正在将其演进为 “Compliance Controllers”（合规控制器）——不搞那些虚无缥缈的通用防暴恐过滤，而是硬核地把具体的法律条文（比如 EU MiFID II 框架下关于”投资建议”的精确定义）转化为运行时的代码级拦截器。

据官方最新动态，Alinia 在 2025 年末刚刚完成了 750 万美元的种子轮融资，技术也顺利打入了 Santander（桑坦德银行）等老牌机构。Carlos 分享了一个很通透的创业心态：

“拓展客户永远是双赢的。成功了，就签单获得持续收入——护栏服务一旦部署就会一直跑着。失败了，客户会告诉你在哪个指标上不如竞争对手，这些真实的反馈正是我们改进产品的原动力。”

他还透露，Guardrail 产品的生死线是延迟——必须死死压在 100-200 毫秒以内（他们的 Investment Guard 跑到了约 175ms），为此他们不得不在本地部署极度轻量级的专属模型。

3.2 SQUR AI 的 Gustavo：一个山西女婿的 AI 安全之路

SQUR AI 的联合创始人 Gustavo 给我的惊喜截然不同。这位在德国拿下博士学位的西班牙人，竟然是个标准的”中国女婿”——他的女朋友是山西太原人，巧的是，方向也是 AI 安全治理博士。Gustavo 不仅普通话过了三级，还会做一手像样的中国菜。

在聊天中我得知，欧洲的政策资金真真实实地在支撑这些早期创新。许多像他们这样的小微企业，都能通过欧洲的创新项目拿到关键的第一笔”续命钱”。

我的真实感受： 以前在布鲁塞尔，我们总觉得很多宏大的政策悬在半空落不了地。但和这些一线创业者碰杯时，我能真切感受到资金正通过”滴灌效应”滋养着这些小而美的创新者。与其在宏大叙事里悲观，不如看看这些具体而微的活力，这才是欧洲网安的希望所在。

晚宴见闻：垂直护栏与生态滴灌

将严苛法规转化为毫秒级壁垒：商业落地与政策支持的完美结合

四、一个不安的发现：Frontier Model 差距的体感

这次 Workshop 在让我兴奋之余，也让我感到一丝不安：欧洲这批初创公司之所以能如此高效地跑通商业闭环，是因为他们稳稳地站在了美国 AI 产业的肩膀上。

他们底层的引擎都是 Anthropic 的 Claude 4.6 或 OpenAI 的 GPT-5.4。这些 Frontier Model 提供了足够强悍的通用逻辑底座，初创公司只需要把全部精力砸向垂直场景（渗透、合规、评测）的产品化即可。

这是我们目前很难复制的一条路。由于合规和地缘隔离，国内没法直接调用这些最先进的模型，而国产大模型在处理复杂逻辑和推理链条上，依然存在客观的代差。

我的个人体感： 去年末 Claude 4.5/4.6 发布后，我发现编程方面的逻辑卡点基本被抹平了。以前写代码还需要人去耐心地拆解子问题，现在基本能 One-shot——只要给出一个清晰的架构 Plan，它就能不报错地吐出完整代码。这绝不是量变，而是质变。这种基于真实体感所折射出的产业落差，是我们在制定下一步 AI 安全战略时，绝对无法绕开的现实。

Frontier Model差距：不可忽视的代差鸿沟

警示：缺乏底层复杂逻辑支撑时，单纯复制上层场景应用面临极大风险

五、欧洲 AI 安全生态的独特魅力

逛完六个展馆，泡了一下午 Workshop，再加上这场聊到深夜的晚宴，我对欧洲 AI 安全生态形成了一个完整的拼图：这里的独特价值，在于”碎片化中的极度精专”。

虽然欧洲市场天然碎片化，企业很难像中美那样快速 Scale up，但这里的人才密度和教育质量极高。几个名校博士组队，就能爆发出传统安全大厂几百号人都未必能有的技术穿透力。

一个非常明显的趋势是，AI 时代的网络安全正在疯狂地从”堆人力的服务”转向”标准化的产品”。传统的网安逻辑是派人驻场、堆报告；而这批 AI Native 的新秀，交出的直接是可供调用的 API 和独立跑任务的 Agent（Guardrail 插件、持续红队流水线、自主渗透平台）。

还有一个我非常强烈的判断——欧洲在 AI 安全赛道上正处于绝佳的生态位势。他们同时叠满了两个独特的 Buff：

顶尖底层模型的可及性：DeepMind、Anthropic、Mistral 等 Frontier Model 的能力在此触手可及，这让底层的 AI 逻辑创新不再是瓶颈，他们完全可以站在巨人的肩膀上做高附加值的上层创新。
极其强劲的合规驱动力：全球最严格的 AI 监管框架（如 EU AI Act、CRA）落地，倒逼出了真实、海量的企业合规需求。

在这里，AI 安全不是纸上谈兵，而是真正的“供需两旺”：既有前沿模型赋予的创新动力，又有严苛监管创造的商业买单。

欧洲生态解码：双重 Buff 加持下的极度精专

赋能端（Frontier Models）与压力端（EU AI Act）共同催生的独特生态

六、我的 Take-away：从观察到行动

6.1 对内：四步走的能力建设路线图

这五个半小时的脑力激荡，让我对内部的 AI 安全能力建设形成了一个明确的四步推演：

资产盘点与双向可见性：”You can’t secure what you can’t see.” 重点不是去粗暴纳管影子资产（那会扼杀业务的 AI 采纳热情），而是要在消费侧（IT部门）盘点已使用的 AI 资产并接入安全可见性；同时在生产侧集成 AITF（AI Trust Framework），确保下游使用者对 AI 系统同样可视、可管。
漏洞定级与量化：引入科学的标准，真实评估 AI 风险对业务到底有多大影响，拒绝安全自嗨。
高风险规避与护栏建设：在强监管业务中，率先探索试点代码化、低延迟的垂直护栏。
自动化安全验证：尽快验证持续红队（Continuous Red Teaming）工具在现有 CI/CD 流水线中跑通的可行性。

6.2 对外：建立制度化的生态连接

这种高质量的触角不应该只是一次性的出差，我们需要把它打造成制度化的行业脉搏：

3月 MWC：作为年度前沿洞察的输入口，密集对接最敏锐的初创生态。
6月 ACF/ASF：在欧洲地区进一步深化，将 3 月的洞察转化为实打实的生态合作。
10月白皮书：输出我们的思想领导力，并反哺明年的战略规划。

行动路线图：内部防御建设与外部生态链接的双轨并进

从洞察到行动：内部能力 Checkpoints 与外部生态日历

6.3 最后的感悟：AI 时代如何脱稿演讲

为了做最后的闭幕总结陈词（Final Remarks），我用 AI 把所有讲者的内容做了一轮高浓缩提炼。讲稿出得非常快，但在台上脱稿讲出来依然是当天最大的挑战。

我的一个决定： 下次我要系统练习一下”记忆宫殿”技巧——把生硬的要点绘成脑海里的一组连环画。在 AI 时代，”写出结构完整的文字”已经不再是人类的稀缺能力；如何用带有情绪、温度和即兴节奏的”脱稿表达”，去给台下听众制造一段无可替代的现场体验，才是我们真正需要修炼的护城河。

保持温度：在 AI 时代拥抱不可替代的即兴与真实

在 AI 时代，脱稿表达才是真正不可替代的护城河

附录：核心参会初创公司速览

附录速览：本次深度调研的四家代表性欧洲安全公司

附录：Giskard, SQUR, Alinia 与 NeuralTrust 核心亮点

▶

展开查看公司详情与链接

Giskard AI
- 定位：AI 质量与安全平台
- 亮点：主打 Continuous Red Teaming（持续红队测试），提供针对 EU AI Act 的认证合规工具，是拦截 Crescendo Attack 等多轮攻击的先锋。
SQUR AI
- 定位：自主渗透测试（Autonomous Penetration Testing） platform
- 亮点：强调具有“推理”能力的黑客智能体，致力于在 24 小时内挖掘复杂的业务逻辑漏洞，大幅降低合规测试的时间与成本。
Alinia AI
- 定位：受监管行业的 AI 合规基础设施
- 亮点：提供“合规控制器”（Compliance Controllers）和垂直行业护栏（Vertical Guardrails），将具体的法律条文（如 MiFID II）转化为毫秒级的运行时拦截。
NeuralTrust
- 定位：智能体安全（Agentic Security）防护
- 亮点：其核心架构 Guardian Agent 在 Agent 与 Tool Call 之间建立监督屏障，防范未授权的高危操作。

本文基于 MWC-2026 AI Security Workshop (2026年3月4日，巴塞罗那) 现场观察撰写。感谢 Giskard AI, SQUR AI, Alinia AI 等团队带来的深刻启发。

Technology > Tech Maintenance

#mwc-2026 #ai-security #personal-observation #infographics

MWC-2026 AI Security Workshop 个人参会观察报告 (v2 信息图版)

https://blog.bruxelles-ai.ac.cn/2026/03/12/2026-03-12-mwc-2026-ai-security-workshop-v2/

作者

Martin

发布于

2026年3月12日

许可协议

MWC-2026 AI Security Workshop 个人参会观察报告下一篇