Meta开源新的AI图像水印技术，但真的靠谱吗？-品论天涯网

AI驱动的图像生成正在蓬勃发展，这是有充分理由的：它有趣且易于使用。虽然这些模型带来了新的创意可能性，但它们可能会引起人们对不良行为者潜在滥用的担忧，这些不良行为者可能会故意生成图像来欺骗人们。即使是为了好玩而创作的图像也可能会像病毒一样传播并可能误导人们。2KI品论天涯网

例如，今年早些时候，教皇方济各穿着一件华丽的白色蓬松夹克的图片在网上疯传，特朗普被逮捕的照片引发热议。这些图像不是真实的照片，但很多人都被愚弄了，因为没有任何明确的指标来区分这些内容是由生成式AI创建的。2KI品论天涯网

Meta研究人员近日发布了一篇新的研究论文和技术代码，详细介绍了一种为AI图片添加隐形水印的技术，用于区分开源生成式AI模型何时创建的图像。隐形水印将信息合并到数字内容中。这些水印肉眼看不见，但可以通过算法检测到——即使人们重新编辑了图像。虽然围绕水印还有其他研究方向，但许多现有方法在生成AI图像后创建水印。2KI品论天涯网

据EverypixelJournal报道，用户已经使用三个开源存储库的模型创建了超过110亿张图像。在这种情况下，只需删除生成水印的行即可删除不可见水印。StableSignature提出了一种方法来避免水印被删除。2KI品论天涯网

2KI品论天涯网

012KI品论天涯网

StableSignature方法的工作原理2KI品论天涯网

论文地址：2KI品论天涯网

https://arxiv.org/abs/2303.154352KI品论天涯网

Github地址：2KI品论天涯网

https://github.com/facebookresearch/stable_signature2KI品论天涯网

StableSignature通过将水印扎根于模型中，并使用可追溯到图像创建位置的水印，消除了删除水印的可能性。2KI品论天涯网

让我们通过下面的图表来看看这个过程是如何工作的。2KI品论天涯网

2KI品论天涯网

Alice训练了一个主生成模型。在分发之前，她对模型的一小部分（称为解码器）进行了微调，从而为Bob生成给定的水印。该水印可以标识型号版本、公司、用户等。2KI品论天涯网

Bob收到他的模型版本并生成图像。生成的图像将带有Bob的水印。Alice或第三方可以对它们进行分析，看看图像是否是由使用生成式AI模型的Bob生成的。2KI品论天涯网

这通过两步来实现：2KI品论天涯网

1.联合训练两个卷积神经网络。一种将图像和随机消息编码为水印图像，另一种则从水印图像的增强版本中提取消息。目标是使编码和提取的消息匹配。训练后，只保留水印提取器。2KI品论天涯网

2.对生成模型的潜在解码器进行微调以生成包含固定签名的图像。在此微调过程中，会对批量图像进行编码、解码和优化，以最大限度地减少提取的消息与目标消息之间的差异，并保持感知图像质量。这种优化过程快速有效，只需要小批量和很短的时间即可获得高质量的结果。2KI品论天涯网

022KI品论天涯网

评估StableSignature的性能2KI品论天涯网

我们知道人们喜欢分享和转发图像。如果Bob与10个朋友分享了他创建的图像，然后每个朋友又与另外10个朋友分享了该图像，结果会怎样？在此期间，有人可能会更改图像，例如裁剪、压缩或更改颜色。研究人员构建了StableSignature以应对这些变化。无论人们如何转换图像，原始水印都可能保留在数字数据中，并且可以追溯到创建它的生成模型。2KI品论天涯网

2KI品论天涯网

研究人员发现StableSignature相对于被动检测方法的两大优势：2KI品论天涯网

首先，能够控制和减少误报的产生，当将人类生成的图像误认为是AI生成的图像时，就会发生误报。考虑到在线共享的非AI生成图像的盛行，这一点至关重要。例如，最有效的现有检测方法可以发现大约50%的编辑生成图像，但仍会产生大约1/100的误报率。换句话说，在每天接收10亿张图像的用户生成内容平台上，大约1000万张图像将被错误标记，从而仅检测到一半的AI生成图像。2KI品论天涯网

另一方面，StableSignature以1e-10的误报率（可以设置为特定的期望值）以相同的精度检测图像。此外，这种水印方法允许追踪同一模型的不同版本的图像——这是被动技术无法实现的能力。2KI品论天涯网

032KI品论天涯网

如果一个大模型经过了微调，2KI品论天涯网

StableSignature如何检测到微调版本生成的图像？2KI品论天涯网

AI大模型的一种常见做法是采用基础模型并对其进行微调，以处理有时甚至为一个人量身定制的特定用例。例如，可以向模型显示Alice的狗的图像，然后Alice可以要求模型生成她的狗在海滩的图像。这是通过DreamBooth、TextualInversion和ControlNet等方法完成的。这些方法作用于潜在模型级别，并且不会更改解码器。这意味着我们的水印方法不受这些微调的影响。2KI品论天涯网

总体而言，StableSignature与矢量量化图像建模（如VQGAN）和潜在扩散模型（如StableDiffusion）配合良好。由于这种方法不修改扩散生成过程，因此它与上述流行模型兼容。通过一些调整，稳定签名也可以应用于其他建模方法。2KI品论天涯网

042KI品论天涯网

AI水印真的靠谱吗？2KI品论天涯网

通过添加隐形水印的方式来识别AI生成图像的技术最近受到很多争议。GoogleDeepMind最近宣布针对图像生成推出一种添加水印的工具SynthID，同时识别AI生成的图像。通过扫描图像中的数字水印，SynthID可以评估图像是由Imagen模型生成的可能性。2KI品论天涯网

但AI水印是否能够被轻易去除？据外媒Engadget、Wired等报道，美国马里兰大学的一个研究小组对AI生成内容的“数字水印”技术可靠性进行研究，发现这一技术可被轻易破解。2KI品论天涯网

该校计算机科学教授SoheilFeizi面对AI生成图像的水印现状时直言不讳：“目前我们没有任何可靠的水印技术，我们破解了所有的水印。”2KI品论天涯网

在测试过程中，研究人员可轻松避开现有的水印方法，并发现在非AI生成的图像上添加“假水印”更为容易。同时，该团队还开发出了一种“几乎无法”从图像中去除的水印技术，且不会完全损害图像的知识产权。2KI品论天涯网

AI水印这种方式仍旧不过成熟，并不能成为百分百有效的工具。我们需要期待未来能够出现新的技术来为生成式AI图像保驾护航，避免虚假图片泛滥，避免版权侵害。2KI品论天涯网