Ученые Google DeepMind разработали инструмент, способный добавлять водяные знаки к текстам, создаваемым большими языковыми моделями, тем самым улучшая возможность идентификации и отслеживания контента, созданного искусственно.
Эти большие языковые модели (LLM) являются широко использующимися искусственными интеллектами, которые могут генерировать текст для чат-ботов, помощи в написании и других целей, но идентифицировать и приписывать произведенный этой ИИ контент конкретному источнику может быть сложно.
В статье, опубликованной в журнале Nature, исследователи Суманту Датхатри и Пушмит Кохли из Google DeepMind представляют стратегию под названием SynthID-Text, которая использует новый алгоритм выборки для применения водяных знаков к тексту, генерируемому ИИ.
По словам исследователей, этот инструмент использует алгоритм для тонкого искажения выбора слов LLM, вставляя подпись, которая может быть распознана программным обеспечением для детекции. Эта стратегия показала улучшенную эффективность обнаружения водяных знаков по сравнению с предыдущими подходами.
Водяной знак, предлагаемый SynthID-Text, может помочь в идентификации синтетического текста и ограничить его ненадлежащее использование, случайное или преднамеренное. Кроме того, ученые объясняют, что этот инструмент имеет незначительное влияние на вычислительную мощность, необходимую для выполнения LLM, что облегчает его реализацию.
Пабло Хая из Лаборатории информатической лингвистики Университета Автономной Мадриды упоминает, что это техническое решение является надежным и необходимым для улучшения идентификации текста, сгенерированного ИИ. Хая подчеркивает важность технологий, облегчающих идентификацию авторства документов, особенно в то время, когда текущие системы имеют низкие показатели успеха в этой задаче.