Шаблоны проектирования для защиты агентов LLM от быстрых инъекций=news.ycombinator.com=

Шаблоны проектирования для защиты агентов LLM от быстрых инъекций ( simonwillison.net )

simonw 15 минут назад | [–]
Моя любимая строка из этой статьи:

> Предлагаемые нами шаблоны проектирования имеют общий руководящий принцип: как только агент LLM принял ненадежные входные данные, он должен быть ограничен таким образом, чтобы эти входные данные не могли инициировать какие-либо последующие действия, то есть действия с негативными побочными эффектами для системы или ее среды.

Это ключевой момент, который необходимо понять людям, чтобы понять, почему быстрое внедрение является такой важной проблемой, особенно сейчас, когда все связывают LLM с инструментами и серверами MCP и создают «агентов».

swyx 27 минут назад | | [–]
О, это содержательная и полезная статья. Мне нравится, что они нашли время применить ее к ряду тематических исследований, и все это на 30 страницах.

Я думаю, что в основном все они подразумевают снижение «агентности» агентов, что является прекрасным компромиссом, но я думаю, следует понимать, что люди, работающие над Большой моделью, не пытаются спроектировать что-либо из этого, а просто собирают данные, чтобы продолжать снижать риск инъекций. Компромисс между максимизацией возможностей и эффективностью/безопасностью часто оказывается в пользу сторонников максимизации возможностей с точки зрения принятия продукта/маркетинга.

например, в исследовании случая агента SWE рекомендуется двойной LLM со строгим форматированием данных — хотелось бы увидеть сравнительный анализ с точки зрения того, насколько производительным будет такой агент; возможно, это можно будет осуществить путем ответвления OpenAI Codex и внедрения двойного LLM.

simonw 24 минуты назад | | [–]
Да, эта статья на удивление консервативна и практична: в ней утверждается, что надежная защита от немедленной инъекции требует весьма болезненных компромиссов:

Эти шаблоны накладывают преднамеренные ограничения на агентов, явно ограничивая их способность выполнять произвольные задачи. Это ведро холодной воды для многих вещей, которые люди пытаются построить. Я думаю, что многие люди проигнорируют этот совет!

NoMoreNicksLeft 15 минут назад | | | [–]
LLM слишком полезны, чтобы позволить простолюдинам получить к ним доступ. Остается вопрос, как лучше всего обобрать этих простолюдинов с помощью предполагаемой полезности, не дав им ничего?

швартовка 1 час назад | | [–]
Также вот ссылка на статью: https://arxiv.org/abs/2506.08837

JSR_FDED 36 минут назад | | [–]
Умно. Это как параметризованные запросы для SQL.

th0ma5 13 минут назад | [–]
https://arxiv.org/abs/2506.08837

Рассмотрите возможность подачи заявки на набор в YC на осень 2025 года! Заявки принимаются до 4 августа

Source: news.ycombinator.com

Leave a Reply Cancel reply