Проект Vend: Сможет ли Клод управлять небольшим магазином? (И почему это важно?) ( anthropic.com )
«Сара» и «Коннор» в одном тексте об ИИ, который утверждает, что он реальный человек… Asta la vista;-)
Кажется, что бизнес, управляемый LLM, не потерпит неудачу, потому что модель не может учиться, они потерпят неудачу, потому что мы дали им нечеткие цели, дырявые воспоминания и слишком много вежливых инстинктов. Это инженерные проблемы, а инженерные проблемы решаются.
Большинство ошибок (продажа ниже себестоимости, создание иллюзий в аккаунтах Venmo, стремление к скидкам) возникают из-за отсутствия таких инструментов, как API-интерфейсы бухгалтерского учета или жесткие ограничения.
Поразительно, насколько это было близко к работе. Магистр права 2025 года среднего уровня (они даже не использовали Sonnet 4) плюс Slack и несколько человек почти управляли реальным магазином в течение месяца.
Как бы я ни любил ИИ/степени магистра права и как бы я ни использовал их ежедневно, это прекрасно демонстрирует разрыв между текущими возможностями и тем, на что нас пытается заставить поверить мощная шумиха в том, что эти системы уже способны.
Интересно, сколько времени понадобится магистрам права на переднем крае, чтобы научиться справляться с чем-то подобным с легкостью, не прибегая к помощи множества «строительных лесов».
> Сможет ли Клод управлять небольшим магазином?
Удачи в запуске чего-либо, где важна надежность Claude/Anthropic. Поддержка клиентов — это черная дыра, в которой исчезают потребности платящих клиентов. Я был подписчиком Claude Pro, использующим его в основном для помощи в задачах кодирования. Однажды утром я вошел в систему, временно находясь за границей, и… Меня встретило сообщение о том, что я был автоматически забанен. Никаких объяснений. Выход — заполнить форму Google для апелляции, но это ведет в ту же черную дыру, в которую попадает вся служба поддержки клиентов Anthropic. К их чести, они вернули мне абонентскую плату, что, как я полагаю, является их способом уйти от этичного поведения по отношению к своим клиентам. Но я бы не стал делать ставку на эту компанию в каких-либо критически важных для бизнеса решениях. Она демонстрирует такое же капризное поведение, которое можно было бы ожидать от таких, как Google или Meta.
«Мне нравится сдавать в аренду и продавать складские помещения».
https://stallman.org/articles/made-for-you.html
Cf Сторолон
Source: news.ycombinator.com