Показать HN: Я создал генератор наборов данных ИИ ( github.com/metabase )
Я использую эту подсказку для запуска демонстраций для клиентов на https://www.definite.app/ :
@Web Проведите исследование https://somecompany.com и напишите подробный обзор того, чем занимается компания. Как может выглядеть их схема базы данных? Мне нужно, чтобы вы создали для них макет базы данных в duckdb для демонстрации Затем:
Создайте проект uv и напишите скрипт python для добавления демонстрационных данных. Используйте Faker. @Web исследуйте, сколько у них клиентов. Создайте базу данных соответствующего масштаба. Это займет всего несколько минут в Cursor, должно работать так же хорошо в Claude Code. Это действительно хорошо работает для основного бизнеса компании, но мне все еще нужно создать один для заполнения сторонних источников (например, Stripe, Salesforce, Hubspot и т. д.).
Мне надоело копаться в Kaggle и писать подсказки снова и снова, чтобы получить фейковые данные для панелей и демонстраций. Поэтому я создал небольшой инструмент, который мне поможет.
Он использует GPT-4o для генерации подробной схемы и бизнес-правил на основе нескольких раскрывающихся списков (типа бизнеса, структуры схемы и количества строк). Затем Faker заполняет строки, используя эти правила, что делает его быстрым и дешевым.
Вы можете просмотреть данные, экспортировать их в CSV или SQL или запустить Metabase одним щелчком мыши, чтобы исследовать данные. Это открытый исходный код, все еще на ранних стадиях, но хотелось бы поделиться, получить обратную связь и посмотреть, как вы можете его улучшить.
Кажется, это полезный инструмент для тех, кто изучает аналитику или просто нуждается в образцах данных для тестирования.
Source: news.ycombinator.com