OpenAI взимает плату за минуту, поэтому сделайте минуты короче ( mand.is )
он по-прежнему декодирует каждый кадр и сопоставляет фонемы в любом случае, но ускорение уменьшает количество секунд, за которые они выставляют вам счет. Таким образом, вы можете взломать их логику выставления счетов больше, чем саму модель.
также это означает, что чем дольше вы говорите, тем больше вы платите, даже если фактическая плотность информации одинакова. поэтому, если в вашем голосе более длинные паузы или вы говорите медленно, вы, возможно, субсидируете неэффективность.
заставляет меня думать, что, возможно, следующее большое сжатие будет в каденции доставки. Просто автоматически оптимизируйте тон голоса и темп перед отправкой в LLM. Скармливайте ему синтетическую быструю речь без эмоций, только слова с высокой плотностью. Вы теряете человеческое тепло, но получаете 40% экономии средств
Похожий трюк работал и в версиях Gemini до Gemini 2.0: они взимали фиксированную плату в размере 258 токенов за изображение, и оказалось, что вы могли поместить более 258 токенов текста в изображение текста и использовать это для получения скидки!
Я пытался резюмировать 40-минутный доклад с помощью API транскрипции OpenAI, но он был слишком длинным. Поэтому я ускорил его с помощью ffmpeg, чтобы уложиться в 25-минутный лимит. Он работал довольно хорошо (до 3-кратной скорости), был дешевле и быстрее, поэтому я написал об этом.
Казалось, что это забавный трюк, которым стоит поделиться. Есть полный сценарий и разбивка расходов.
Вы могли бы промолчать и начать более дешевый бизнес по транскрипции, чем OpenAI 🙂
Показательно, что лучше бегло просмотреть текст, чем потратить время на его тщательное прочтение.
Я прочитал стенограмму + резюме именно этого выступления. Я подумал, что это было неплохо, но неинтересно, и пошел дальше.
Позже я увидел, что это было выложено на youtube, а я был в поезде, поэтому я посмотрел все это на нормальной скорости. У меня было огромное количество разных идей, мыслей и решений, вызванных просмотром всего этого.
Это случается со мной и в других областях. Просмотр конференции лично для меня гораздо полезнее, чем просмотр онлайн с другими отвлекающими факторами. Просмотр онлайн снова полезнее, чем чтение резюме.
Прогулка с целью глубоко о чем-то подумать гораздо лучше 10-минутной сессии, направленной на то, чтобы «решить» проблему и забыть о ней.
Чем медленнее, тем лучше обычно усваивается информация.
Подойдет ли это и для моего видео, состоящего из 10 000 PDF-файлов?
https://news.ycombinator.com/item?id=44125598
Я не могу понять, мем это или нет.
И если бы у кого-то возникла эта идея и он предложил ее Клоду (модели, с помощью которой этот проект был закодирован), он бы сказал: «Какая замечательная идея!»
Дольше*
Мы обнаружили это в прошлом месяце.
Вероятно, также существует способ отправить меньший сэмплер звука на разных скоростях и сравнить их, чтобы получить оптимизацию скорости без потери качества, уникальную для каждого клипа.
Source: news.ycombinator.com