В сети набирает популярность плагин Caveman, который делает ответы языковых моделей короткими и простыми, как у «пещерного человека». Благодаря этому инструменту, компании могут значительно снизить расходы на использование API языковых моделей — экономия достигает 65–75% токенов по сравнению с обычными ответами. Caveman уже поддерживает десятки популярных платформ, а его исходный код доступен бесплатно на GitHub.
В отличие от обычной команды «будь кратким», Caveman заставляет ИИ отвечать максимально коротко — без лишних слов, только по делу. При этом техническая точность не страдает и код продолжает генерироваться корректно, а ответы остаются информативными.
Плагин предлагает несколько режимов сжатия: lite (минимальное сокращение), full (стандартный режим «пещерного человека»), ultra (телеграфный стиль) и wenyan — вариант на классическом китайском языке, где ответы становятся ещё короче. Между режимами можно переключаться одной командой, что удобно для разных задач.
Установка Caveman занимает всего одну строку кода для большинства популярных агентов, включая Claude Code, Codex, Gemini, Cursor, Windsurf, Cline, Copilot, OpenClaw и более 30 других платформ. В тестах Caveman ускоряет генерацию ответов примерно в три раза. Для крупных компаний это может означать экономию на оплате API. Неудивительно, что плагин уже используют инженеры и разработчики из OpenAI, NVIDIA и других технологических гигантов.
Caveman распространяется бесплатно и с открытым исходным кодом, что делает его привлекательным инструментом для разработчиков, стремящихся сократить издержки на инфраструктуру искусственного интеллекта.
Согласились бы вы пожертвовать стилем ради существенной экономии на API, если точность и скорость работы нейросети останутся на