Claude Code тратит много токенов не из-за «прожорливости» модели, а потому что ему приходится разбираться в плохо структурированном проекте. Лишние файлы, дубли правил и отсутствие четкой архитектуры заставляют модель тянуть лишний контекст — именно это и увеличивает расход токенов.
Почему Claude Code расходует слишком много токенов
Если упростить, Claude Code работает не с «вашей задачей», а с контекстом вокруг задачи. И чем этот контекст грязнее, тем дороже обходится любое действие.
Когда модель получает задание, она не знает:
- где лежит нужный файл
- какие правила применять
- какие части проекта актуальны
В результате она начинает читать больше, чем нужно. Открывает папки, проверяет связанные файлы, пытается сопоставить инструкции. Это нормальное поведение модели, но именно оно приводит к перерасходу.
По сути, Claude Code тратит токены не на выполнение задачи, а на понимание проекта. И если структура слабая — расход растет в разы.
Здесь важно понимать базовый принцип работы LLM. Если хотите глубже разобраться, как модели вообще работают с контекстом, посмотрите материал про как работают нейросети — это сильно упрощает понимание поведения Claude.
Главная причина перерасхода: хаос в структуре проекта
Самая частая ошибка — запуск Claude Code «как есть», без подготовки проекта.
На практике это выглядит так:
- нет единого файла с архитектурой
- правила разбросаны по разным местам
- инструкции дублируются
- часть логики вообще нигде не зафиксирована
В такой среде Claude вынужден действовать с запасом. Он берет больше контекста, чем нужно, потому что не уверен, что нашел все.
И вот здесь появляется ключевая проблема:
каждое лишнее действие модели — это токены, которые вы оплачиваете.
Вместо того чтобы быстро выполнить задачу, Claude Code:
- читает лишние файлы
- проверяет дубли правил
- анализирует ненужные части проекта
И все это напрямую увеличивает стоимость работы.
Как уменьшить расход токенов в Claude Code
Решение не в «магических промптах», а в правильной архитектуре проекта.
Если сделать структуру понятной, Claude перестает искать лишнее и начинает работать по делу.
Базовая логика оптимизации
- Разделить общий контекст и частные правила
- Убрать дубли инструкций
- Ограничить зоны ответственности
- Давать модели только нужный контекст
Когда проект структурирован, Claude Code:
- быстрее находит нужные файлы
- не читает лишнее
- не тянет избыточный контекст
И это напрямую снижает расход токенов.
Правильная структура проекта под Claude Code
Чтобы оптимизация реально работала, важно разложить проект по ролям.
Пример базового каркаса:
CLAUDE.md— описание проекта и общей логики.claude/rules/frontend.md— правила работы с UI и компонентами.claude/rules/seo.md— мета-теги, schema, структура страниц- агенты — только для сложных сценариев (деплой, проверки)
Главное правило — один файл = одна зона ответственности.
Если все держать в одном месте, Claude каждый раз будет перечитывать весь документ.
Если разделить — он берет только нужное.
Отдельно важно понимать разницу между моделями и их поведением. Например, в системах, где используются LAM-подходы, логика работы с действиями отличается. Подробнее можно разобрать в статье LAM vs LLM: что такое модели действий — это помогает понять, когда нужны агенты, а когда нет.
Готовый промпт для настройки проекта под Claude Code
Ниже — практический инструмент, который позволяет сразу снизить расход токенов в Claude Code и правильно организовать структуру проекта.
Используйте его в чистой сессии перед началом работы.
Set up project structure for efficient Claude Code work. Project: [NAME]. Type: [web app / static site / API / etc]. Stack: [languages, frameworks].
Create these files:
### 1. CLAUDE.md (project root, <80 lines)
Only core invariants that apply to EVERY session:
- Project name, type, one-line description
- Stack and key dependencies
- Build command, test command, dev server command
- Deploy command or process (one-liner)
- Naming conventions (files, variables, CSS classes)
- Directory structure overview (5-10 lines max)
- Link to .claude/rules/ for detailed domain rules
Do NOT put in CLAUDE.md:
- Detailed histories or changelogs
- Full team/agent rosters
- Tech stack encyclopedias
- SEO strategies or marketing plans
- MCP server lists (they're in settings.json)
- Anything that's only relevant to specific tasks
### 2. .claude/rules/ (path-scoped, loaded only when relevant)
Create 2-4 rule files based on project type. Examples:
- deployment.md — server access, SSH, deploy process, rollback
- api.md — endpoint conventions, auth, error formats
- seo.md — meta tags, schema.org, sitemap rules
- content.md — writing style, tone, forbidden words
- testing.md — test patterns, coverage requirements
Each rule file: 30-60 lines max. Concrete rules, not essays.
### 3. .claude/agents/ (narrow, model-routed)
Create 2-3 agents with restricted tools and cheap models:
deployer.md:
- tools: Bash only
- model: haiku
- purpose: upload files, verify HTTP responses
- output format: table of files + status codes
reviewer.md:
- tools: Read, Grep, Glob, Bash
- model: haiku
- purpose: audit code/content for project-specific rules
- output format: checklist ✅/❌
writer.md (if content project):
- tools: Read, Edit, Write, Bash, Grep
- model: sonnet
- purpose: write content following project rules
- must include: "Execute immediately. Do NOT plan."
### 4. ~/.claude/CLAUDE.md — verify Token Efficiency section exists
If ~/.claude/CLAUDE.md doesn't have a Token Efficiency section, add one with these rules:
- Read once → reuse (never read same data twice)
- One agent = one completed deliverable (no "here's my plan" results)
- Agents are expensive (~25-30K tokens overhead each) — use tools directly for simple tasks
- Minimal reads, precise edits (offset/limit, Grep to verify)
- Template then transform for file variants (cp → sed tech fields → agent for content)
- Model routing: haiku for reviewers/deployers, sonnet for writers/debuggers
- After ExitPlanMode: tell agents "Plan mode is NOT active"
- Short sessions: fresh session after major milestone
After creating all files, show me the final tree and line counts.
Почему этот промпт реально снижает расход токенов
Этот промпт решает главную проблему — убирает лишний контекст до начала работы.
Claude Code:
- получает четкую структуру
- понимает зоны ответственности
- не читает весь проект
В результате:
- меньше лишних обращений к файлам
- меньше повторных чтений
- меньше «разведки»
И как итог — снижение расхода токенов в 2–3 раза на практике.
Когда агенты помогают, а когда мешают
Агенты — мощный инструмент, но их часто используют неправильно.
Они нужны там, где есть цепочка действий:
- деплой проекта
- проверка сборки
- автоматические тесты
Но если задача простая (например, изменить текст), агент только увеличивает расход токенов.
Claude сначала должен:
- понять, зачем агент
- загрузить его инструкции
- применить их
И только потом выполнить задачу.
В итоге простое действие становится дороже, чем должно быть.
Правильный подход:
- сложные сценарии → через агентов
- простые правки → напрямую
Практическая инструкция: как снизить расход токенов за 15–30 минут
Если нужно быстро привести проект в порядок, действуйте так:
- Создайте
CLAUDE.md
Опишите:- тип проекта
- стек
- структуру папок
- общие правила
- Вынесите правила в отдельные файлы
Не смешивайте фронтенд, SEO и архитектуру - Удалите дубли
Если правило встречается в двух местах — это проблема - Ограничьте использование агентов
Оставьте только там, где есть сложная логика
После этого Claude Code начинает работать заметно быстрее и дешевле.
На практике экономия может доходить до 2–3 раз по токенам, особенно на повторяющихся задачах.
Частые ошибки, из-за которых Claude «жрет» токены
Есть несколько типичных проблем, которые встречаются почти в каждом проекте:
- Один файл с «всем подряд»
- Дубли правил в разных местах
- Отсутствие структуры проекта
- Использование агентов без необходимости

Каждая из этих ошибок заставляет Claude читать больше, чем нужно.
А значит — платить приходится за лишнюю работу.
Итог: почему Claude Code тратит много токенов
Claude Code не «прожорливый». Он просто честно выполняет свою задачу — разобраться в проекте.
Если проект:
- структурирован
- логичен
- без дублей
→ расход токенов падает
Если проект:
- хаотичный
- перегруженный
- с дублирующими правилами
→ токены улетают в никуда
И это ключевой момент, который многие упускают.
Часто задаваемые вопросы
Потому что модель сначала пытается понять структуру проекта. Если она неочевидна, Claude читает лишние файлы и тянет дополнительный контекст, что увеличивает расход токенов.
Нужно структурировать проект: разделить правила, убрать дубли, создать понятный CLAUDE.md и ограничить использование агентов. Тогда модель будет брать только нужный контекст.
Да, напрямую. Чем больше лишнего контекста читает модель, тем больше токенов расходуется, а значит — выше стоимость работы.
Только для сложных сценариев. Для простых задач агенты увеличивают расход токенов и усложняют выполнение.
Частично — через промпты. Но основной эффект дает именно правильная структура проекта. Без нее расход будет оставаться высоким.







