Claude Code тратит много токенов не из-за «прожорливости» модели, а потому что ему приходится разбираться в плохо структурированном проекте. Лишние файлы, дубли правил и отсутствие четкой архитектуры заставляют модель тянуть лишний контекст — именно это и увеличивает расход токенов.

Почему Claude Code расходует слишком много токенов

Если упростить, Claude Code работает не с «вашей задачей», а с контекстом вокруг задачи. И чем этот контекст грязнее, тем дороже обходится любое действие.

Когда модель получает задание, она не знает:

  • где лежит нужный файл
  • какие правила применять
  • какие части проекта актуальны

В результате она начинает читать больше, чем нужно. Открывает папки, проверяет связанные файлы, пытается сопоставить инструкции. Это нормальное поведение модели, но именно оно приводит к перерасходу.

По сути, Claude Code тратит токены не на выполнение задачи, а на понимание проекта. И если структура слабая — расход растет в разы.

Здесь важно понимать базовый принцип работы LLM. Если хотите глубже разобраться, как модели вообще работают с контекстом, посмотрите материал про как работают нейросети — это сильно упрощает понимание поведения Claude.

Главная причина перерасхода: хаос в структуре проекта

Самая частая ошибка — запуск Claude Code «как есть», без подготовки проекта.

На практике это выглядит так:

  • нет единого файла с архитектурой
  • правила разбросаны по разным местам
  • инструкции дублируются
  • часть логики вообще нигде не зафиксирована

В такой среде Claude вынужден действовать с запасом. Он берет больше контекста, чем нужно, потому что не уверен, что нашел все.

И вот здесь появляется ключевая проблема:
каждое лишнее действие модели — это токены, которые вы оплачиваете.

Вместо того чтобы быстро выполнить задачу, Claude Code:

  • читает лишние файлы
  • проверяет дубли правил
  • анализирует ненужные части проекта

И все это напрямую увеличивает стоимость работы.

Как уменьшить расход токенов в Claude Code

Решение не в «магических промптах», а в правильной архитектуре проекта.

Если сделать структуру понятной, Claude перестает искать лишнее и начинает работать по делу.

Базовая логика оптимизации

  1. Разделить общий контекст и частные правила
  2. Убрать дубли инструкций
  3. Ограничить зоны ответственности
  4. Давать модели только нужный контекст

Когда проект структурирован, Claude Code:

  • быстрее находит нужные файлы
  • не читает лишнее
  • не тянет избыточный контекст

И это напрямую снижает расход токенов.

Правильная структура проекта под Claude Code

Чтобы оптимизация реально работала, важно разложить проект по ролям.

Пример базового каркаса:

  1. CLAUDE.md — описание проекта и общей логики
  2. .claude/rules/frontend.md — правила работы с UI и компонентами
  3. .claude/rules/seo.md — мета-теги, schema, структура страниц
  4. агенты — только для сложных сценариев (деплой, проверки)

Главное правило — один файл = одна зона ответственности.

Если все держать в одном месте, Claude каждый раз будет перечитывать весь документ.
Если разделить — он берет только нужное.

Отдельно важно понимать разницу между моделями и их поведением. Например, в системах, где используются LAM-подходы, логика работы с действиями отличается. Подробнее можно разобрать в статье LAM vs LLM: что такое модели действий — это помогает понять, когда нужны агенты, а когда нет.

Готовый промпт для настройки проекта под Claude Code

Ниже — практический инструмент, который позволяет сразу снизить расход токенов в Claude Code и правильно организовать структуру проекта.

Используйте его в чистой сессии перед началом работы.


Set up project structure for efficient Claude Code work. Project: [NAME]. Type: [web app / static site / API / etc]. Stack: [languages, frameworks].

Create these files:
### 1. CLAUDE.md (project root, <80 lines)
Only core invariants that apply to EVERY session:
- Project name, type, one-line description
- Stack and key dependencies
- Build command, test command, dev server command
- Deploy command or process (one-liner)
- Naming conventions (files, variables, CSS classes)
- Directory structure overview (5-10 lines max)
- Link to .claude/rules/ for detailed domain rules

Do NOT put in CLAUDE.md:
- Detailed histories or changelogs
- Full team/agent rosters
- Tech stack encyclopedias
- SEO strategies or marketing plans
- MCP server lists (they're in settings.json)
- Anything that's only relevant to specific tasks

### 2. .claude/rules/ (path-scoped, loaded only when relevant)
Create 2-4 rule files based on project type. Examples:
- deployment.md — server access, SSH, deploy process, rollback
- api.md — endpoint conventions, auth, error formats
- seo.md — meta tags, schema.org, sitemap rules
- content.md — writing style, tone, forbidden words
- testing.md — test patterns, coverage requirements
Each rule file: 30-60 lines max. Concrete rules, not essays.

### 3. .claude/agents/ (narrow, model-routed)
Create 2-3 agents with restricted tools and cheap models:
deployer.md:
- tools: Bash only
- model: haiku
- purpose: upload files, verify HTTP responses
- output format: table of files + status codes

reviewer.md:
- tools: Read, Grep, Glob, Bash
- model: haiku
- purpose: audit code/content for project-specific rules
- output format: checklist ✅/❌

writer.md (if content project):
- tools: Read, Edit, Write, Bash, Grep
- model: sonnet
- purpose: write content following project rules
- must include: "Execute immediately. Do NOT plan."

### 4. ~/.claude/CLAUDE.md — verify Token Efficiency section exists
If ~/.claude/CLAUDE.md doesn't have a Token Efficiency section, add one with these rules:
- Read once → reuse (never read same data twice)
- One agent = one completed deliverable (no "here's my plan" results)
- Agents are expensive (~25-30K tokens overhead each) — use tools directly for simple tasks
- Minimal reads, precise edits (offset/limit, Grep to verify)
- Template then transform for file variants (cp → sed tech fields → agent for content)
- Model routing: haiku for reviewers/deployers, sonnet for writers/debuggers
- After ExitPlanMode: tell agents "Plan mode is NOT active"
- Short sessions: fresh session after major milestone

After creating all files, show me the final tree and line counts.

Почему этот промпт реально снижает расход токенов

Этот промпт решает главную проблему — убирает лишний контекст до начала работы.

Claude Code:

  • получает четкую структуру
  • понимает зоны ответственности
  • не читает весь проект

В результате:

  • меньше лишних обращений к файлам
  • меньше повторных чтений
  • меньше «разведки»

И как итог — снижение расхода токенов в 2–3 раза на практике.

Когда агенты помогают, а когда мешают

Агенты — мощный инструмент, но их часто используют неправильно.

Они нужны там, где есть цепочка действий:

  • деплой проекта
  • проверка сборки
  • автоматические тесты

Но если задача простая (например, изменить текст), агент только увеличивает расход токенов.

Claude сначала должен:

  • понять, зачем агент
  • загрузить его инструкции
  • применить их

И только потом выполнить задачу.

В итоге простое действие становится дороже, чем должно быть.

Правильный подход:

  • сложные сценарии → через агентов
  • простые правки → напрямую

Практическая инструкция: как снизить расход токенов за 15–30 минут

Если нужно быстро привести проект в порядок, действуйте так:

  1. Создайте CLAUDE.md
    Опишите:
    • тип проекта
    • стек
    • структуру папок
    • общие правила
  2. Вынесите правила в отдельные файлы
    Не смешивайте фронтенд, SEO и архитектуру
  3. Удалите дубли
    Если правило встречается в двух местах — это проблема
  4. Ограничьте использование агентов
    Оставьте только там, где есть сложная логика

После этого Claude Code начинает работать заметно быстрее и дешевле.

На практике экономия может доходить до 2–3 раз по токенам, особенно на повторяющихся задачах.

Частые ошибки, из-за которых Claude «жрет» токены

Есть несколько типичных проблем, которые встречаются почти в каждом проекте:

  1. Один файл с «всем подряд»
  2. Дубли правил в разных местах
  3. Отсутствие структуры проекта
  4. Использование агентов без необходимости
Частые ошибки, из-за которых Claude «жрет» токены

Каждая из этих ошибок заставляет Claude читать больше, чем нужно.
А значит — платить приходится за лишнюю работу.

Итог: почему Claude Code тратит много токенов

Claude Code не «прожорливый». Он просто честно выполняет свою задачу — разобраться в проекте.

Если проект:

  • структурирован
  • логичен
  • без дублей

→ расход токенов падает

Если проект:

  • хаотичный
  • перегруженный
  • с дублирующими правилами

→ токены улетают в никуда

И это ключевой момент, который многие упускают.

Часто задаваемые вопросы

Почему Claude Code тратит много токенов даже на простых задачах?

Потому что модель сначала пытается понять структуру проекта. Если она неочевидна, Claude читает лишние файлы и тянет дополнительный контекст, что увеличивает расход токенов.

Как уменьшить расход токенов в Claude Code?

Нужно структурировать проект: разделить правила, убрать дубли, создать понятный CLAUDE.md и ограничить использование агентов. Тогда модель будет брать только нужный контекст.

Влияет ли структура проекта на стоимость Claude API?

Да, напрямую. Чем больше лишнего контекста читает модель, тем больше токенов расходуется, а значит — выше стоимость работы.

Нужно ли использовать агентов в Claude Code?

Только для сложных сценариев. Для простых задач агенты увеличивают расход токенов и усложняют выполнение.

Можно ли снизить расход токенов без изменения проекта?

Частично — через промпты. Но основной эффект дает именно правильная структура проекта. Без нее расход будет оставаться высоким.

Поделитесь Вашим мнением
Ваш комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Еще записи из этой же рубрики

Что будем искать? Например,Технология

Минуту внимания
Мы используем cookies для корректной работы сайта и понимания, как им пользуются читатели.