Кластер #4317 - News Clusters

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM

cooling

Тип события	other
Тема	computational efficiency
Организация
Страна

Статей	1
Уник. источников	1
Важность / Момент	0.69 / 0
Период	30.03.2026 08:00 — 30.03.2026 08:00
Создан	06.04.2026 06:35:14

Статьи в кластере 1

Заголовок

Источник

Дата публикации

Score

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM

habr_ai

30.03.2026 08:00

Embedding sim.	1
Entity overlap	1
Title sim.	1
Time proximity	1

NLP тип	other
NLP организация
NLP тема	computational efficiency
NLP страна

Открыть оригинал

Кэширование включено, а cached_tokens всё равно не растут? Часто проблема не в модели и не в провайдере. Hit rate обычно режут совсем другие вещи: timestamp в начале запроса, плавающий порядок tools, разные реплики, RAG с нестабильным порядком чанков и слишком короткая жизнь KV-кэша. В статье разбираю 7 типовых анти-паттернов, которые убивают prefix_cache_hit в проде.
 Читать далее