Публикация AiManual

Бюджетный ПК для анализа PDF с помощью LLM: железо до €1000

Полный гайд по сборке компьютера до 1000 евро для локального AI-анализа PDF. CPU, RAM, GPU, софт. Собираем систему для конфиденциальной обработки документов.

8 мин чтения 07.06.2026

Коротко

Что будет в материале

01
Почему облачные API — это грабеж, а не решение
02
Что мы реально можем запустить за €1000?
03
Спецификация сборки: разбор каждого компонента
04
Итоговая конфигурация и цены (июнь 2026, Европа)

Почему облачные API — это грабеж, а не решение

Каждый раз, когда вы отправляете PDF в ChatGPT или Claude, вы платите дважды: деньгами и конфиденциальностью. Счет за месяц легко переваливает за €50, если вы анализируете хотя бы пару десятков документов в день. А если это медицинские отчеты или юридические контракты — вы вообще не имеете права их туда отправлять.

Локальный LLM, работающий на бюджетном ПК, решает обе проблемы. В 2026 году это уже не фантастика: квантизованные модели 7B-13B параметров выдают адекватные ответы на документах, а железо под них стоит меньше, чем подписка на API за полгода.

Я собрал такую систему за €870 (по курсу июня 2026) и получаю 25-40 токенов/сек на Phi-3.5-mini и Qwen2.5-7B. Этого хватает для извлечения сути из 100-страничных PDF за 2-3 минуты.

Что мы реально можем запустить за €1000?

Забудьте про 70B-модели — они требуют 48+ GB VRAM и стоят как подержанный автомобиль. Наш бюджет — это лига 7B-13B моделей после 4-битной квантизации. Они занимают 4-8 GB RAM/VRAM и выдают связные ответы на русском и английском.

Конкретные варианты на июнь 2026:

Phi-3.5-mini (3.8B) — легковес, работает даже на CPU, но качество страдает на сложных юридических текстах.
Qwen2.5-7B-Instruct (4-bit) — золотая середина: 5 GB в памяти, отличное понимание структуры PDF, поддерживает контекст до 32K токенов.
Llama 3.2-8B (4-bit) — немного тяжелее (6 GB), но на английских контрактах он король.
Gemma-3-12B (4-bit) — свежая модель от Google, занимает ~7 GB, отлично справляется с извлечением таблиц.

Все эти модели влезают в 12 GB VRAM + 16 GB системной памяти. Именно на это мы и будем ориентироваться.

Спецификация сборки: разбор каждого компонента

1 Процессор: Ryzen 5 7500F — идеальный баланс

В тестах APR 2026 Ryzen 5 7500F (6 ядер / 12 потоков, Zen 4) показал лучшую производительность на токен в секунду при работе без GPU среди бюджетных CPU. Его преимущество — поддержка DDR5-5200 и кэш L3 32 MB. Для инференса на CPU критична пропускная способность памяти, и Ryzen с DDR5 выигрывает у Intel Core i5-13400F на 15-20% на моделях 7B.

💡

Альтернатива — Intel Core i5-14400F, если найдете дешевле. Но с ним используйте DDR5-4800 — разница в скорости будет заметна.

2 Видеокарта: RTX 3060 12GB — еще жива и актуальна

Я знаю, что хочется RTX 4060 — она новее, поддерживает DLSS 3, но для LLM количество VRAM важнее архитектуры. RTX 3060 с 12 GB GDDR6 за €280-320 (б/у или акции) позволяет загружать 7B-8B модели на GPU целиком. RTX 4060 всего 8 GB — 13B модель туда уже не влезет.

Еще вариант — Intel Arc A770 16GB за те же деньги. Он имеет 16 GB VRAM, но драйверы для LLM все еще сыроваты: в мае 2026 Intel выпустила патч, улучшивший совместимость с llama.cpp, но производительность на 20% ниже, чем у RTX 3060 (по бенчмаркам Open LLM Leaderboard). Берите RTX 3060 — меньше головной боли.

Осторожно: на eBay много RTX 3060 с дефектной памятью. Покупайте только у проверенных продавцов с гарантией возврата. Просите скриншот GPU-Z.

3 Оперативная память: 32 GB DDR5 — нижняя граница комфорта

16 GB — это мучение. Система будет постоянно свопить на SSD, и скорость упадет до 3-5 токенов/сек. 32 GB (2x16 GB DDR5-5200) — то, что надо. За €85-100 вы получаете возможность одновременно держать модель в VRAM (12 GB) и обрабатывать большие PDF (например, использовать библиотеку unstructured для парсинга, которая жрет до 8 GB RAM).

Если бюджет позволяет, 48 GB (2x24 GB) — идеал, но цена прыгает до €160. Для начала хватит 32.

4 Накопитель: NVMe 1 TB — минимум для моделей и PDF

Модели весят по 3-7 GB каждая, плюс библиотеки, кеш, документы. 500 GB быстро закончатся. Возьмите Crucial P3 Plus 1TB или Samsung 980 — оба дают ~5000 MB/s чтение, что ускоряет загрузку моделей.

5 Блок питания и корпус: 550W и дешевый корпус с сеткой

Компоненты потребляют ~250W под нагрузкой (Ryzen 5 7500F — 65W TDP, RTX 3060 — 170W). Запас в 2 раза — золотое правило. Возьмите be quiet! Pure Power 12 M 550W (€75). Он эффективный (80+ Gold) и тихий.

Корпус — любой за €30-40 с продуваемой передней панелью (например, Zalman S2). Не экономьте на корпусе: плохая вентиляция убьет VRM материнки.

Итоговая конфигурация и цены (июнь 2026, Европа)

Компонент	Модель	Цена (€)
Процессор	AMD Ryzen 5 7500F (tray)	€140
Материнская плата	ASRock B650M-HDV/M.2	€110
Оперативная память	Kingston Fury Beast 32GB DDR5-5200 (2x16)	€95
Видеокарта	NVIDIA RTX 3060 12GB (б/у в отличном состоянии)	€290
Накопитель	Crucial P3 Plus 1TB NVMe	€80
Блок питания	be quiet! Pure Power 12 M 550W	€75
Корпус	Zalman S2	€40
Итого		€830

Остается €170 на кулер CPU (€30), термопасту, возможно дополнительные вентиляторы — и вы укладываетесь в €1000. Если найдете RTX 3060 дешевле (например, €260), можно добавить еще 16 GB RAM.

Программное обеспечение: от установки до первого анализа

Ставим Ollama — самый простой способ запускать LLM. Он поддерживает CUDA, автоматически определяет GPU.

curl -fsSL https://ollama.com/install.sh | sh
ollama pull qwen2.5:7b-instruct-q4_K_M
ollama run qwen2.5:7b-instruct

Для работы с PDF понадобится инструмент, который извлекает текст, таблицы, изображения. Связка Docling + Ollama — идеальный вариант. Docling парсит PDF в Markdown, а Ollama генерирует ответы.

from docling.document_converter import DocumentConverter
converter = DocumentConverter()
result = converter.convert("contract.pdf")
markdown_text = result.document.export_to_markdown()

# Отправляем в Ollama
import subprocess
prompt = f"Извлеки ключевые условия из документа:\n{markdown_text}"
response = subprocess.run(["ollama", "run", "qwen2.5:7b", prompt], capture_output=True, text=True)
print(response.stdout)

Если хотите интерфейс как у ChatGPT, поставьте Open WebUI (ранее Ollama WebUI):

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

💡

Для анализа больших PDF (500+ страниц) используйте RAG. Разбейте документ на чанки, отправьте в векторную базу (ChromaDB) и запрашивайте только релевантные куски. Подробнее — в нашем гайде Локальный RAG для документов.

Ожидаемая производительность: не ждите чуда, но будет работать

На RTX 3060 с Qwen2.5-7B (4-bit) вы получите:

Инференс: 35-45 токенов/сек (среднее 40). Ответ на вопрос по PDF из 50 страниц — 3-5 секунд.
Полный анализ документа (суммаризация 100 страниц, с предварительным парсингом): 2-3 минуты.
Извлечение таблиц из сканов: если PDF — не скан (текстовый), парсинг занимает секунды. Для сканов нужно OCR (Tesseract) — это добавит 1-2 минуты, но модель справится.

Для сравнения, на CPU (только Ryzen 5 7500F, без GPU) та же модель выдает 6-8 токенов/сек — это в 5 раз медленнее. Так что GPU обязателен.

Три фатальные ошибки новичков

Ошибка 1: Экономия на блоке питания. Дешевый блок на 450W не даст стабильного напряжения, и RTX 3060 начнет выключаться при пиковой нагрузке. Результат — система перезагружается в середине анализа. Берите блок от известного бренда с сертификатом 80+ Bronze минимум.

Ошибка 2: Установка Windows 11 без отключения обновлений. Windows может в фоне качать обновления на 4 GB, и модель выгрузится из VRAM в системную память. Используйте Linux (Ubuntu 24.04 LTS) — он потребляет меньше ресурсов и утилиты для LLM под ним дружелюбнее. Если нужен Windows — отключите автоматические обновления через gpedit.msc.

Ошибка 3: Попытка запустить 13B модель на 16GB ОЗУ. Она просто не влезет. Даже на 32GB вы начнете свопить при большой нагрузке. Всегда проверяйте требования к памяти на странице модели в Ollama (ollama show qwen2.5:7b покажет размер).

А что если денег совсем в обрез? Сценарий Ultra-Budget

Если нет €1000, можно собрать систему вообще без дискретной GPU, используя только процессор и много оперативной памяти. Например:

AMD Ryzen 7 8700G (со встроенной графикой RDNA 3) — его iGPU эквивалентна ~RX 6400, но для LLM она не поможет, так как не имеет своей VRAM. Весь инференс ляжет на CPU, используя системную память.
64 GB DDR5 (2x32 GB) — на такой системе можно запустить Phi-3.5-mini или Qwen2.5-7B на CPU со скоростью ~8 токенов/сек. Это медленно, но для ночного анализа сойдет.

Такая сборка обойдется в €600-700. Но я бы советовал добавить еще €200 и взять RTX 3060 — разница в скорости окупится временем.

Будущее бюджетного AI-железа: прогноз на 2027

В конце 2026 года ожидается выход AMD Ryzen 9000G с iGPU на архитектуре RDNA 4, которая может получить 32 MB выделенной памяти (как у Apple M-чипов). Если это произойдет, бюджетные ПК без дискретной карты смогут запускать 7B-модели с приемлемой скоростью. А пока — берите RTX 3060, она еще пару лет будет рабочей лошадкой.

Не забудьте прочитать Self-Hosting LLM в 2026 — там я разбираю, как оптимизировать расходы на электроэнергию и выбрать тариф на хостинг, если захотите выставить API наружу.

Подписаться на канал