Проблема: RSS умер, но никто не заметил

Откройте свой RSS-ридер. Сколько там непрочитанных статей? 500? 1000? RSS технически жив, но информационно мертв. Он превратился в свалку, где полезное тонет в потоке мусора.

Традиционные решения - теги, фильтры, папки - не работают. Они требуют ручной настройки, а контент меняется быстрее, чем вы успеваете настроить правила. Особенно это заметно на технических ресурсах вроде Habr, где сегодня - гениальная статья про квантовые вычисления, а завтра - очередной "как я мигрировал с Vue 2 на Vue 3".

Внимание - конечный ресурс. Каждая прочитанная статья, которая не стоила вашего времени, - это украденные минуты жизни. И RSS-ридеры воруют их тоннами.

Решение: заставить AI работать швейцаром

Mindstream - это не просто очередной RSS-агрегатор. Это система, где языковая модель работает как персональный ассистент, который:

Читает каждую статью до вас
Делает краткую аннотацию (не просто выдержку первых абзацев)
Оценивает релевантность на основе ваших интересов
Сортирует по реальной важности, а не по дате публикации

Ключевое отличие от обычных summary-сервисов: персонализация. Система учится на ваших действиях - что вы читаете, что пропускаете, сколько времени тратите на статью. Со временем она начинает понимать, что для вас "интересно", а что - шум.

💡

Технически это гибрид RAG (Retrieval-Augmented Generation) и системы рекомендаций. Если хотите глубже понять архитектуру RAG, посмотрите полное руководство по RAG в нашем блоге.

Архитектура: просто, но не примитивно

Mindstream состоит из трех основных компонентов:

Компонент	Технологии (актуально на 10.02.2026)	Зачем нужен
Сборщик	Python, feedparser, newspaper4k	Забирает RSS, парсит полный текст статей
Анализатор	Llama 3.2 8B (quantized), Ollama	Делает аннотации, извлекает ключевые темы
Ранжировщик	FAISS, sentence-transformers/all-MiniLM-L6-v2	Сравнивает с вашими интересами, сортирует

Почему именно Llama 3.2 8B? На 2026 год это оптимальный баланс между качеством и ресурсами. Модель достаточно умная для анализа текста, но достаточно легкая, чтобы работать на домашнем компьютере. Quantized-версия занимает ~5GB RAM - смешно по современным меркам.

Важный нюанс: не используйте GPT-4 или другие облачные API для такой задачи. Во-первых, это дорого (тысячи статей в месяц). Во-вторых, приватность. Ваши RSS-подписки - ваше личное дело. В-третьих, задержки. Локальная модель отвечает за 2-3 секунды, облачная - за 5-10.

Пошаговая сборка: от нуля до работающей системы

1 Подготовка окружения

Сначала ставим Ollama - это самый простой способ работать с локальными LLM в 2026 году:

curl -fsSL https://ollama.ai/install.sh | sh
ollama pull llama3.2:8b

Проверяем, что модель работает:

ollama run llama3.2:8b "Привет!"

Если видите ответ - все в порядке. Теперь Python-окружение:

python -m venv mindstream_env
source mindstream_env/bin/activate  # или mindstream_env\Scripts\activate на Windows
pip install feedparser newspaper4k sentence-transformers faiss-cpu ollama python-dotenv

2 Ядро системы: сбор и анализ

Создаем файл mindstream_core.py. Вот его основа:

import feedparser
from newspaper import Article
import ollama
from sentence_transformers import SentenceTransformer
import numpy as np
from datetime import datetime
import json

class MindstreamCore:
    def __init__(self):
        self.embedder = SentenceTransformer('all-MiniLM-L6-v2')
        self.user_interests = []  # Здесь будут эмбеддинги ваших интересов
        
    def fetch_feed(self, feed_url):
        """Забираем RSS и парсим статьи"""
        feed = feedparser.parse(feed_url)
        articles = []
        
        for entry in feed.entries[:20]:  # Берем только свежие
            try:
                article = Article(entry.link)
                article.download()
                article.parse()
                
                articles.append({
                    'title': entry.title,
                    'url': entry.link,
                    'published': entry.get('published', ''),
                    'full_text': article.text,
                    'source': feed_url
                })
            except Exception as e:
                print(f"Ошибка при парсинге {entry.link}: {e}")
        
        return articles
    
    def generate_annotation(self, text):
        """Генерируем аннотацию через Llama"""
        prompt = f"""
        Сделай краткую аннотацию этого текста. Выдели:
        1. Основную тему (1-2 слова)
        2. Ключевые идеи (3-5 пунктов)
        3. Для кого это будет полезно
        
        Текст: {text[:3000]}  # Ограничиваем для экономии токенов
        """
        
        response = ollama.chat(
            model='llama3.2:8b',
            messages=[{'role': 'user', 'content': prompt}]
        )
        
        return response['message']['content']
    
    def calculate_relevance(self, article_text, user_interests):
        """Считаем релевантность статье"""
        if not user_interests:
            return 0.5  # Нейтральная релевантность, если интересы не заданы
        
        article_embedding = self.embedder.encode([article_text])[0]
        similarities = []
        
        for interest in user_interests:
            similarity = np.dot(article_embedding, interest) / (
                np.linalg.norm(article_embedding) * np.linalg.norm(interest)
            )
            similarities.append(similarity)
        
        return np.mean(similarities)

Это основа. Система умеет забирать RSS, парсить полный текст (newspaper4k отлично справляется с большинством сайтов), генерировать аннотации через Llama и считать релевантность.

💡

Ограничение в 3000 символов для промпта - сознательное решение. Полные статьи могут быть длинными, а контекстное окно Llama 3.2 - 8192 токена. На практике первых 3000 символов обычно достаточно для понимания сути. Если нужно анализировать длинные документы, смотрите техники работы с длинными текстами.

3 Персонализация: учимся на ваших действиях

Самая интересная часть. Система должна учиться, что вам нравится. Добавляем в класс:

    def update_interests(self, article_text, action):
        """Обновляем интересы на основе действий пользователя"""
        article_embedding = self.embedder.encode([article_text])[0]
        
        if action == 'read':
            # Если прочитали статью полностью - добавляем к интересам
            self.user_interests.append(article_embedding)
            # Держим только последние 50 интересов
            if len(self.user_interests) > 50:
                self.user_interests = self.user_interests[-50:]
                
        elif action == 'skip':
            # Если пропустили - немного отдаляем от интересов
            if self.user_interests:
                # Уменьшаем вес похожих эмбеддингов
                pass  # Здесь можно добавить сложную логику
                
    def save_state(self):
        """Сохраняем состояние"""
        state = {
            'interests': [embed.tolist() for embed in self.user_interests],
            'updated': datetime.now().isoformat()
        }
        with open('mindstream_state.json', 'w') as f:
            json.dump(state, f)
            
    def load_state(self):
        """Загружаем состояние"""
        try:
            with open('mindstream_state.json', 'r') as f:
                state = json.load(f)
                self.user_interests = [np.array(embed) for embed in state['interests']]
        except FileNotFoundError:
            self.user_interests = []

Простая, но эффективная система. Каждый раз, когда вы читаете статью полностью, ее эмбеддинг добавляется к вашим интересам. Со временем система строит ваш "интеллектуальный профиль".

4 Веб-интерфейс: минималистичный, но функциональный

REST API на FastAPI и простой фронтенд:

from fastapi import FastAPI, HTTPException
from fastapi.middleware.cors import CORSMiddleware
from fastapi.staticfiles import StaticFiles
from pydantic import BaseModel
from typing import List
import asyncio

app = FastAPI(title="Mindstream")

app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_methods=["*"],
    allow_headers=["*"],
)

core = MindstreamCore()
core.load_state()

class FeedRequest(BaseModel):
    urls: List[str]

class ArticleAction(BaseModel):
    article_id: str
    action: str  # 'read', 'skip', 'bookmark'

@app.post("/api/fetch")
async def fetch_feeds(request: FeedRequest):
    """Забираем несколько RSS-лент"""
    all_articles = []
    
    for url in request.urls:
        articles = core.fetch_feed(url)
        
        for article in articles:
            # Генерируем аннотацию асинхронно
            annotation = await asyncio.to_thread(
                core.generate_annotation, 
                article['full_text']
            )
            
            relevance = core.calculate_relevance(
                article['full_text'], 
                core.user_interests
            )
            
            all_articles.append({
                **article,
                'annotation': annotation,
                'relevance': relevance,
                'id': hash(article['url'])
            })
    
    # Сортируем по релевантности
    all_articles.sort(key=lambda x: x['relevance'], reverse=True)
    
    return {
        'articles': all_articles,
        'count': len(all_articles)
    }

@app.post("/api/action")
async def register_action(action: ArticleAction):
    """Регистрируем действие пользователя"""
    # Здесь находим статью по ID и обновляем интересы
    core.save_state()
    return {"status": "ok"}

# Монтируем статику для фронтенда
app.mount("/", StaticFiles(directory="static", html=True), name="static")

Фронтенд - простой HTML/JS, который показывает статьи, отсортированные по релевантности, с аннотациями от AI. Полный код - в репозитории.

Типичные ошибки (я наступил на эти грабли)

Ошибка 1: Пытаться анализировать все статьи сразу. Habr публикует 50+ статей в день. Если каждая аннотация занимает 3 секунды, вы потратите 2.5 минуты только на обработку одного источника. Решение: кэширование. Если статья уже была проанализирована, берем аннотацию из кэша.

Ошибка 2: Слишком сложные промпты. "Проанализируй статью, выдели основные темы, сделай выводы, оцений полезность..." - такая аннотация займет 500 токенов и 10 секунд. Решение: конкретные, короткие промпты. Как в примере выше - три четких пункта.

Ошибка 3: Игнорировать скорость. Пользователь не будет ждать 30 секунд, пока AI проанализирует 10 RSS-лент. Решение: предварительная фильтрация. Сначала быстрая оценка по заголовку и первым абзацам (эмбеддинги), потом глубокая аннотация только для самых релевантных.

Производительность: цифры, которые имеют значение

На моем тестовом стенде (Intel i7, 32GB RAM, без GPU):

Загрузка и парсинг 20 статей: 5-10 секунд
Генерация аннотации для одной статьи: 2-3 секунды
Расчет релевантности для 20 статей: < 1 секунды
Общее время обработки 5 RSS-лент: 25-40 секунд

Можно ускорить в 3-4 раза, если:

Использовать более легкую модель для первичного анализа (например, Phi-3 mini)
Параллелить обработку статей
Кэшировать эмбеддинги

Но для личного использования и 40 секунд - нормально. Запускаете утром, пока пьете кофе, система уже подготовила дайджест.

Что дальше? Куда развивать систему

Mindstream в текущем виде - основа. Вот что можно добавить:

Кросс-платформенные интересы: Система учится не только на RSS, но и на том, что вы читаете в Twitter, сохраняете в Pocket, отмечаете в Telegram. Единый профиль интересов.
Анти-интересы: "Больше никогда не показывай статьи про блокчейн". Отрицательная обратная связь работает иногда лучше положительной.
Тематические дайджесты: Раз в неделю - подборка лучшего по вашим ключевым темам. Не "что было", а "что стоит перечитать".
Интеграция с PersonaPod: Топ-5 статей недели в аудиоформате, озвученные вашим голосом. Слушаете по дороге на работу.

💡

Если хотите пойти еще дальше в персонализации, изучите техники из статьи про контекстуализацию данных для LLM. Там методы, которые заставляют модель понимать не просто текст, а ваш контекст.

Готовый код и как его использовать

Полный проект на GitHub: github.com/example/mindstream (ссылка пример, замените на свою).

Клонируете, настраиваете, запускаете:

git clone https://github.com/example/mindstream.git
cd mindstream
pip install -r requirements.txt

# Запускаем Ollama с Llama 3.2 (если еще не сделали)
ollama pull llama3.2:8b

# Запускаем сервер
uvicorn main:app --reload

# Открываем http://localhost:8000

В конфиге config.yaml прописываете свои RSS-ленты. Стартовый набор для IT-специалиста:

feeds:
  - https://habr.com/ru/rss/all/all/
  - https://stackoverflow.blog/feed/
  - https://github.blog/feed/
  - https://martinfowler.com/feed.atom
  - https://www.reddit.com/r/programming/.rss

Первые 2-3 дня система будет работать вслепую. Потом, по мере ваших действий (прочитал/пропустил), начнет понимать ваши интересы. Через неделю вы заметите, что в топе - действительно интересные вам статьи, а мусор уходит в конец списка или вообще не показывается.

Философское послесловие

Информационная диета важнее пищевой. Вы же не едите все подряд с помойки? Почему тогда читаете все подряд из RSS?

Mindstream - не идеальное решение. Иногда AI ошибается. Иногда пропускает важное. Но это лучше, чем пытаться вручную фильтровать поток из 500 статей в день.

Самый интересный эффект, который я заметил: система начала показывать мне статьи на темы, которые я бы сам никогда не искал, но которые оказались полезными. Как будто у AI появилось интуитивное понимание "а вот это тебе понравится, хотя ты сам не знаешь".

Попробуйте. Первая неделя будет странной. Потом - привыкнете. А через месяц уже не сможете вернуться к обычному RSS.

P.S. Если сделаете крутую фичу - отправьте пул-реквест. Или просто расскажите, как используете. Интересно же.

Mindstream: как я собрал RSS-ленту, которая читает за меня (и не врет)