Проектирую высоконагруженные Event-Driven системы и low-latency пайплайны. Специализируюсь на создании автономных AI-агентов, интеграции векторных баз данных (RAG) и глубоком встраивании LLM в real-time стриминговые среды.

Инженерный профиль

Разрабатываю распределённые программные комплексы на стыке Game State Integration (GSI), баз данных и локальных нейросетевых моделей. Основной фокус направлен на архитектуру отказоустойчивых систем с нулевой задержкой (zero-latency pipelines) для обработки телеметрии, формирования долгосрочной памяти ИИ и генерации мультимедийного контента в реальном времени.

Жёстко придерживаюсь принципов чистого кода, строгой типизации и Single Source of Truth (SSOT). Обладаю глубокой экспертизой в построении мостов между ML-моделями, виртуальными аватарами и конечным пользователем через асинхронные микросервисы, WebSocket-шины и высокопроизводительные аудио-трансиверы.

Architecture Event-Driven & Microservices
Real-Time Zero-Latency AI Streaming

Технологический стек

AI & Audio Engineering

Local LLMs RAG (pgvector) Fish Speech TTS C# / .NET 8 (NAudio) Raw PCM Routing Semantic Chunking

Backend & Systems

Python 3.12 AsyncIO FastAPI / aiohttp SQLAlchemy 2.0 PostgreSQL Redis

Infrastructure & Ops

Docker & Compose Zero Trust Security Cloudflare Edge Elastic Stack Nginx / TLS 1.3 IaC (Make/Ansible)

Integration & Real-time

WebSocket Bus Dota 2 GSI Parsing TwitchIO / EventSub VTube Studio API OBS WebSocket GraphQL

Системная архитектура

Autonomous AI Streaming Pipeline (Lyralei Core)

Полностью асинхронный пайплайн для автономного ИИ-агента, взаимодействующего со зрителями Twitch в прямом эфире. Архитектура объединяет LLM, RAG-систему, TTS-движки и VTube Studio для генерации контекстно-зависимых реакций.

  • Semantic Streaming & PCM Routing: Интеллектуальный парсинг токенов. Потоковая передача сырого PCM-аудио через микросервис на C# напрямую в виртуальные кабели.
  • Dynamic Avatar Control: Прямая интеграция с VTube Studio. Синхронное переключение эмоций и лицевых анимаций 2D-аватара на основе семантического анализа.
  • Deep GSI Hub: Асинхронный парсинг GSI-пакетов Dota 2. Анализ микро-событий для триггера уникальных ответов.
  • Long-term Vector Memory: Внедрение памяти на базе PostgreSQL (pgvector). Сохранение истории для генерации персонализированного контента.
Python 3.12 SQLAlchemy 2.0 TwitchIO pgvector Raw PCM GSI

Distributed Matchmaking Core

Высокодоступная распределённая система организации матчей, спроектированная по принципам Stateless Architecture. Контроль состояния вынесён в централизованный узел.

  • Distributed State Management: Использование атомарных транзакций для предотвращения Race Conditions при шардировании лобби.
  • Self-Healing Infrastructure: Реализация фоновых воркеров для автоматической резолюции дедлоков и очистки сиротских сессий.
  • Algorithm Engineering: Кастомный балансировщик с эвристической оценкой скрытого пула метрик и учётом ролевой синергии.
Python 3.12 MongoDB Distributed Systems Algorithmic Balancing

Cloud Infrastructure & Edge Security

Проектирование и эксплуатация независимой облачной инфраструктуры. Архитектура построена по принципам Zero Trust для безопасного деплоя ML-моделей и потоковых сервисов.

  • Strict Containment: Изоляция AI-моделей и баз данных в закрытых сетях Docker. Унифицированное управление деплоем.
  • Edge Defense: Интеграция Cloudflare и Nginx. Защита от L7-атак, обфускация топологии сети и валидация WebSocket-соединений.
  • Real-time Observability: Стек ELK для глубокого мониторинга бизнес-метрик, задержек генерации и системных логов.
Docker Stack Nginx Cloudflare WAF Elastic Stack Zero Trust

Связь & Контакты

Открыт к обсуждению сложных архитектурных решений, проектирования высоконагруженных систем и нестандартных инженерных задач в области AI и потоковой передачи данных.