Senior Software Engineer & AI Architect. Проектирую высоконагруженные Event-Driven системы и low-latency пайплайны. Специализируюсь на создании автономных AI-агентов (RAG, TTS, VTube Studio) и глубокой интеграции LLM в real-time стриминговые среды.

Инженерный профиль

Разрабатываю распределённые программные комплексы на стыке Game State Integration (GSI), векторных баз данных и локальных LLM. Основной фокус — архитектура отказоустойчивых систем с нулевой задержкой (zero-latency pipelines) для обработки телеметрии, памяти ИИ и генерации контента в реальном времени.

Строго придерживаюсь принципов SOLID, чистой архитектуры и Single Source of Truth (SSOT). Имею глубокую экспертизу в построении мостов между ML-моделями (Ollama, Fish Speech), виртуальными аватарами (VTube Studio) и конечным пользователем через асинхронные микросервисы (Python/FastAPI) и высокопроизводительные аудио-трансиверы (C#/.NET).

Architecture Event-Driven & Microservices
Real-Time Zero-Latency AI Streaming

Технологический стек

AI & Audio Engineering

Local LLMs (Qwen / DeepSeek) RAG (pgvector) Fish Speech TTS Engine C# / .NET 8 (NAudio) Raw PCM Audio Routing Semantic Token Chunking

Backend & Systems

Python 3.12 (Expert) AsyncIO / Multi-threading aiohttp / FastAPI Pydantic v2 SQLAlchemy 2.0 PostgreSQL / Redis

Infrastructure & Ops

Infrastructure as Code (IaC) Ansible / Terraform Docker & Compose Stack Elasticsearch / Kibana Cloudflare Edge Config Zero Trust Security

Integration & Real-time

WebSocket (Event Bus) VTube Studio API (Emotions) Dota 2 GSI (Deep Parsing) Twitch EventSub / TwitchIO OBS WebSocket 5.x REST & GraphQL APIs

Системная архитектура и проекты

Autonomous AI Streaming Pipeline (Lyralei Core)

Полностью асинхронный пайплайн для автономного ИИ-агента, взаимодействующего с аудиторией в прямом эфире. Архитектура объединяет LLM, RAG-систему, TTS-движки и VTube Studio для генерации контекстно-зависимых эмоциональных реакций без задержек.

  • Semantic Streaming & PCM Routing: Интеллектуальный парсинг токенов от локальной модели. Потоковая передача сырого PCM-аудио через микросервис на C# (.NET 8) напрямую в виртуальные кабели (zero-latency).
  • Dynamic Avatar Control: Прямая интеграция с VTube Studio по WebSockets. Синхронное переключение эмоций (гнев, радость, плач) и лицевых анимаций 2D-аватара на основе семантического анализа ответа ИИ.
  • Deep GSI Hub: Асинхронный парсинг GSI-пакетов Dota 2 (100мс). Анализ микро-событий (смерти курьеров, промахи ультимейтами, tilt-фактор) для триггера уникальных реакций агента.
  • Long-term Vector Memory (RAG): Внедрение долгосрочной памяти на базе PostgreSQL (pgvector). Автоматическое сохранение игровых ошибок и истории зрителей для генерации персонализированного троллинга.
Python 3.12 RAG (pgvector) Fish Speech VTube Studio API Raw PCM Dota 2 GSI

Distributed Matchmaking Core

Высокодоступная распределённая система организации матчей, спроектированная по принципам Stateless Architecture. Контроль состояния вынесён в централизованный Single Source of Truth на базе MongoDB.

  • Distributed State Management: Использование атомарных транзакций БД для предотвращения Race Conditions при шардировании лобби в условиях высококонкурентного доступа.
  • Self-Healing Infrastructure: Реализация фоновых воркеров и Garbage Collector на базе TTL-индексов для автоматической резолюции дедлоков и очистки сиротских сессий.
  • Algorithm Engineering: Кастомный балансировщик (Snake Draft) с эвристической оценкой скрытого пула метрик и учётом ролевой синергии.
Python 3.12 MongoDB Distributed Systems Algorithmic Balancing

Cloud Infrastructure & Edge Security

Проектирование и эксплуатация независимой облачной инфраструктуры. Архитектура построена по принципам Zero Trust и Attack Surface Reduction для безопасного деплоя ML-моделей и потоковых сервисов.

  • Strict Containment: Изоляция AI-моделей, баз данных и аналитических нодов в закрытых сетях Docker. Унифицированное управление деплоем через IaC и Makefile.
  • Edge Defense: Интеграция Cloudflare и Nginx. Реализация агрессивного WAF, защита от L7-атак и обфускация топологии сети. Валидация всех входящих WebSocket-соединений.
  • Real-time Observability: Стек ELK (Elasticsearch/Kibana) для глубокого мониторинга бизнес-метрик, задержек генерации и аномалий в системных логах.
Cloud Infrastructure Docker / Makefile Nginx / TLS 1.3 Cloudflare WAF Elastic Stack

Связь & Контакты

Открыт к обсуждению сложных архитектурных решений, проектирования высоконагруженных систем и нестандартных инженерных задач в области AI и потоковой передачи данных.