Senior Software Engineer & AI Architect. Проектирую высоконагруженные Event-Driven системы и low-latency пайплайны для потоковой обработки медиаданных. Специализируюсь на глубокой интеграции LLM и аудио-шлюзов в real-time среды.

Инженерный профиль

Разрабатываю распределённые программные комплексы на стыке Game State Integration (GSI) и локальных LLM. Основной фокус — архитектура отказоустойчивых систем с нулевой задержкой (zero-latency pipelines) для обработки телеметрии и генерации контента в реальном времени.

Строго придерживаюсь принципов SOLID, чистой архитектуры и Single Source of Truth (SSOT). Имею глубокую экспертизу в построении мостов между ML-моделями (Ollama, Hugging Face) и конечным пользователем через асинхронные микросервисы (Python/FastAPI) и высокопроизводительные аудио-трансиверы (C#/.NET). Оптимизирую критические узлы, избегая излишней абстракции там, где требуется прямой доступ к памяти и сокетам.

Architecture Event-Driven & Microservices
Real-Time Zero-Latency Streaming

Технологический стек

AI & Audio Engineering

Local LLMs (Ollama / Qwen) Fish Speech TTS Engine C# / .NET 8 (NAudio) Raw PCM Audio Routing Semantic Token Chunking Jitter Buffers

Backend & Systems

Python 3.12 (Expert) AsyncIO / Multi-threading aiohttp / FastAPI Pydantic v2 (Data Validation) SQLAlchemy 2.0 (Core & ORM) Alembic (Migrations)

Infrastructure & Ops

Infrastructure as Code (IaC) Ansible / Terraform Docker & Compose Stack / Makefile PostgreSQL / pgvector Elasticsearch / Kibana Cloudflare Edge Config

Integration & Real-time

WebSocket (Real-time Push) OBS WebSocket 5.x Dota 2 GSI (High-level Parsing) Twitch EventSub / TwitchIO VTube Studio API (pyvts) REST & GraphQL APIs

Системная архитектура и проекты

Autonomous AI Streaming Pipeline (Lyralei Core)

Полностью асинхронный пайплайн для автономного ИИ-агента, взаимодействующего с аудиторией в прямом эфире. Архитектура объединяет LLM, TTS-движки, RAG-систему и обработку игрового состояния для генерации контекстно-зависимых реакций без задержек.

  • Semantic Streaming: Интеллектуальный парсинг токенов от локальной модели. Динамическое сегментирование фраз по смысловым блокам для немедленной генерации звука без ожидания полного ответа сети.
  • Raw PCM Audio Engine: Высокопроизводительный микросервис на C# (.NET 8) с использованием NAudio. Принимает бинарный аудиопоток по WebSockets и маршрутизирует его в виртуальные аудиоинтерфейсы.
  • Low-Latency GSI Hub: Асинхронная обработка GSI-пакетов (частота опроса 100мс). Идентификация ключевых игровых метрик для инициирования динамической смены контекста ИИ-агента.
  • Vector Memory (RAG): Имплементация долгосрочной памяти на базе PostgreSQL (pgvector) для хранения и быстрого поиска релевантного семантического контекста.
Python 3.12 C# .NET 8 Ollama / RAG Raw PCM WebSockets Game State Integration

Distributed Matchmaking Core

Высокодоступная распределённая система организации матчей, спроектированная по принципам Stateless Architecture. Контроль состояния вынесён в централизованный Single Source of Truth на базе MongoDB.

  • Distributed State Management: Использование атомарных транзакций БД для предотвращения Race Conditions при шардировании лобби в условиях высококонкурентного доступа.
  • Self-Healing Infrastructure: Реализация фоновых воркеров и Garbage Collector на базе TTL-индексов для автоматической резолюции дедлоков и очистки сиротских сессий.
  • Algorithm Engineering: Кастомный балансировщик (Snake Draft) с эвристической оценкой скрытого пула метрик и учётом ролевой синергии.
  • Ephemeral UX Pattern: Внедрение архитектуры на базе Interaction Tokens, радикально снижающей квоты обращений к внешним API.
Python 3.12 MongoDB (Atomic Ops) Distributed Systems Algorithmic Balancing Concurrency Control

Cloud Infrastructure & Edge Security

Проектирование и эксплуатация независимой облачной инфраструктуры. Архитектура построена по принципам Zero Trust и Attack Surface Reduction для безопасного деплоя ML-моделей и потоковых сервисов.

  • Strict Containment: Изоляция AI-моделей, баз данных и аналитических нодов в закрытых сетях Docker. Унифицированное управление деплоем через IaC и Makefile для детерминированного развёртывания сред.
  • Edge Defense: Интеграция Cloudflare и Nginx. Реализация агрессивного WAF, защита от L7-атак и обфускация топологии сети. Валидация всех входящих WebSocket-соединений и Webhook-пейлоадов.
  • Real-time Observability: Стек ELK (Elasticsearch/Kibana) для глубокого мониторинга бизнес-метрик, задержек генерации и аномалий в системных логах.
  • Resource Allocation: Балансировка вычислительной нагрузки на GPU/CPU в условиях ограничений облачного инстанса для поддержания стабильного TPS (Tokens Per Second).
Cloud Infrastructure Docker / Makefile Nginx / TLS 1.3 Cloudflare WAF Elastic Stack Zero Trust Security

Связь & Контакты

Открыт к обсуждению сложных архитектурных решений, проектирования высоконагруженных систем и нестандартных инженерных задач.