Przejdź do głównej zawartości

Wprowadzenie

oh-my-agent to wieloagentowy framework orkiestracji dla IDE i narzędzi CLI zasilanych sztuczną inteligencją. Zamiast polegać na jednym asystencie AI do wszystkiego, oh-my-agent rozdziela pracę pomiędzy 21 wyspecjalizowanych agentów — każdy z nich jest wzorowany na rzeczywistej roli w zespole inżynierskim i posiada własną wiedzę o stosie technologicznym, protokoły wykonawcze, podręczniki obsługi błędów oraz listy kontrolne jakości.

Cały system znajduje się w przenośnym katalogu .agents/ wewnątrz projektu. Przełączaj się między Claude Code, Gemini CLI, Codex CLI, Antigravity IDE, Cursor lub dowolnym innym obsługiwanym narzędziem — konfiguracja agentów podróżuje razem z kodem.


Paradygmat wieloagentowy

Tradycyjni asystenci AI do kodowania działają jako generaliści. Obsługują frontend, backend, bazy danych, bezpieczeństwo i infrastrukturę z tym samym kontekstem promptu i tym samym poziomem kompetencji. Prowadzi to do:

  • Rozwodnienia kontekstu — ładowanie wiedzy z każdej domeny marnuje okno kontekstowe
  • Niespójnej jakości — generalista nie dorówna specjaliście w żadnej pojedynczej domenie
  • Braku koordynacji — złożone funkcjonalności obejmujące wiele domen są realizowane sekwencyjnie

oh-my-agent rozwiązuje to poprzez specjalizację:

  1. Każdy agent dogłębnie zna jedną domenę. Agent frontendowy zna React/Next.js, shadcn/ui, TailwindCSS v4, architekturę FSD-lite. Agent backendowy zna wzorzec Repository-Service-Router, zapytania parametryzowane, uwierzytelnianie JWT. Nie nakładają się na siebie.

  2. Agenci działają równolegle. Podczas gdy agent backendowy buduje API, agent frontendowy już tworzy interfejs użytkownika. Orkiestrator koordynuje pracę poprzez współdzieloną pamięć.

  3. Jakość jest wbudowana. Każdy agent posiada listę kontrolną specyficzną dla domeny oraz podręcznik obsługi błędów. Kontrola wstępna karty (Charter preflight) wyłapuje pełzanie zakresu zanim kod zostanie napisany. Przegląd QA to pełnoprawny krok, a nie dodatkowe działanie po fakcie.


Wszystkie 21 agentów

Ideacja, architektura i planowanie

AgentRolaKluczowe możliwości
oma-brainstormIdeacja z priorytetem projektowaniaEksploruje intencje użytkownika, proponuje 2-3 podejścia z analizą kompromisów, tworzy dokumenty projektowe przed napisaniem jakiegokolwiek kodu. 6-fazowy workflow: Kontekst, Pytania, Podejścia, Projekt, Dokumentacja, Przejście do /plan.
oma-architectureSpecjalista architektury systemówGranice moduł/usługa/własność, analiza kompromisów, synteza interesariuszy. Metodologie: routing diagnostyczny, porównanie design-twice, analiza ryzyka w stylu ATAM, priorytetyzacja w stylu CBAM, zapisy decyzji w stylu ADR. Domyślnie świadomy kosztów.
oma-pmMenedżer produktuRozkłada wymagania na priorytetyzowane zadania z zależnościami. Definiuje kontrakty API. Generuje .agents/results/plan-{sessionId}.json i task-board.md. Obsługuje koncepcje ISO 21500, ramowanie ryzyka ISO 31000, zarządzanie ISO 38500.

Implementacja

AgentRolaStos technologiczny i zasoby
oma-frontendSpecjalista UI/UXReact, Next.js, TypeScript, TailwindCSS v4, shadcn/ui, architektura FSD-lite. Biblioteki: luxon (daty), ahooks (hooki), es-toolkit (narzędzia), Jotai (stan klienta), TanStack Query (stan serwera), @tanstack/react-form + Zod (formularze), better-auth (uwierzytelnianie), nuqs (stan URL). Zasoby: execution-protocol.md, tech-stack.md, tailwind-rules.md, component-template.tsx, snippets.md, error-playbook.md, checklist.md, examples/.
oma-backendSpecjalista API i serweraCzysta architektura (Router-Service-Repository-Models). Niezależny od stosu — wykrywa Python/Node.js/Rust/Go/Java/Elixir/Ruby/.NET z manifestów projektu. JWT + bcrypt do uwierzytelniania. Zasoby: execution-protocol.md, orm-reference.md, examples.md, checklist.md, error-playbook.md. Obsługuje /stack-set do generowania referencji stack/ specyficznych dla języka.
oma-mobileMobilne aplikacje międzyplatformoweFlutter, Dart, Riverpod/Bloc do zarządzania stanem, Dio z interceptorami do wywołań API, GoRouter do nawigacji. Czysta architektura: domain-data-presentation. Material Design 3 (Android) + iOS HIG. Cel: 60fps. Zasoby: execution-protocol.md, tech-stack.md, snippets.md, screen-template.dart, checklist.md, error-playbook.md.
oma-dbArchitektura baz danychModelowanie baz SQL, NoSQL i wektorowych. Projektowanie schematów (domyślnie 3NF), normalizacja, indeksowanie, transakcje, planowanie pojemności, strategia backupów. Obsługuje projektowanie zgodne z ISO 27001/27002/22301. Zasoby: execution-protocol.md, document-templates.md, anti-patterns.md, vector-db.md, iso-controls.md, checklist.md, error-playbook.md.

Projektowanie

AgentRolaKluczowe możliwości
oma-designSpecjalista systemu projektowegoTworzy DESIGN.md z tokenami, typografią, systemami kolorów, projektowaniem ruchu (motion/react, GSAP, Three.js), układami responsive-first, zgodnością z WCAG 2.2. 7-fazowy workflow: Konfiguracja, Ekstrakcja, Ulepszenie, Propozycja, Generacja, Audyt, Przekazanie. Wymusza anty-wzorce (bez "AI slop"). Opcjonalna integracja ze Stitch MCP. Zasoby: design-md-spec.md, design-tokens.md, anti-patterns.md, prompt-enhancement.md, stitch-integration.md, plus katalog reference/ z przewodnikami typografii, kolorów, przestrzeni, ruchu, responsywności, komponentów, dostępności i shaderów.

Infrastruktura, DevOps i obserwowalność

AgentRolaKluczowe możliwości
oma-tf-infraInfrastruktura jako kodWielochmurowy Terraform (AWS, GCP, Azure, Oracle Cloud). Uwierzytelnianie OIDC-first, IAM z zasadą minimalnych uprawnień, polityka jako kod (OPA/Sentinel), optymalizacja kosztów. Obsługuje kontrole AI ISO/IEC 42001, ciągłość działania ISO 22301, dokumentację architektury ISO/IEC/IEEE 42010. Zasoby: multi-cloud-examples.md, cost-optimization.md, policy-testing-examples.md, iso-42001-infra.md, checklist.md.
oma-dev-workflowAutomatyzacja zadań monorepoMenedżer zadań mise, pipeline CI/CD, migracje baz danych, koordynacja wydań, hooki git, walidacja pre-commit. Zasoby: validation-pipeline.md, database-patterns.md, api-workflows.md, i18n-patterns.md, release-coordination.md, troubleshooting.md.
oma-observabilityRouter obserwowalności oparty na intencjiPokrycie sygnałów MELT+P (metrics/logs/traces/profiles/cost/audit/privacy), strojenie transportu (UDP/MTU, OTLP gRPC vs HTTP, topologia Collectora, próbkowanie), propagacja W3C Trace Context, zarządzanie SLO i alerty burn-rate, analiza śledcza incydentów (lokalizacja 6-wymiarowa), meta-obserwowalność (self-health, synchronizacja zegara, kardynalność, retencja). CNCF-first; Fluentd wycofany (użyj Fluent Bit lub OTel Collector).

Jakość i debugowanie

AgentRolaKluczowe możliwości
oma-qaZapewnienie jakościAudyt bezpieczeństwa (OWASP Top 10), analiza wydajności, dostępność (WCAG 2.1 AA), przegląd jakości kodu. Poziomy: CRITICAL/HIGH/MEDIUM/LOW z plik:linia i kodem naprawczym. Obsługuje charakterystyki jakości ISO/IEC 25010 i dopasowanie testów ISO/IEC 29119. Zasoby: execution-protocol.md, iso-quality.md, checklist.md, self-check.md, error-playbook.md.
oma-debugDiagnoza i naprawa błędówMetodologia reproduce-first. Analiza przyczyn źródłowych, minimalne poprawki, obowiązkowe testy regresji, skanowanie podobnych wzorców. Używa Serena MCP do śledzenia symboli. Zasoby: execution-protocol.md, common-patterns.md, debugging-checklist.md, bug-report-template.md, error-playbook.md.

Lokalizacja, koordynacja i Git

AgentRolaKluczowe możliwości
oma-translatorTłumaczenie uwzględniające kontekst4-etapowa metoda tłumaczenia: Analiza źródła, Ekstrakcja znaczenia, Rekonstrukcja w języku docelowym, Weryfikacja. Zachowuje ton, rejestr i terminologię domenową. Wykrywanie anty-wzorców AI. Obsługuje tłumaczenie wsadowe (pliki i18n). Opcjonalny 7-etapowy tryb udoskonalony dla jakości publikacyjnej. Zasoby: translation-rubric.md, anti-ai-patterns.md.
oma-orchestratorAutomatyczny koordynator wieloagentowyUruchamia subagentów CLI równolegle, koordynuje przez pamięć MCP, monitoruje postęp, wykonuje pętle weryfikacyjne. Konfigurowalny: MAX_PARALLEL (domyślnie 3), MAX_RETRIES (domyślnie 2), POLL_INTERVAL (domyślnie 30s). Zawiera pętlę przeglądu agent-do-agenta oraz monitoring Clarification Debt. Zasoby: subagent-prompt-template.md, memory-schema.md.
oma-scmKonwencjonalne commityAnalizuje zmiany, określa typ/zakres, dzieli po funkcjonalnościach gdy to stosowne, generuje wiadomości commitów w formacie Conventional Commits. Co-Author: First Fluke <our.first.fluke@gmail.com>.

Wyszukiwanie, retrospektywa i przetwarzanie dokumentów

AgentRolaKluczowe możliwości
oma-searchRouter wyszukiwania oparty na intencjiKieruje zapytania do Context7 (dokumenty), natywnego wyszukiwania webowego, gh/glab (kod), Serena (lokalnie). Ocena zaufania domeny dla wszystkich wyników nielokalnych. Routing fail-forward (docs→web→fetch). Flagi: --docs, --code, --web, --strict, --wide, --gitlab.
oma-recapRetrospektywa pracy między narzędziamiAnalizuje historie konwersacji z Claude, Codex, Gemini, Qwen i Cursor. Rozwiązuje wejście daty/okna w języku naturalnym, grupuje według narzędzia+sesji, wyodrębnia tematy, renderuje podsumowania dzienne/okresowe dla standupów, cotygodniowych retro i dzienników pracy.
oma-hwpHWP/HWPX/HWPML → MarkdownKonwersja dokumentów koreańskiego procesora tekstu przez bunx kordoc@latest. Zachowuje nagłówki, tabele (w tym zagnieżdżone), przypisy, hiperłącza, obrazy. Usuwa znaki Hancom Private Use Area przez postprocesor flatten-tables.ts.
oma-pdfPDF → MarkdownKonwersja dokumentów PDF przez uvx opendataloader-pdf. Zachowuje nagłówki, tabele, listy, obrazy; tryb hybrydowy OCR dla zeskanowanych PDF; wyjście znormalizowane z uvx mdformat.

Model progresywnego ujawniania

oh-my-agent wykorzystuje dwuwarstwową architekturę umiejętności, aby zapobiec wyczerpaniu okna kontekstowego:

Warstwa 1 — SKILL.md (~800 bajtów, zawsze załadowana): Zawiera tożsamość agenta, warunki routingu, podstawowe reguły oraz wskazówki "kiedy używać / kiedy NIE używać". To jedyne co jest załadowane, gdy agent nie pracuje aktywnie.

Warstwa 2 — resources/ (ładowane na żądanie): Zawiera protokoły wykonawcze, referencje stosu technologicznego, fragmenty kodu, podręczniki obsługi błędów, listy kontrolne i przykłady. Są ładowane tylko gdy agent jest wywoływany do zadania, a nawet wtedy — tylko zasoby istotne dla konkretnego typu zadania (na podstawie oceny trudności i mapowania zadanie-zasób w context-loading.md).

Ten projekt oszczędza około 75% tokenów w porównaniu z ładowaniem wszystkiego z góry. Dla modeli flash-tier (kontekst 128K) całkowity budżet zasobów wynosi około 3100 tokenów — zaledwie 2,4% okna kontekstowego.


.agents/ — Jedno źródło prawdy (SSOT)

Wszystko czego oh-my-agent potrzebuje znajduje się w katalogu .agents/:

.agents/
├── config/ # oma-config.yaml
├── skills/ # 22 katalogów umiejętności (21 agentów + _shared)
│ ├── _shared/ # Zasoby podstawowe używane przez wszystkich agentów
│ └── oma-{agent}/ # SKILL.md + resources/ dla każdego agenta
├── workflows/ # 16 definicji workflow
├── agents/ # 9 definicji subagentów
├── results/plan-{sessionId}.json # Wygenerowany plan
├── state/ # Pliki stanu aktywnych workflow
├── results/ # Pliki wyników agentów
└── mcp.json # Konfiguracja serwera MCP

Katalog .claude/ istnieje tylko jako warstwa integracji z IDE — zawiera dowiązania symboliczne wskazujące na .agents/, plus hooki do wykrywania słów kluczowych i pasek stanu HUD. Katalog .serena/memories/ przechowuje stan runtime podczas sesji orkiestracji.

Taka architektura oznacza, że konfiguracja agentów jest:

  • Przenośna — zmieniaj IDE bez ponownej konfiguracji
  • Wersjonowana — commituj .agents/ razem z kodem
  • Współdzielona — członkowie zespołu otrzymują tę samą konfigurację agentów

Obsługiwane IDE i narzędzia CLI

oh-my-agent współpracuje z każdym IDE lub CLI zasilanym AI, które obsługuje ładowanie umiejętności/promptów:

NarzędzieMetoda integracjiAgenci równolegli
Claude CodeNatywne umiejętności + narzędzie AgentNarzędzie Task do prawdziwego równoległego wykonania
Gemini CLIUmiejętności automatycznie ładowane z .agents/skills/oma agent:spawn
Codex CLIUmiejętności automatycznie ładowaneRównoległe żądania mediowane przez model
Antigravity IDEUmiejętności automatycznie ładowaneoma agent:spawn
CursorUmiejętności przez integrację .cursor/Ręczne uruchamianie
OpenCodeŁadowanie umiejętnościRęczne uruchamianie

Uruchamianie agentów automatycznie dostosowuje się do każdego dostawcy dzięki protokołowi wykrywania dostawcy, który sprawdza znaczniki specyficzne dla dostawcy (np. narzędzie Agent dla Claude Code, apply_patch dla Codex CLI).


System routingu umiejętności

Gdy wysyłasz prompt, oh-my-agent określa, który agent go obsłuży, korzystając z mapy routingu umiejętności (.agents/skills/_shared/core/skill-routing.md):

Słowa kluczowe domenyKierowane do
API, endpoint, REST, GraphQL, database, migrationoma-backend
auth, JWT, login, register, passwordoma-backend
UI, component, page, form, screen (web)oma-frontend
style, Tailwind, responsive, CSSoma-frontend
mobile, iOS, Android, Flutter, React Native, appoma-mobile
bug, error, crash, broken, slowoma-debug
review, security, performance, accessibilityoma-qa
UI design, design system, landing page, DESIGN.mdoma-design
brainstorm, ideate, explore, ideaoma-brainstorm
plan, breakdown, task, sprintoma-pm
automatic, parallel, orchestrateoma-orchestrator

Dla złożonych żądań obejmujących wiele domen, routing podąża za ustalonymi kolejnościami wykonania. Na przykład "Stwórz aplikację fullstack" kieruje do: oma-pm (plan) następnie oma-backend + oma-frontend (równoległa implementacja) następnie oma-qa (przegląd).


Co dalej

  • Instalacja — Trzy metody instalacji, presety, konfiguracja CLI i weryfikacja
  • Agenci — Dogłębny przegląd wszystkich 21 agentów i kontrola wstępna karty
  • Umiejętności — Dwuwarstwowa architektura wyjaśniona
  • Workflow — Wszystkie 16 workflow z wyzwalaczami i fazami
  • Przewodnik użytkowania — Praktyczne przykłady od pojedynczych zadań po pełną orkiestrację