W tym artykule bierzemy na warsztat Codexa – wyspecjalizowanego agenta od OpenAI, który potrafi znacznie więcej niż zwykły czat. Zamiast tylko „rozmawiać”, Codex realnie działa: tworzy foldery, edytuje pliki i zarządza kodem, komunikując się z Tobą w najprostszym możliwym języku – ludzkim. I to nie tylko w Wigilię...
Talent na żądanie: Nastała era twórczości cyfrowej.
Sztuczna inteligencja przyniosła ze sobą możliwość pisania książek i wszelkiej innej liryki, tworzenia fotografii, filmów czy muzyki — i to wszystko stało się dostępne także dla tych, których natura nie obdarzyła talentem porównywalnym z Edgarem Allanem Poe, Henrim Cartier-Bressonem, Stanleyem Kubrickiem czy Wojciechem Kilarem.
Pozostawiając na boku debatę o wartości treści generowanych przez AI, dodajmy do tego jeszcze możliwość samodzielnego programowania — Prawie jak Bill Gates.
Takie są fakty. Dziś przeciętnie ogarnięty użytkownik komputera może napisać własną aplikację webową, rozszerzenie do przeglądarki czy skrypt rozwiązujący problem z niedziałającym skrótem klawiaturowym.
Oczywiście AI można zaprzęgnąć nie tylko do banalnych zadań, ale także do bardziej skomplikowanych projektów. Na przykład audytu strony. Tu jedno ważne zastrzeżenie: automatyczne audyty zawsze powinny być uzupełnione testami wykonanymi przez żywego użytkownika. Jednym z powodów jest choćby to, że AI nie ma realnego uczucia frustracji, motywacji i niepewności podczas wykonywania zadania. Stopień Trudności przechodzenia przez proces jest jak najbardziej istotny dla oceny przez użytkowników z różnymi potrzebami.
Ja — jako niewidomy audytor — mam z natury rzeczy problem z samodzielną weryfikacją kontrastu tekstu względem tła czy widoczności fokusu. Jak zatem dokonać takiej weryfikacji, nie mając przy tym dostępu do pełnej dokumentacji badanego źródła? O tym właśnie będzie mowa w kolejnych postach.
Codex to agent stworzony przez OpenAI, wyspecjalizowany w pisaniu kodu — ale nie tylko. Potrafi wyjaśnić poszczególne fragmenty składni i zaproponować rozwiązanie oraz dużo, dużo więcej.
Jest dostępny już w najtańszych planach subskrypcji ChatGPT z najnowszym modelem GPT 5.5.
Z Codexa można korzystać przez dedykowaną aplikację desktopową Windows i MacOS), a także w trybie CLI
Pewnym wyzwaniem — choć do pokonania — jest odczytywanie i kopiowanie komunikatów przez NVDA. Z pomocą przychodzą wtyczki, takie jak
Instalacja krok po kroku
Do pracy w trybie CLI potrzebny będzie WSL, czyli
Wystarczy zapytać Codexa lub ChatGPT o polecenia instalacyjne i kopiować je do PowerShella. PowerShella znajdziesz w menu kontekstowym przycisku „Start”. Uruchom go jako administrator i wklej następujące polecenie:
wsl --install
I wciśnij Enter. Czyż nie banalnie proste? Zamiast przeszukiwać repozytoria, strony z oprogramowaniem i cały ten internetowy gąszcz — wpisujesz dwa wyrazy i system wie, co ma robić.
W tym miejscu potrzebny będzie jeszcze Node.js oraz npm. Node.js to środowisko uruchomieniowe dla narzędzi JavaScript działających poza przeglądarką, a npm to menedżer pakietów, dzięki któremu można jednym poleceniem doinstalować Codexa do terminala. Skopiuj i wklej w terminalu takie dwa polecenia:
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/master/install.sh | bash
nvm install 22
Gdy WSL, Node.js oraz npm. są już zainstalowane, a system zrestartowany, otwórz Ubuntu przez wpisanie „Ubuntu” w menu Start. Znowu chwila magii: W oknie terminala wklej polecenie:
npm i -g @openai/codex
System pobierze i zainstaluje Codexa dla trybu CLI. Po instalacji konieczne będzie zalogowanie się przy użyciu tych samych danych, co do konta ChatGPT z aktywną subskrypcją. Po zakończeniu instalacji zamknij terminal i uruchom go ponownie. Następnie wpisz po prostu, z małej litery:
codex
Enter i program jest gotowy do pracy.
Co potrafi Codex?
Codex to agent do programowania, wykonywania operacji na plikach oraz zarządzania projektami. Od zwykłego czatu GPT różni się tym, że można mu udzielić dostępu do wybranych katalogów i plików — a wtedy sam je tworzy, otwiera, edytuje i zapisuje, bez potrzeby każdorazowego wklejania tekstu w pole prompta i kopiowania wyniku do edytora.
Codex wie, jak powinna wyglądać struktura projektu na przykład strony internetowej czy wtyczki do NVDA. Jeśli podepniemy swoje konto na GitHub (platformie przechowywania i rozwijania projektów), sam pobierze właściwe repozytoria, napisze kod i — jeśli tego chcemy — wypchnie go z powrotem do githuba opatrując naszą wersję stosownymi informacjami.
Co ważne: przez cały czas komunikujemy się z nim w oknie terminala zwykłym, ludzkim językiem. Żadnych tajemniczych poleceń systemu Linux ani PowerShella. 📁 Szybkie ćwiczenie po instalacji: Utwórz katalog w dowolnym miejscu o nazwie „Pisma”. Wklej do niego przykładowy dokument z jakąś zawartością tekstowo-graficzną. Z menu kontekstowego pliku wybierz polecenie: kopiuj jako ścieżkę. Otwórz Ubuntu i uruchom Codexa poleceniem codex. Teraz Wpisz mu mniej więcej taki prompt: „wejdź do katalogu „Pisma” i edytuj plik: [tutaj wklej ścieżkę], którą wcześniej skopiowałeś. We wskazanym pliku tekstowym popraw błędy, ustaw marginesy strony na 2,5 cm, wstaw numery stron na dole, na środku, wyrównaj tekst do lewej oraz ustaw interlinię na 1,5 pkt. Potwierdź wykonanie po zakończeniu.” Po kilku sekundach możesz sprawdzić wykonanie zadania!