Pamiętasz graczy, którzy mieli setki nastolatków grających w Axie Infinity, aby zarabiać Magic Love Potions?
Tak, to było 4 lata temu.
Teraz możesz po prostu wyszkolić i uruchomić 100 autonomicznych operatorów kodeków, aby grali za Ciebie
...i zmonetyzować to oraz sprzedać innym
✅ AI x Robotyka
Narracja AI x Robotyka naprawdę się rozgrzewa z modelami VLA
Na tym etapie ekosystemu AI większość protokołów i agentów korzysta z opartych na tekście silników LLM lub statycznych zrzutów ekranu do interpretacji danych
Ale pamiętaj, że większość rzeczywistego świata nie ma dostępu do API, potrzebujesz wizji, decyzji i działań. Rzeczywisty świat musi być widziany w pikselach i tutaj wkraczają modele VLA
@Codecopenflow umożliwia automatyzację oprogramowania i robotyki poprzez wizję, korzystając z technologii zbudowanej od podstaw
✅ Operatorzy CODEC
Operatorzy to autonomiczne agenty oprogramowania, które mogą wykonywać zadania w cyklu percepcja-rozumowanie-działanie. Zdolność do widzenia ekranu (lub strumieni kamer lub danych z czujników) pozwala im podejmować decyzje, których LLM nie byłby w stanie podjąć
• Percepcja: Zbiera zrzuty ekranu, strumienie kamer lub dane z czujników
• Rozumowanie: Przetwarza obserwacje i instrukcje za pomocą modeli wizji-języka
• Działanie: Wykonuje decyzje poprzez interakcje z UI lub kontrolę sprzętu
W ciągłej pętli
Operatorzy mogą działać na serwerach bare-metal, maszynach wirtualnych (na dowolnym systemie operacyjnym) lub nawet na robotach.
Każdy operator automatycznie otrzymuje dedykowaną maszynę obliczeniową (izolowaną maszynę wirtualną lub instancję kontenera) i może być zabezpieczony przez TEE (izolacja na poziomie sprzętu) dla wrażliwego kodu i danych.
✅ Warstwa Inteligencji AI
Operatorzy mogą być skonfigurowani do używania jednego lub więcej modeli (LLM lub VLA) połączonych jako ich "mózg"
Na przykład, połączenie niskokosztowego modelu językowego Mixtral-8×7B z modelem wizji open-source CogVLM pozwala operatorom odczytywać tekst na ekranie i interpretować na żywo strumienie ekranu lub kamery - wszystko to za ułamek kosztów GPT-4.
Model VLA (Wizja-Język-Działanie) pozwala agentowi interpretować dane wizualne, a następnie podejmować decyzję na podstawie tego, co widzi
✅ Przykłady użycia
🔹 Automatyzacja biurowa
Może automatyzować powtarzalne zadania biurowe, kontrolując GUI. Na przykład wypełnianie arkuszy kalkulacyjnych, aktualizowanie kalendarzy lub inne zadania wymagające interakcji z GUI
Może obsługiwać aktualizacje UI, ponieważ faktycznie widzi, co robi
🔹 Agenci gier
Operatorzy mogą kontrolować graczy lub testować gry wideo. Agenci przesyłają strumieniowo ekran i mogą podejmować działania na podstawie tego, co widzą, wysyłając polecenia klawiatury lub myszy do gry.
Mogą być używani do testowania QA, a nawet jako zaawansowani przeciwnicy NPC lub automatyzacja gier web3
🔹 Robotyka
Operatorzy mogą kontrolować fizyczne roboty. Warstwa maszyny połączy się z hardwarem robotów z czujnikami i aktuatorami, a agent może wysyłać polecenia do poruszania ramieniem lub nawigacji.
Np. może uchwycić strumień kamery obiektów poruszających się na taśmie transportowej i podejmować działania na podstawie ruchu. Jeśli na drodze znajduje się przeszkoda, Operator może ją zobaczyć i kontrolować robota, aby jej uniknąć
✅ Zbieranie danych i bezpieczeństwo on-chain
Przenosząc informacje operatorów na blockchain Solana, mogą oferować niezmienne dzienniki działań ze wszystkich wykonanych działań
W przyszłości możemy zobaczyć moment, w którym firmy robotyczne będą zobowiązane do stakowania tokena, aby zagwarantować, że ich operatorzy nie spowodują fizycznego kontaktu robota z człowiekiem przy użyciu siły powyżej określonej wartości. Jeśli to naruszą, zostaną ukarani częścią stakowanego tokena (jak EigenLayer / Symbiotic restaking)
✅ Środowisko szkoleniowe dla robotyki
Z Codec, nieprzeszkolone modele wirtualne mogą być wdrażane w dynamicznym, wysokiej wierności środowisku szkoleniowym, bez potrzeby fizycznego robota.
Symuluj, trenuj i udoskonalaj złożone zachowania na skalę chmurową, a następnie z pewnością przenieś te polityki na rzeczywisty sprzęt.
Środowiska szkoleniowe mogą być szybko uruchamiane dla wszystkich typów operatorów (oprogramowanie, gry lub robotyka)
✅ SDK Codec
Zostało opracowane pełne SDK i API, aby deweloperzy mogli łatwo wdrażać swoich operatorów
✅ Rynek operatorów
Operatorzy mogą (w przyszłości) być sprzedawani na niestandardowym rynku.
Będzie podział przychodów, abyś mógł wysyłać i monetyzować swojego operatora VLA, co oznacza, że jeśli wyszkolisz skutecznych operatorów, możesz mieć dodatkowe źródła przychodów
✅ Podsumowując
Myślę, że w przyszłym roku zobaczymy ogromny rozwój w dziedzinie VLA. Widzieliśmy, jak szybko rozwijają się LLM, to było tylko kilka lat temu, gdy uruchomiono GPT-1. Robotyka i modele wizji prawdopodobnie staną się gorącą narracją w pewnym momencie tego cyklu, a ja lubię być wczesnym inwestorem
Och, i czy wspomniałem, że współzałożyciel pochodzi z Hugging Face i Elixir games 👀
Uwaga: Slappjakke ma duże torby $CODEC, a to jest jeden z tych momentów, kiedy stałem się jeszcze bardziej optymistyczny, pisząc ten wątek i dodałem jeszcze więcej
Jak zawsze, to nie jest porada finansowa i jest to inwestycja wysokiego ryzyka, więc przeprowadź własne badania.
Pokaż oryginał



8,8 tys.
105
Treści na tej stronie są dostarczane przez strony trzecie. O ile nie zaznaczono inaczej, OKX nie jest autorem cytowanych artykułów i nie rości sobie żadnych praw autorskich do tych materiałów. Treść jest dostarczana wyłącznie w celach informacyjnych i nie reprezentuje poglądów OKX. Nie mają one na celu jakiejkolwiek rekomendacji i nie powinny być traktowane jako porada inwestycyjna lub zachęta do zakupu lub sprzedaży aktywów cyfrowych. Treści, w zakresie w jakim jest wykorzystywana generatywna sztuczna inteligencja do dostarczania podsumowań lub innych informacji, mogą być niedokładne lub niespójne. Przeczytaj podlinkowany artykuł, aby uzyskać więcej szczegółów i informacji. OKX nie ponosi odpowiedzialności za treści hostowane na stronach osób trzecich. Posiadanie aktywów cyfrowych, w tym stablecoinów i NFT, wiąże się z wysokim stopniem ryzyka i może podlegać znacznym wahaniom. Musisz dokładnie rozważyć, czy handel lub posiadanie aktywów cyfrowych jest dla Ciebie odpowiednie w świetle Twojej sytuacji finansowej.