Lembra dos jogadores que tinham centenas de adolescentes jogando Axie Infinity para eles ganharem Magic Love Potions?
Sim, isso foi há 4 anos.
Agora você pode simplesmente treinar e girar 100 operadores de codecs autônomos para jogar para você
... e monetizá-lo e vendê-lo para outras pessoas
✅ IA x Robótica
A narrativa AI x Robotics está esquentando de verdade com modelos VLA
Nesta fase do ecossistema de IA, a maioria dos protocolos e agentes está usando mecanismos LLM baseados em texto ou capturas de tela estáticas para interpretar dados
Mas lembre-se de que a maior parte do mundo real não tem acesso à API, você precisa de visão, decisões e ações. O mundo real deve ser visto em pixels e é aí que entram os modelos VLA
@Codecopenflow permite a automação de software e robótica por meio da visão usando uma pilha de tecnologia construída do zero
✅ Operadores CODEC
Os operadores são agentes de software autônomos que podem executar tarefas por meio de um ciclo de percepção-razão-ato. A capacidade de ver a tela (ou feeds de câmera ou dados de sensores) permite que eles tomem decisões que os LLMs não seriam capazes de fazer
• Percepção: captura capturas de tela, feeds de câmera ou dados de sensores.
• Raciocínio: Processa observações e instruções usando modelos de linguagem de visão
• Ação: executa decisões por meio de interações de interface do usuário ou controle de hardware
Em um loop contínuo
Os Operadores podem ser executados em servidores bare-metal, Máquinas Virtuais (em qualquer sistema operacional) ou até mesmo em robôs.
Cada operador obtém automaticamente uma máquina de computação dedicada (VM isolada ou instância de contêiner) e pode ser protegida por TEEs (isolamento em nível de hardware) para código e dados confidenciais.
✅ Camada de inteligência de IA
Os operadores podem ser configurados para usar um ou mais modelos (LLM ou VLA) combinados como seu "cérebro"
Por exemplo, emparelhar o modelo de linguagem Mixtral-8×7B de baixo custo com o modelo de visão CogVLM de código aberto permite que os operadores leiam o texto na tela e interpretem feeds de tela ou câmera ao vivo - tudo por uma fração do custo do GPT-4.
Um modelo VLA (Visão-Linguagem-Ação) permite que o agente interprete a entrada visual e, em seguida, decida sobre uma ação com base no que vê
✅ Casos de uso
🔹 Automação de desktop
Pode automatizar tarefas repetitivas de escritório controlando GUIs. Como preencher planilhas, atualizar calendários ou outras tarefas que exijam interação com a GUI
Pode lidar com atualizações de interface do usuário, pois pode realmente ver o que está fazendo
🔹 Agentes de jogos
Os operadores podem controlar jogadores ou testar videogames. Os agentes estão transmitindo a tela e podem fazer ações com base no que veem, enviando comandos de teclado ou mouse para o jogo.
Pode ser usado para testes de controle de qualidade, ou até mesmo oponentes NPC avançados ou automação de jogos web3
🔹 Robótica
Os operadores podem controlar robôs físicos. A camada da máquina se conectará a um hardware de robôs com sensores e atuadores, e o agente pode enviar comandos para mover um braço ou navegar.
Por exemplo, ele pode capturar uma câmera de objetos se movendo em uma esteira transportadora e fazer ações com base no movimento. Se houver um obstáculo no caminho, o Operador pode vê-lo e controlar o robô para evitá-lo
✅ Coleta de dados e trilhos de segurança onchain
Ao trazer as informações dos operadores onchain para Solana, eles podem oferecer logs de ação imutáveis de todas as ações executadas
No futuro, podemos ver um ponto em que as empresas de robótica seriam obrigadas a apostar um token para garantir que seus operadores não fizessem um robô fazer contato físico com um humano por causa de uma certa força. Se eles violá-lo, eles serão cortados em uma parte do token em staking (como EigenLayer/Symbiotic restaking)
✅ Ambiente de treinamento para Robótica
Com o Codec, modelos virtuais não treinados podem ser implantados em um campo de treinamento dinâmico e de alta fidelidade, sem necessidade de robô físico.
Simule, treine e refine comportamentos complexos em escala de nuvem e, em seguida, transfira essas políticas para hardware real com confiança.
Os ambientes de treinamento podem ser rapidamente criados para todos os tipos de Operadores (Software, Jogos ou Robótica)
✅ SDK do codec
Um SDK e uma API completos foram desenvolvidos para que os desenvolvedores possam implantar seus operadores facilmente
✅ Mercado do operador
Os operadores podem (no futuro) ser vendidos em um mercado personalizado.
Haverá uma divisão de receita para que você possa enviar e monetizar sua operadora de VLA, o que significa que, se você treinar operadoras eficazes, poderá ter fluxos de receita adicionais
✅ Pensamentos finais
Acho que veremos desenvolvimentos maciços no campo do VLA no próximo ano. Vimos a rapidez com que os LLMs são desenvolvidos, foi apenas alguns anos atrás desde que o GPT-1 foi lançado. Robótica e Modelos de Visão muito provavelmente se tornarão uma narrativa quente em um ponto deste ciclo, e eu gosto de ser posicionado cedo
Ah, e eu mencionei que os co-fundadores são dos jogos 👀 Hugging Face e Elixir
Nota: Slappjakke tem grandes sacos de $CODEC, e este é um daqueles momentos em que fiquei ainda mais otimista ao escrever este tópico e adicionei ainda mais
Como sempre, isso não é um conselho financeiro e um investimento de alto risco, então faça sua própria pesquisa.
Mostrar original



8,95 mil
105
O conteúdo desta página é fornecido por terceiros. A menos que especificado de outra forma, a OKX não é a autora dos artigos mencionados e não reivindica direitos autorais sobre os materiais apresentados. O conteúdo tem um propósito meramente informativo e não representa as opiniões da OKX. Ele não deve ser interpretado como um endosso ou aconselhamento de investimento de qualquer tipo, nem como uma recomendação para compra ou venda de ativos digitais. Quando a IA generativa é utilizada para criar resumos ou outras informações, o conteúdo gerado pode apresentar imprecisões ou incoerências. Leia o artigo vinculado para mais detalhes e informações. A OKX não se responsabiliza pelo conteúdo hospedado em sites de terceiros. Possuir ativos digitais, como stablecoins e NFTs, envolve um risco elevado e pode apresentar flutuações significativas. Você deve ponderar com cuidado se negociar ou manter ativos digitais é adequado para sua condição financeira.