Ingat pemain yang memiliki ratusan remaja yang memainkan Axie Infinity agar mereka mendapatkan Ramuan Cinta Ajaib? Ya, itu 4 tahun yang lalu. Sekarang Anda bisa melatih dan memutar 100 Operator Codec Otonom untuk bermain untuk Anda sebagai gantinya ... dan memonetisasinya dan menjualnya kepada orang lain ✅ AI x Robotika Narasi AI x Robotics memanas secara nyata dengan model VLA ​ Pada tahap ini dalam ekosistem AI, sebagian besar protokol dan agen menggunakan mesin LLM berbasis teks atau tangkapan layar statis untuk menafsirkan data ​ Tetapi ingat saja bahwa sebagian besar dunia nyata tidak memiliki akses API, Anda memerlukan visi, keputusan, dan tindakan. Dunia nyata harus dilihat dalam piksel dan di sinilah model VLA masuk ​ @Codecopenflow memungkinkan otomatisasi perangkat lunak dan robotika melalui visi menggunakan tumpukan teknologi yang dibangun dari awal ✅ Operator CODEC ​ Operator adalah agen perangkat lunak otonom yang dapat melakukan tugas melalui siklus persepsi-alasan-tindakan. Kemampuan untuk melihat layar (atau umpan kamera atau data sensor) memungkinkan mereka untuk membuat keputusan yang tidak dapat dilakukan LLM ​ • Persepsi: Menangkap tangkapan layar, umpan kamera, atau data sensor • Penalaran: Memproses pengamatan dan instruksi menggunakan model bahasa-penglihatan • Tindakan: Mengeksekusi keputusan melalui interaksi UI atau kontrol perangkat keras ​ Dalam lingkaran terus menerus Operator dapat berjalan di server bare-metal, Virtual Machine (pada sistem operasi apa pun), atau bahkan pada robot. ​ Setiap operator secara otomatis mendapatkan mesin komputasi khusus (VM terisolasi atau instans kontainer), dan dapat diamankan oleh TEE (isolasi tingkat perangkat keras) untuk kode dan data sensitif. ​ ✅ Lapisan Kecerdasan AI ​ Operator dapat dikonfigurasi untuk menggunakan satu atau lebih model (LLM atau VLA) yang digabungkan sebagai "otak" mereka ​ Misalnya, memasangkan model bahasa Mixtral-8×7B berbiaya rendah dengan model visi CogVLM sumber terbuka memungkinkan Operator membaca teks di layar dan menafsirkan layar langsung atau umpan kamera - semuanya dengan biaya yang lebih murah dari GPT-4. ​ Model VLA (Vision-Language-Action) memungkinkan agen menafsirkan input visual, dan kemudian memutuskan tindakan berdasarkan apa yang dilihatnya ✅ Kasus Penggunaan ​ 🔹 Otomatisasi Desktop ​ Dapat mengotomatiskan tugas kantor yang berulang dengan mengontrol GUI. Seperti mengisi spreadsheet, memperbarui kalender, atau tugas lain yang memerlukan interaksi GUI ​ Dapat menangani pembaruan UI karena benar-benar dapat melihat apa yang dilakukannya ​ 🔹 Agen Game ​ Operator dapat mengontrol pemain atau menguji video game. Agen melakukan streaming layar dan dapat melakukan tindakan berdasarkan apa yang mereka lihat dengan mengirim perintah keyboard atau mouse ke game. ​ Dapat digunakan untuk pengujian QA, atau bahkan lawan NPC tingkat lanjut atau otomatisasi game web3 ​ 🔹 Robotika ​ Operator dapat mengontrol robot fisik. Lapisan mesin akan terhubung ke perangkat keras robot dengan sensor dan aktuator, dan agen dapat mengirim perintah untuk menggerakkan lengan atau menavigasi. ​ Misalnya dapat menangkap umpan kamera dari objek yang bergerak di ban berjalan dan melakukan tindakan berdasarkan gerakan. Jika ada hambatan di jalan Operator dapat melihatnya dan mengontrol robot untuk menghindarinya ​ ✅ Pengumpulan Data dan Rel pengaman Onchain ​ Dengan membawa informasi onchain Operator ke Solana, mereka dapat menawarkan log tindakan yang tidak dapat diubah dari semua tindakan yang dilakukan ​ Di masa depan kita dapat melihat titik di mana perusahaan Robotika akan diminta untuk mempertaruhkan token untuk menjamin bahwa Operator mereka tidak akan membuat robot melakukan kontak fisik dengan manusia atas kekuatan tertentu. Jika mereka melanggarnya, mereka akan dipotong untuk sebagian dari token yang dipertaruhkan (seperti EigenLayer / Symbiotic restaking) ​ ✅ Lingkungan pelatihan untuk Robotika ​ Dengan Codec, model virtual yang tidak terlatih dapat digunakan ke tempat pelatihan yang dinamis dan fidelitas tinggi, tidak diperlukan robot fisik. ​ Simulasikan, latih, dan sempurnakan perilaku kompleks dalam skala cloud, lalu transfer kebijakan tersebut ke perangkat keras nyata dengan percaya diri. Lingkungan pelatihan dapat dengan cepat diputar untuk semua jenis Operator (Perangkat Lunak, Game, atau Robotika) ​ ✅ SDK Codec ​ SDK dan API lengkap telah dikembangkan sehingga pengembang dapat menerapkan Operator mereka dengan mudah ​ ✅ Pasar Operator ​ Operator dapat (di masa mendatang) dijual di pasar khusus. ​ Akan ada pembagian pendapatan sehingga Anda dapat mengirimkan dan memonetisasi operator VLA Anda, yang berarti jika Anda melatih Operator yang efektif, Anda dapat memiliki aliran pendapatan tambahan ​ ✅ Kesimpulan ​ Saya pikir kita akan melihat perkembangan besar-besaran di bidang VLA di tahun depan. Kami telah melihat seberapa cepat LLM dikembangkan, baru beberapa tahun yang lalu sejak GPT-1 diluncurkan. Robotika dan Model Visi kemungkinan besar akan menjadi narasi panas pada satu titik dalam siklus ini, dan saya ingin diposisikan lebih awal ​ Oh dan apakah saya menyebutkan bahwa salah satu pendiri berasal dari game 👀 Hugging Face dan Elixir ​ Catatan: Slappjakke memiliki tas $CODEC yang besar, dan ini adalah salah satu saat saya menjadi lebih bullish saat menulis utas ini dan menambahkan lebih banyak lagi ​ Ini seperti biasa bukan nasihat keuangan dan investasi berisiko tinggi, jadi lakukan riset Anda sendiri.
Tampilkan Versi Asli
8,26 rb
100
Konten pada halaman ini disediakan oleh pihak ketiga. Kecuali dinyatakan lain, OKX bukanlah penulis artikel yang dikutip dan tidak mengklaim hak cipta atas materi tersebut. Konten ini disediakan hanya untuk tujuan informasi dan tidak mewakili pandangan OKX. Konten ini tidak dimaksudkan sebagai dukungan dalam bentuk apa pun dan tidak dapat dianggap sebagai nasihat investasi atau ajakan untuk membeli atau menjual aset digital. Sejauh AI generatif digunakan untuk menyediakan ringkasan atau informasi lainnya, konten yang dihasilkan AI mungkin tidak akurat atau tidak konsisten. Silakan baca artikel yang terkait untuk informasi lebih lanjut. OKX tidak bertanggung jawab atas konten yang dihosting di situs pihak ketiga. Kepemilikan aset digital, termasuk stablecoin dan NFT, melibatkan risiko tinggi dan dapat berfluktuasi secara signifikan. Anda perlu mempertimbangkan dengan hati-hati apakah trading atau menyimpan aset digital sesuai untuk Anda dengan mempertimbangkan kondisi keuangan Anda.