Teks percakapan terbaru Manus: Mencoba pembayaran Agen, perusahaan RRR hampir 100 juta dolar

Penulis|Li Yuan

Editor| Jingyu

Manus yang pindah ke Singapura tidak berhenti memikirkan tentang Agen AI umum.

Pada Stripe Tour yang diadakan hari ini di Singapura, Co-Founder dan Chief Scientist Manus, Ji Yichao (Peak), mengadakan diskusi dengan Chief Revenue Officer Stripe untuk kawasan Asia Pasifik dan Jepang, Paul Harapin.

Di acara tersebut, Manus AI mengungkapkan data operasional terbaru, di mana Revenue Run Rate (RRR) Manus AI telah mencapai 90 juta dolar AS dan akan segera mencapai lebih dari 100 juta.

CEO Manus AI, Xiao Hong, juga secara khusus menyatakan di Jike bahwa Revenue Run Rate mengacu pada Revenue bulan ini *12, dan tidak sama dengan Cash Income. Banyak produk AI yang memiliki opsi pembayaran tahunan, bagian ini hanya dapat dianggap sebagai deposit yang dibayar di muka, dan tidak dapat dicatat sebagai Revenue. "Jika kami mengungkapkan dengan cara yang【salah】ini, kami bisa mendapatkan angka yang lebih besar dari 120 juta dolar AS," kata Xiao Hong.

Selain data operasional, Ji Yichao juga berbagi tentang bagaimana tim Manus berpikir tentang langkah selanjutnya untuk Agen Universal, serta perbedaan antara AI Agent dan AGI di masa depan.

"Sekarang hampir semua orang menyebut segala sesuatu sebagai Agent. Misalnya, sebuah mikrofon, seseorang akan menyebutnya sebagai 'Agent perekam suara yang memiliki kesadaran lingkungan.'" Jiyi Chao bercanda.

Dia juga memberikan dua garis besar langkah selanjutnya untuk memperluas kemampuan Agen Umum: Pertama, menggunakan kolaborasi multi-Agen untuk memperlebar skala eksekusi (seperti menghasilkan ratusan sub-Agen paralel dalam penelitian berskala besar); Kedua, membuka "area alat" yang lebih besar untuk Agen, tidak membatasi kemampuan pada beberapa API yang telah ditentukan, tetapi memanggil ekosistem sumber terbuka, menginstal pustaka, bahkan setelah visualisasi, melihat gambar untuk memeriksa diri dan memperbaiki.

Ji Yichao juga menyebutkan bahwa dunia digital hari ini masih dibangun dengan paradigma "digunakan oleh manusia" - halaman web yang tidak ter-API, CAPTCHA, dan gamifikasi proses yang membawa banyak gesekan, serta kendala lebih mirip dengan batasan ekosistem dan institusi, bukan kecerdasan model.

Ini juga salah satu alasan Manus terlibat dalam kegiatan Stripe: kedua belah pihak sedang mendorong penyelesaian pembayaran di dalam Agent, menghubungkan "riset—keputusan—pesanan/penyelesaian" menjadi lingkaran tertutup, menggunakan kolaborasi infrastruktur untuk mengurangi gesekan di dunia.

Berikut adalah ringkasan percakapan yang telah disusun dan diedit oleh Geek Park:

Tanya: Bisa kenalkan diri Anda secara singkat kepada penonton? Blog Anda baru-baru ini tentang "Rekayasa Konteks" sangat menginspirasi, saya rasa itu adalah bacaan wajib bagi siapa pun di sini yang sedang mengembangkan AI Agent. Setiap kali saya makan siang dengan para insinyur, mereka selalu membicarakan ini, jadi sekarang saya hanya bisa duduk di tempat lain (tertawa). Namun, bagi mereka yang mungkin tidak terlalu familiar dengan Manus, bisakah Anda berbagi pengalaman dan visi Anda?

Jawaban: Terima kasih Paul. Senang bisa datang. Manus sedang membangun Agen AI umum.

Banyak lembaga penelitian dan perusahaan sebenarnya sedang mencoba menciptakan sebuah otak—menciptakan sebuah model bahasa besar. Namun, kami percaya, dari sudut pandang konsumen, ini sebenarnya tidak baik. AI seharusnya bisa benar-benar mengambil tindakan dan menyelesaikan hal-hal, jadi kami membangun Manus.

Cara kami adalah memungkinkan AI untuk menggunakan salah satu penemuan terbesar dalam sejarah manusia—komputer umum. Dengan memberikan komputer kepada AI, ia dapat melakukan semua hal yang dapat dilakukan manusia. Manus benar-benar dapat menyelesaikan tugas. Misalnya, ia bisa membantu Anda membuat presentasi, merencanakan perjalanan, bahkan membantu Anda mengelola media sosial—meskipun saya tidak merekomendasikan Anda benar-benar melakukannya.

Pengguna kami benar-benar menyukai Manus. Kami merilis Manus pada bulan Maret, dan sekarang telah mencapai sekitar 90 juta dalam tingkat pendapatan berjalan (RRR, Revenue Run Rate), dan segera akan melewati 100 juta.

Saya rasa ini sangat besar bagi perusahaan startup kecil seperti kami. Tetapi yang lebih penting, ini menunjukkan bahwa AI Agent bukan lagi sekadar istilah populer dalam bidang penelitian, tetapi sudah benar-benar diterapkan dan berakar.

Saya bisa berbagi sebuah cerita kecil dengan semua orang tentang proses kami membangun Manus.

Kami sebenarnya mendapatkan banyak inspirasi dari aplikasi coding Agent. Misalnya, produk pemrograman AI seperti Cursor telah menarik banyak perhatian sebelumnya.

Sebagai seorang insinyur, kami secara alami akan menggunakan Cursor. Namun, yang mengejutkan kami adalah banyak rekan non-insinyur di perusahaan juga menggunakan Cursor. Tentu saja, mereka tidak sedang menulis perangkat lunak, tetapi menggunakannya untuk visualisasi data, bahkan menulis beberapa artikel. Mereka akan mengabaikan bagian kode di sebelah kiri, hanya berbicara dengan AI untuk menyelesaikan pekerjaan.

Ini membuat kita menyadari: kita harus menggeneralisasi cara ini, memberdayakan non-programmer. Inilah salah satu kasus penggunaan AI.

Tanya: Kita semakin sering mendengar orang membicarakan AI Agent dan AGI. Bisakah Anda membantu kami membedakan kedua konsep ini dengan lebih jelas? Apa arti AI Agent dan AGI bagi Anda dan Manus?

Jawab: Kami percaya ini adalah pertanyaan yang sangat baik.

Sekarang hampir semua orang menyebut segala sesuatu sebagai "Agent". Misalnya, sebuah mikrofon, ada yang akan mengatakan itu adalah "Agent perekam suara dengan kesadaran lingkungan".

Namun setidaknya kami berpendapat bahwa Agent seharusnya menjadi subset dari AI berbasis aplikasi. Mari kita mundur sejenak dan melihat kategori aplikasi AI yang umum.

Sebagian besar orang sudah akrab dengan dua kategori: satu adalah chatbot, seperti ChatGPT; yang lainnya adalah alat generatif, seperti MidJourney atau Sora. Dalam sistem ini, biasanya hanya ada dua peran: pengguna dan model. Anda berinteraksi dengan model untuk mendapatkan output. Perbedaan dari Agent adalah, selain pengguna dan model, ia juga memperkenalkan elemen kunci ketiga - lingkungan.

Konsep "lingkungan" ini akan bervariasi tergantung pada jenis agen. Misalnya, dalam desain agen, lingkungan bisa berupa kanvas atau sepotong kode; sedangkan di Manus, tujuan kami adalah membuat agen muncul di dalam mesin virtual atau bahkan seluruh internet. Dengan cara ini, agen dapat mengamati lingkungan, memutuskan apa yang harus dilakukan selanjutnya, dan mengubah lingkungan melalui tindakan. Ini membuatnya sangat kuat.

Misalnya di Manus, Anda dapat mengekspresikan kebutuhan, ia akan membuka browser, menerbitkan halaman web, dan membantu Anda memesan tiket pesawat. Saya sangat menyukai contoh ini, karena meskipun memesan tiket pesawat terdengar sederhana, ini sebenarnya adalah AI yang secara langsung mengubah dunia nyata—hasilnya bukanlah keluaran model, tetapi tiket pesawat di tangan Anda. AI benar-benar terlibat dalam dunia Anda. Inilah yang kami sebut sebagai Agent.

Secara sederhana, Agent adalah sistem AI yang dapat mewakili pengguna untuk berinteraksi dengan lingkungan.

Mengenai AGI, istilah ini juga sering disebutkan, banyak orang menganggapnya setara dengan kecerdasan super. Kami percaya bahwa AGI adalah sistem yang mampu menggunakan kemampuan umum model AI untuk menyelesaikan berbagai tugas tanpa desain khusus.

Kami percaya bahwa "Agent coding" sebenarnya adalah salah satu jalur menuju AGI. Ini bukanlah kemampuan di bidang vertikal tertentu, tetapi jika Anda memberikannya kepada komputer, ia hampir dapat melakukan apa saja di komputer. Jadi bagi kami, syarat AGI adalah membangun lingkungan yang cukup baik agar kemampuan ini dapat berkembang.

Tanya: Di mana AI benar-benar berperan hari ini? Di mana ia akan berperan di masa depan? Kapan momen seperti iPhone akan muncul?

Jawaban: Mengenai Agent, jika hanya melihat kemampuan modelnya, model flagship saat ini sudah sangat mengesankan, hampir setara dengan tingkat "Superman". Mereka dapat mengalahkan sebagian besar dari kita dalam kompetisi matematika atau penalaran logis.

Tetapi saya percaya, model masih seperti "otak dalam botol", jika ingin benar-benar menunjukkan kekuatannya, mereka harus berinteraksi dengan dunia nyata dan menjangkau kenyataan. Namun sayangnya, inilah tempat masalah dimulai.

Misalnya, jika Anda meminta AI untuk melakukan beberapa tugas transaksional, ia memang sangat baik dalam tugas-tugas repetitif. Produk seperti Deep Research, misalnya, hanya mengumpulkan informasi dan kemudian memberikan hasil, outputnya hanya muncul di sana.

Sebagai contoh, hampir semua hal saat ini dirancang untuk manusia, tidak hanya di dunia fisik, tetapi juga di dunia digital. Misalnya, alat halaman web, mereka seperti permainan kecil, tidak menyediakan API atau antarmuka standar. CAPTCHA ada di mana-mana, selalu menghalangi Agen.

Jadi saya pikir AI melakukan dengan baik dalam tugas-tugas yang tertutup dan mandiri, tetapi begitu melibatkan dunia nyata, akan menghadapi hambatan.

Kapan masa depan bisa muncul momen iPhone? Saya rasa ini bukan masalah teknologi, melainkan lebih seperti batasan sistemik. Ini bukan sesuatu yang bisa diselesaikan oleh perusahaan startup seperti kami sendiri.

Saya percaya bahwa ini memerlukan perubahan secara bertahap, yang mengharuskan seluruh ekosistem untuk berevolusi bersama. Ini juga memerlukan perusahaan seperti Stripe untuk berfokus pada lapisan infrastruktur. Misalnya, kami sedang mengintegrasikan api pembayaran Agentic baru dari Stripe. Kita semua bekerja sama.

Tanya: Bisakah kita membahas beberapa skenario khas di mana pengguna menggunakan Manus? Bagaimana mereka menggunakannya? Kekuatan apa yang tercermin di dalamnya?

Jawab: Ya, meskipun kami berasal dari generasi Agent saat ini, kami telah melihat banyak contoh penggunaan yang hebat.

Misalnya, kami baru saja pindah ke Singapura dan perlu menyewa agen properti untuk membantu kami mencari tempat tinggal. Ini adalah Agen nyata (tertawa).

Dan sekarang para perantara ini telah menggunakan Manus: mereka akan menganalisis lokasi perusahaan, area tempat tinggal yang diinginkan karyawan, dan menghasilkan rekomendasi yang sesuai berdasarkan kebutuhan klien.

Saya rasa ini sangat menarik, karena ini termasuk dalam "permintaan ekor panjang". Secara umum, tidak ada produk AI khusus yang dirancang untuk skenario konkret ini, tetapi karena Manus adalah agen yang umum, ia dapat memenuhi kebutuhan tersebut. Kami percaya bahwa permintaan ekor panjang sangat layak untuk diperhatikan.

Dari sudut pandang makro, itu mungkin merupakan ekor panjang, tetapi bagi pengguna tertentu, ini adalah pekerjaan sehari-hari mereka. Skenario ini sangat berharga.

Ini seperti pola mesin pencari hari ini. Jika Anda hanya mencari beberapa konten umum, baik menggunakan Google atau Bing, kualitas hasilnya hampir sama. Lalu mengapa orang memilih salah satunya? Mungkin karena mesin pencari tertentu memberikan hasil yang lebih sesuai pada saat tertentu. Dan jika Anda mencari konten yang sangat dipersonalisasi atau spesialis, perbedaannya akan semakin jelas. Jadi, kami percaya bahwa keunggulan dari Agent universal terletak di sini.

Lalu bagaimana cara membuatnya lebih baik? Kami telah berpikir lama, karena kami percaya bahwa segala sesuatu tidak terlepas dari pemrograman. Jika Anda menyerahkan komputer kepada AI, maka cara ia berinteraksi dengan lingkungan sebenarnya adalah melalui pemrograman.

Kami percaya bahwa ada dua cara untuk meningkatkan. Yang pertama adalah skala. Tapi bagaimana jika Anda dapat memperbesar kemampuan Agen seratus kali lipat?

Baru-baru ini Manus baru saja meluncurkan fitur baru yang disebut Wide Research. Ide dasar dari fitur ini adalah memungkinkan satu Agent untuk menghasilkan ratusan Agent lain untuk menyelesaikan tugas. Seperti yang kamu tahu, jika hanya meminta AI untuk melakukan beberapa hal kecil, seringkali kamu sendiri juga bisa melakukannya. Tetapi jika tugasnya sangat besar, kamu tidak mungkin menyelesaikannya seorang diri, seperti yang diperlukan untuk melakukan penelitian berskala besar. Dalam hal ini, mengizinkan ratusan Agent untuk bekerja secara paralel akan menjadi sangat kuat.

Kedua, kita juga perlu membuat Agennya lebih fleksibel dalam menggunakan komputer. Misalnya, jika Anda hanya memberikan satu AI Agent alat preset, maka ruang geraknya terbatas pada alat tersebut. Tetapi bayangkan jika Anda adalah seorang programmer, Anda memiliki seluruh sumber daya komunitas sumber terbuka yang dapat digunakan.

Misalnya, saat Anda mencetak 3D, sulit untuk mengubah parameter model secara langsung, tetapi jika Anda dapat menemukan pustaka yang tepat di GitHub, menginstalnya langsung dapat menyelesaikan masalah Anda. Di Manus, kami sedang mengoptimalkan kegunaan dan mengajukan sebuah konsep yang disebut "efek jaringan alat."

Ada contoh yang sangat menarik: banyak pengguna menggunakan Manus untuk visualisasi data. Anda tahu, di Asia terkadang kita menghadapi masalah, misalnya ketika menampilkan bahasa Mandarin dalam grafik mungkin akan muncul kesalahan font. Mungkin beberapa pengguna profesional akan menulis beberapa aturan pengkodean keras, seperti font apa yang harus digunakan saat mengeluarkan bahasa Korea. Tetapi cara ini akan membuat sistem semakin kaku.

Pendekatan yang kami ambil adalah menambahkan kemampuan yang sangat sederhana pada sistem: melihat gambar. Hasilnya sangat mengejutkan—karena model-model saat ini sudah sangat pintar, mereka akan memeriksa sendiri setelah menghasilkan gambar visual, menyadari kesalahan, lalu secara otomatis memperbaikinya. Kami menemukan bahwa menambah fleksibilitas alat dapat menyelesaikan lebih banyak masalah dibandingkan dengan aturan yang dikodekan secara keras.

Tanya: Ini adalah waktu yang menarik. Saya benar-benar bersemangat, hanya berharap saya bisa lebih muda hingga tiga puluh tahun (tertawa). Berbicara tentang penelitian medis, saya tahu Manus juga kuat dalam hal ini. Apakah Anda telah mengamati bahwa beberapa pengguna menggunakan Manus untuk penelitian medis?

Jawaban: Banyak orang sudah menggunakan Manus untuk penelitian, tidak terbatas pada penelitian medis. Kami merasa ini sangat menarik, karena saat ini memang ada banyak produk yang disebut "penelitian mendalam" yang akan membantu Anda mengumpulkan banyak informasi dan melakukan beberapa analisis, tetapi pada akhirnya hanya memberi Anda sebuah file markdown atau dokumen. Ini jauh dari cukup.

Banyak sekali, yang benar-benar dibutuhkan oleh peneliti adalah hasil yang dapat langsung diserahkan kepada atasan atau tim. Oleh karena itu, kami memperkuat output hasil penelitian di Manus. Misalnya, dalam penelitian medis, sering kali diperlukan untuk menghasilkan laporan resmi, seperti laporan presentasi dan sejenisnya. Oleh karena itu, kami harus mengoptimalkan kemampuan output AI untuk memenuhi kebutuhan peneliti. Ini adalah pengalaman "berbasis alat".

Misalnya, sekarang banyak pengguna yang akan menggunakan Manus untuk melakukan penelitian, lalu langsung membuat sebuah situs web. Anda mungkin merasa ini sangat berbeda dari cara tradisional dalam membangun situs web.

Perlu diketahui, membangun sebuah situs web sebenarnya tidak sulit, yang sulit adalah bagaimana memastikan keandalan dan akurasi data. Oleh karena itu, kami percaya bahwa sebaiknya seluruh proses dapat diselesaikan dalam satu percakapan, dalam satu konteks yang sama. Dengan cara ini, penelitian Anda, wawasan Anda dapat secara mulus diubah menjadi hasil akhir. Inilah yang kami lakukan di Manus.

Tanya: Banyak negara sedang membahas satu topik: Di era AI, masa depan manusia dan dampak ekonomi. Apa pendapat Anda tentang penggantian pekerjaan? Pekerjaan baru apa yang akan muncul?

Jawaban: Teman-teman dan investor kami juga sering menanyakan pertanyaan ini. Ketika kami meluncurkan Manus, kami awalnya berpikir jika kami dapat membangun sebuah Agen seperti itu, ia dapat membantu orang menghemat banyak waktu dan membuat semua orang bisa mendapatkan uang dengan mudah.

Namun sebenarnya, kami menemukan bahwa visi ini tidak sepenuhnya terwujud. Melalui banyak penelitian pengguna, kami menemukan bahwa setelah menggunakan, mereka justru bekerja lebih banyak. Karena mereka menjadi lebih efisien, mereka sebenarnya bisa melakukan lebih banyak hal yang sudah mereka kuasai. Ini adalah poin pertama.

Kedua, kami percaya Manus telah membuka ruang baru yang sepenuhnya. Kami telah membahas tentang mesin virtual dan komputasi awan. Kami merasa Manus sedang memainkan peran sebagai "platform komputasi awan pribadi". Misalnya, komputasi awan telah ada selama beberapa dekade, tetapi itu lebih merupakan hak istimewa para insinyur, hanya kami yang dapat memanfaatkan kekuatan awan melalui pemrograman. Pekerja pengetahuan biasa tidak dapat menggunakannya.

Tapi sekarang dengan adanya AI Agent seperti Manus, orang dapat memberikan instruksi dalam bahasa alami, membiarkan AI untuk menjalankannya. Ini sama dengan membuka jenis produktivitas yang baru. Inilah yang kami tawarkan.

Dan akhirnya, tentang "pengganti", saya rasa itu sebenarnya sangat sulit. Misalnya, agen properti, mereka setiap hari menggunakan Manus untuk menyelesaikan pekerjaan sehari-hari. Tapi Anda tahu, AI tidak akan pernah bisa menggantikan cara komunikasi yang dilakukan agen saat berhadapan dengan klien. Kami adalah perusahaan AI, bahkan video peluncuran Manus ditulis oleh skrip Manus, tetapi yang muncul di video tetaplah saya, karena ini adalah masalah kepercayaan. Dan kepercayaan, tidak bisa sepenuhnya diserahkan kepada AI.

AGENT1.76%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)