Manus'un en son diyalog metni: Agent ödemeyi deniyor, şirket RRR'nin neredeyse 100 milyon dolar.

Yazar|Li Yuan

Editör| Jingyu

Yeni Singapur'a taşınan Manus, genel AI Ajanı hakkında düşünmeyi bırakmadı.

Bugün Singapur'da düzenlenen Stripe Tour'da Manus'un kurucu ortağı ve baş bilimcisi Ji Yichao (Peak), Stripe Asya-Pasifik ve Japonya Baş Gelir Sorumlusu Paul Harapin ile bir konuşma yaptı.

Toplantıda, Manus AI yakın dönemdeki işletme verilerini açıkladı, Manus AI gelir koşul oranı (RRR, Revenue Run Rate) 90 milyon dolara ulaşmış durumda ve yakında 100 milyona çıkması bekleniyor.

Manus AI'nin Xiao Hong'u ayrıca hemen belirtmişti ki, Revenue Run Rate, o ayın Revenue'sinin *12'si anlamına gelir ve Cash Income ile eşit değildir. Birçok AI ürünü yıllık ödeme seçeneğine sahiptir, bu kısım sadece ön ödeme olarak sayılabilir ve Revenue olarak kaydedilemez. "Eğer bu tür bir 【yanlış yöntem】 ile açıklama yaparsak, 1.2 milyar doların daha büyük bir sayısını hesaplayabiliriz." dedi Xiao Hong.

İşletme verilerinin yanı sıra, Ji Yichao ayrıca Manus ekibinin genel Agent'ın bir sonraki adımını nasıl düşündüğünü ve AI Agent ile AGI'nin gelecekte tam olarak ne gibi farklar taşıdığını paylaştı.

"Artık herkes neredeyse her şeye Agent diyor. Örneğin bir mikrofon, bazıları tarafından 'çevre algılama özellikli ses alma Agent'ı olarak adlandırılabiliyor." diye şaka yaptı Ji Yichao.

O, ayrıca genişletilmiş genel Agent yeteneklerinin bir sonraki adımı için iki ana hat belirtti: Birincisi, çoklu Agent işbirliği ile yürütme ölçeğini genişletmek (örneğin, geniş ölçekli araştırmalarda yüzlerce paralel alt Agent türetmek); İkincisi, Agent'a daha büyük bir "araç alanı" açmak, yetenekleri az sayıda önceden belirlenmiş API'ye sıkıştırmamak, bunun yerine programcılar gibi açık kaynak ekosistemini çağırmak, kütüphaneler yüklemek ve hatta görselleştirdikten sonra grafik üzerinde kendi kendine kontrol edip geri düzenlemek.

Ji Yi Chao ayrıca, bugünün dijital dünyasının hâlâ "insanlar için tasarlanmış" bir paradigma üzerine inşa edildiğini belirtti - API olmayan web sayfaları, CAPTCHA, süreçlerin "mini oyunlar" haline getirilmesi büyük bir sürtünme yaratıyor; dar boğazlar daha çok ekolojik ve kurumsal kısıtlamalar gibi görünüyor, model zekası gibi değil.

Bu, Manus'un Stripe etkinliğine katılma nedenlerinden biri: Taraflar, Agent içinde ödemeyi tamamlamayı ilerletiyor, "araştırma - karar verme - sipariş verme/hesap kapama" sürecini kapalı bir halka haline getiriyor ve altyapı işbirliği ile dünyanın sürtünmelerini azaltıyor.

Aşağıda diyalog özeti, Geek Park tarafından düzenlenmiştir:

Soru: İzleyicilere kendinizi kısaca tanıtır mısınız? Son zamanlarda "Bağlam Mühendisliği" konusundaki blogunuz gerçekten ilham verici, burada bulunan AI Agent geliştiren herkes için okunması gereken bir yazı olduğunu düşünüyorum. Mühendislerle her öğle yemeğine gittiğimde, her zaman bunun hakkında konuşuyorlar, bu yüzden şu anda başka bir yerde oturmak zorundayım (gülüyor). Fakat sahnedeki Manus ile pek tanışık olmayanlar için, deneyimlerinizi ve vizyonunuzu paylaşır mısınız?

Cevap: Teşekkürler Paul. Burada olmaktan çok mutluyum. Manus, genel bir AI Ajanı inşa ediyor.

Birçok araştırma kurumu ve şirket aslında bir beyin yaratmaya - büyük bir dil modeli geliştirmeye çalışıyor. Ama biz, tüketici perspektifinden bakıldığında, bunun pek iyi olmadığını düşünüyoruz. AI gerçekten harekete geçip işleri tamamlayabilmeli, bu yüzden Manus'u geliştirdik.

Bizim yöntemimiz, AI'nın insanlık tarihindeki en büyük icatlardan biri olan genel amaçlı bilgisayarı kullanabilmesini sağlamaktır. AI'ya bir bilgisayar verildiğinde, insanların yapabildiği her şeyi yapabilir. Manus gerçekten görevleri yerine getirebilir. Örneğin, size sunum hazırlamada yardımcı olabilir, bir seyahat planlamanıza yardımcı olabilir ve hatta sosyal medya yönetiminde size yardımcı olabilir - ama gerçekten bunu yapmanızı önermiyorum.

Kullanıcılarımız gerçekten Manus'u çok seviyor. Mart ayında Manus'u piyasaya sürdük ve şu anda yaklaşık 90 milyon gelir koşulunu (RRR, Revenue Run Rate) gerçekleştirmiş durumdayız, yakında 100 milyonu geçeceğiz.

Bunun bizim gibi küçük bir girişim şirketi için son derece büyük olduğunu düşünüyorum. Ama daha önemlisi, bu AI Agent'in artık sadece bir araştırma alanında popüler bir terim olmadığını, gerçekten uygulandığını ve kök saldığını gösteriyor.

Manus'u inşa ederken yaşadığımız küçük bir hikayeyi herkesle paylaşabilirim.

Aslında, Agent coding uygulamalarından birçok ilham aldık. Örneğin, Cursor gibi AI programlama ürünleri daha önce birçok ilgi çekti.

Mühendisler olarak, doğal olarak Cursor kullanıyoruz. Ancak bizi şaşırtan şey, şirketteki birçok mühendis olmayan meslektaşımızın da Cursor kullanması. Elbette, yazılım yazmıyorlar, bunun yerine veri görselleştirmesi yapmakta ve hatta bazı makaleler yazmakta kullanıyorlar. Sol taraftaki kod kısmını göz ardı edip, sadece AI ile konuşarak işleri tamamlıyorlar.

Bu, bize şunu fark ettiriyor: Bu yöntemi genelleştirmeli ve programcı olmayanları güçlendirmeliyiz. Bu, yapay zekanın bir kullanım durumu.

Soru: İnsanların AI Agent ve AGI hakkında konuştuğunu daha sık duymaya başladık. Bu iki kavramı daha net bir şekilde ayırt etmemize yardımcı olabilir misin? AI Agent ve AGI senin ve Manus için ne anlama geliyor?

Cevap: Bunu çok iyi bir soru olarak düşünüyoruz.

Şu anda herkes neredeyse her şeye "Agent" diyor. Örneğin bir mikrofon, biri "çevre algılamalı ses alma Agent'ı" diyebilir.

Ama en azından, Agent'in uygulama odaklı AI'nın bir alt kümesi olması gerektiğini savunuyoruz. Bir adım geri atalım ve yaygın AI uygulama kategorilerine bakalım.

Çoğu insan iki türle tanışmıştır: Birincisi sohbet robotları, örneğin ChatGPT; ikincisi ise üretken araçlar, örneğin MidJourney veya Sora. Bu sistemlerde genellikle sadece iki rol vardır: kullanıcı ve model. Siz ve model etkileşime girersiniz, çıktıyı alırsınız. Ancak Agent'ın farkı, kullanıcı ve modelin yanı sıra üçüncü bir ana unsur olan çevreyi de dahil etmesidir.

Bu "çevre" kavramı, ajan türüne bağlı olarak değişir; örneğin, tasarım odaklı bir Ajan'da, çevre bir tuval veya bir kod parçası olabilir; ancak Manus'ta, amacımız Ajan'ı sanal makineye veya hatta tüm internete yerleştirmektir. Böylece Ajan, çevreyi gözlemleyebilir, bir sonraki adımda ne yapacağına karar verebilir ve eylemleriyle çevreyi değiştirebilir. Bu onu son derece güçlü kılar.

Örneğin Manus'ta, ihtiyaçlarınızı ifade edebilirsiniz, bu da tarayıcıyı açacak, web sayfasını yayınlayacak ve size bir uçak bileti almanıza yardımcı olacaktır. Bu örneği çok seviyorum çünkü uçak bileti almak oldukça basit bir şey gibi görünse de, bu aslında AI'nın gerçek dünyayı doğrudan değiştirmesi anlamına geliyor - sonuç, modelin çıktısı değil, elinizdeki uçak biletidir. AI gerçekten dünyanıza müdahale etti. Buna Agent diyoruz.

Kısacası, Agent, kullanıcıyı çevre ile etkileşimde temsil edebilen bir AI sistemidir.

AGI ile ilgili olarak, bu terim sıkça gündeme geliyor ve birçok kişi bunu süper zeka ile eşdeğer tutuyor. Biz AGI'nin, AI modellerinin genel yeteneklerini kullanabilen ve özel bir tasarım gerektirmeden birçok görevi tamamlayabilen bir sistem olduğunu düşünüyoruz.

"Agent coding"'in aslında AGI'ye giden bir yol olduğunu düşünüyoruz. Bu, dikey bir alanın yeteneği değildir, aksine eğer bunu bilgisayara verirseniz, neredeyse bilgisayarda her şeyi yapabilir. Bu nedenle, bizim için AGI'nin koşulu, bu yeteneğin kullanılabilmesi için yeterince gelişmiş bir ortam inşa etmektir.

Soru: AI bugün hangi senaryolarda gerçekten etkili oldu? Gelecekte nerelerde etkili olacak? Ne zaman iPhone anı ortaya çıkacak?

Cevap: Agent açısından, eğer modelin yeteneklerine bakarsak, şu anki amiral gemisi modelleri gerçekten etkileyici, neredeyse "süper insan" seviyesinde. Matematik yarışmalarında veya mantıksal akıl yürütmede çoğu insanı geride bırakabilirler.

Ama bence, model hâlâ "şişedeki beyin" gibi, eğer gerçekten güçlerini ortaya koymak istiyorlarsa, gerçek dünya ile etkileşime girmeleri ve gerçeğe ulaşmaları gerekiyor. Ama maalesef, sorun tam olarak burada başlıyor.

Örneğin, bir AI'dan bazı işlemsel görevleri yapmasını istediğinizde, tekrarlayan görevlerde gerçekten yeteneklidir. Deep Research gibi ürünler, yalnızca bilgileri toplayıp bir sonuç verir, çıktısı sadece orada basitçe görünür.

Bir örnek vermek gerekirse, artık neredeyse her şey insanlar için tasarlanmıştır, sadece fiziksel dünya değil, dijital dünya da öyledir. Örneğin web araçları, tıpkı küçük oyunlar gibi, API veya standart arayüz sağlamaz. CAPTCHA doğrulama kodları her yerde mevcuttur, her yerde Agent'ı engellemektedir.

Bu yüzden AI'nın kapalı, kendi kendine yeterli görevlerde çok iyi performans gösterdiğini düşünüyorum, ancak gerçek dünya ile ilgili olduğunda engellerle karşılaşıyor.

Gelecekte iPhone anı ne zaman ortaya çıkacak? Bence bu bir teknik sorun değil, daha çok kurumsal bir sınırlama gibi. Bu, bizim gibi bir Ajans girişimcisinin tek başına çözebileceği bir şey değil.

Bunun kademeli bir dönüşüm gerektirdiğini, tüm ekosistemin birlikte evrimleşmesi gerektiğini düşünüyorum. Bu, altyapı düzeyinde Stripe gibi şirketlerin çaba göstermesini de gerektiriyor. Örneğin, yeni Stripe Agentic ödeme API'sini entegre ediyoruz. Herkes birlikte çalışıyor.

Soru: Peki, Manus kullanırken kullanıcıların bazı tipik senaryolarını daha ayrıntılı olarak konuşabilir miyiz? Nasıl kullanıyorlar? Bu, ne tür bir gücü ortaya koyuyor?

Cevap: Evet, şu anki nesil Agent'tan gelmemize rağmen, birçok harika kullanım durumu gördük.

Örneğin, yeni Singapur'a taşındık, bize konut bulmamızda yardımcı olması için bir emlakçı kiralamamız gerekiyor. Gerçek bir Ajan (gülüyor).

Artık bu aracılar Manus kullanıyor: Müşterilerin ihtiyaçlarına göre, şirketin bulunduğu yeri, çalışanların yaşamak istediği bölgeyi analiz etmek için Manus kullanıyorlar ve buna uygun öneriler oluşturuyorlar.

Bunun çok ilginç olduğunu düşünüyorum, çünkü bu bir "uzun kuyruk talebi" türüne giriyor. Genel olarak, bu tür belirli senaryolar için tasarlanmış özel bir AI ürünü yoktur, ancak Manus genel bir Ajan olduğu için bu talepleri karşılayabiliyor. Uzun kuyruk taleplerinin çok dikkat çekici olduğunu düşünüyoruz.

Makro açıdan bakıldığında, uzun kuyruk olabilir, ancak belirli kullanıcılar için bu, onların günlük işlerinin ta kendisidir. Bu tür bir senaryo özellikle değerlidir.

Bu, bugün arama motoru manzarasına benziyor. Eğer sadece bazı yaygın içerikleri arıyorsanız, ister Google ister Bing kullanın, sonuçların kalitesi hemen hemen aynı. Peki insanlar neden birini seçiyor? Belki de belirli bir anda bir arama motoru onlara daha uygun sonuçlar sunduğu için. Ve eğer çok kişiselleştirilmiş veya uzmanlaşmış içerikler arıyorsanız, o zaman farklar daha belirgin hale geliyor. Bu nedenle, genel amaçlı Ajan'ın avantajının burada olduğunu düşünüyoruz.

Peki, bunu nasıl daha iyi hale getirebiliriz? Uzun süre düşündük çünkü her şeyin programlama etrafında döndüğüne inanıyoruz. Eğer bilgisayarı AI'ye verirseniz, aslında çevreyle etkileşiminin yolu programlama yoluyla olur.

İki açıdan geliştirme yapılabileceğini düşünüyoruz. Birincisi ölçeklenme. Peki, Agent'ın yeteneklerini yüz kat artırabilirseniz ne olur?

Son zamanlarda Manus, Wide Research adında yeni bir özellik yayınladı. Temel düşüncesi, bir Agent'ın yüzlerce Agent türetmesine ve birlikte görevleri tamamlamasına olanak tanımaktır. Bildiğin gibi, AI'nın sadece küçük şeyler yapmasına izin vermek çoğu zaman senin de yapabileceğin bir şeydir. Ancak görev çok büyükse, tek başına tamamlaman imkânsızdır; örneğin, büyük ölçekli bir araştırma yapman gerekiyorsa, bu durumda yüzlerce Agent'ın paralel olarak çalışması oldukça güçlü hale gelir.

İkincisi, Agent'ın bilgisayarı daha esnek bir şekilde kullanabilmesini sağlamamız gerekiyor. Örneğin, eğer bir AI Agent'a yalnızca önceden ayarlanmış araçlar verirseniz, hareket alanı bu araçlarla sınırlı kalır. Ama hayal edin ki, siz bir programcıysınız ve çağırabileceğiniz bir açık kaynak topluluğunun tüm kaynaklarına sahipsiniz.

Örneğin, 3D yazdırma yaparken, modelin parametrelerini doğrudan değiştirmek zordur, ancak GitHub'da uygun bir kütüphane bulursanız, doğrudan yüklemek sorununuzu çözebilir. Manus'ta, evrenselliği optimize ediyoruz ve "araçların ağ etkisi" adında bir kavram öneriyoruz.

İlginç bir örnek var: Birçok kullanıcı, verileri görselleştirmek için Manus kullanıyor. Asya'da bazen sorunlarla karşılaşabileceğinizi biliyorsunuzdur; örneğin, grafiklerde Çince gösterirken yazı tipi hataları meydana gelebilir. Belki bazı profesyonel kullanıcılar, çıktıda hangi yazı tipinin kullanılacağını belirten bazı katı kodlama kuralları yazacaklardır. Ancak bu yöntem, sistemi giderek daha katı hale getirecektir.

Aldığımız yaklaşım, sisteme çok basit bir yetenek eklemek oldu: görüntüleri görüntüleme. Sonuç oldukça şaşırtıcıydı - çünkü bugünün modelleri oldukça zeki, oluşturulan görsel görüntülerin ardından kendilerini kontrol ediyor ve hataların farkına varıp, ardından otomatik olarak düzeltme yapıyorlar. Araçların esnekliğini artırmanın, sabit kodlanmış kurallardan daha fazla sorunu çözebileceğini keşfettik.

Soru: Bu heyecan verici bir dönem. Gerçekten çok heyecanlıyım, sadece kendimin tekrar otuz yaşında olmasını diliyorum (gülümseme). Tıbbi araştırmalarla ilgili olarak, Manus'un bu alanda da güçlü olduğunu biliyorum. Bazı kullanıcıların Manus kullanarak tıbbi araştırmalar yaparken gözlemleriniz oldu mu?

Cevap: Birçok insan şu anda Manus kullanarak araştırma yapıyor, bu sadece tıbbi araştırmalarla sınırlı değil. Bunun oldukça ilginç olduğunu düşünüyoruz çünkü şu anda birçok sözde "derin araştırma" ürünü var, bunlar size büyük miktarda bilgi toplama ve bazı analizler yapma imkanı sunuyor, ancak sonunda sadece size bir markdown dosyası veya belge veriyorlar. Bu kesinlikle yeterli değil.

Çoğu zaman, araştırmacıların gerçekten ihtiyaç duyduğu şey, doğrudan patronlarına veya ekiplerine teslim edilebilecek sonuçlardır. Bu yüzden Manus'ta araştırma sonuçlarının çıktısını güçlendirdik. Örneğin tıbbi araştırmalarda, çoğu zaman resmi raporlar oluşturmak gerekir, örneğin slayt raporları gibi şeyler. Bu nedenle, AI'nin çıktı yeteneklerini optimize etmemiz gerekiyor, böylece araştırmacıların ihtiyaçlarını karşılayabiliriz. Bu, bir "araçsallaştırma" deneyimidir.

Örneğin, şimdi birçok kullanıcı önce Manus ile araştırma yapacak ve sonra doğrudan bir web sitesi oluşturacak. Bunun geleneksel web sitesi kurma yöntemlerinden tamamen farklı olduğunu düşünebilirsiniz.

Bir web sitesi kurmanın aslında zor olmadığını bilmelisiniz; zor olan, verilerin güvenilirliğini ve doğruluğunu sağlamaktır. Bu nedenle, tüm sürecin tek bir oturumda, paylaşılmış bir bağlamda tamamlanmasının en iyisi olduğunu düşünüyoruz. Böylece, araştırmalarınız ve görüşleriniz nihai sonuca sorunsuz bir şekilde dönüşebilir. İşte Manus'ta yaptığımız şey budur.

Soru: Birçok ülke, AI çağında insanlığın geleceği ve ekonomik etkileri hakkında bir konu tartışıyor. İşlerin yerini alması hakkında ne düşünüyorsunuz? Hangi yeni iş fırsatları ortaya çıkacak?

Cevap: Arkadaşlarımız ve yatırımcılarımız bu soruyu sıkça soruyor. Manus'u tanıttığımızda, böyle bir Ajans inşa edebilirsek, insanların çok zaman kazanmasına yardımcı olabileceğini ve herkesin kolayca para kazanmasını sağlayacağını düşündük.

Ama gerçekte, bu vizyonun tam olarak hayata geçmediğini keşfettik. Çok sayıda kullanıcı araştırması aracılığıyla, kullanıcıların kullanımdan sonra daha fazla çalıştıklarını bulduk. Çünkü daha verimli hale geldiler, aslında zaten çok iyi oldukları şeyleri yapma kapasitesine sahipler.

İkincisi, Manus'un tamamen yeni bir alan açtığını düşünüyoruz. Sanal makineler ve bulut bilişimi hakkında sürekli olarak konuşuyoruz. Manus'un bir "kişisel bulut bilişim platformu" rolünü üstlendiğini düşünüyoruz. Örneğin, bulut bilişim on yıllardır var, ancak bu daha çok mühendislerin ayrıcalığıydı; yalnızca biz programlama yoluyla bulutun gücünü çağırabiliyorduk. Sıradan bilgi çalışanları bunu kullanamıyordu.

Ama şimdi Manus gibi AI Ajansları sayesinde insanlar doğal dilde komutlar verebiliyor ve AI'nın bunları yerine getirmesini sağlıyor. Bu, tamamen yeni bir üretkenlik biçimini açmakla eşdeğerdir. İşte biz bunu sağlıyoruz.

Ve son olarak, "yerine geçme" konusunda aslında çok zor olduğunu düşünüyorum. Örneğin, emlak danışmanları, her gün Manus ile günlük işlerini tamamlıyorlar. Ama biliyorsun, AI asla danışmanların müşterilerle yüz yüze iletişimdeki tarzını yerine geçemez. Biz bir AI şirketiyiz, hatta Manus'un tanıtım videosu Manus'un yazdığı senaryoyla çekildi, ama videoda yine ben varım, çünkü bu bir güven meselesi. Ve güven, tamamen AI'ya bırakılamaz.

AGENT-0.59%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)