Эволюция индексации данных Блокчейн: от Узла к AI-уполномоченной базе данных всей цепи

robot
Генерация тезисов в процессе

Эволюция индексирования данных Блокчейн: от оригинальных Узлов до полностью цепочечного базы данных с поддержкой ИИ

1. Введение

С момента появления первых приложений Блокчейн в 2017 году децентрализованные приложения (dApp) активно развиваются, охватывая такие области, как финансы, игры и социальные сети. С учетом постоянного прогресса в отрасли мы не можем не задуматься: откуда на самом деле берутся данные, на которых основаны эти dApp?

В 2024 году искусственный интеллект и Web3 станут центром внимания. В области ИИ данные подобны источнику жизни, постоянно питая рост и эволюцию системы. Без поддержки огромного объема качественных данных даже самые изящные алгоритмы ИИ не смогут проявить свою истинную интеллектуальность и эффективность.

В данной статье будет подробно рассмотрен процесс развития доступности данных в Блокчейне, проанализирована эволюция технологий индексирования данных и проведено сравнение основных протоколов, таких как The Graph, Chainbase и Space and Time, в аспектах обслуживания данных и архитектуры продуктов, с особым вниманием к тому, как последние два из них используют технологии ИИ для предоставления инновационных услуг.

Чтение, индексирование и анализ, краткий обзор сектора индексации данных Web3

2. Сложность и простота индексирования данных: от узла блокчейна до полной базы данных цепочки

2.1 Источник данных: Узел Блокчейна

Блокчейн по своей сути является децентрализованной распределенной книгой, которую совместно поддерживают множество узлов. Каждый узел хранит полную копию данных Блокчейн, обеспечивая децентрализованный характер сети. Однако обычные пользователи, создающие и поддерживающие узлы, сталкиваются со многими трудностями, им нужны не только профессиональные навыки, но и высокие затраты на оборудование и пропускную способность. Кроме того, возможности запросов обычных узлов ограничены, что затрудняет удовлетворение потребностей разработчиков.

Для решения этой проблемы появились провайдеры узлов RPC. Они несут затраты на эксплуатацию узлов и предоставляют пользователям доступ к данным через RPC-конечные точки. Хотя общие RPC-конечные точки бесплатны, они имеют ограничения по скорости; частные RPC-конечные точки имеют лучшую производительность, но неэффективны для сложных запросов и трудно масштабируются между цепями. Тем не менее, стандартизированные API-интерфейсы провайдеров узлов значительно снизили порог доступа пользователей к данным в блокчейне.

Чтение, индексация для анализа, краткий обзор сектора индексации данных Web3

2.2 Анализ данных: от исходных данных до пригодных данных

Данные, предоставляемые Узлами Блокчейна, обычно проходят шифрование и кодирование, и их непосредственное использование для обычных пользователей и разработчиков является довольно сложным. Поэтому анализ данных становится ключевым этапом, который преобразует сложные исходные данные в формат, удобный для понимания и работы, что значительно повышает их доступность.

2.3 Эволюция индексатора данных

С увеличением объема данных Блокчейн, потребность в индексаторах данных становится все более актуальной. Индексаторы организуют данные на цепочке и сохраняют их в базе данных, что облегчает их поиск. Они предоставляют унифицированный интерфейс запросов, позволяя разработчикам быстро и точно извлекать необходимую информацию с помощью стандартизированного языка запросов (, такого как GraphQL ).

Разные типы индексаторов имеют свои особенности:

  1. Полный узел индексатор: извлекает данные непосредственно из полного узла, обеспечивая целостность данных, но требует значительных ресурсов.
  2. Легковесный индексатор: полагается на полные узлы для получения данных по запросу, снижая требования к хранению, но возможно увеличивая время запроса.
  3. Специальный индексатор: оптимизирован для определенных типов данных или Блокчейн, таких как данные NFT или сделки DeFi.
  4. Аггрегатор индексов: извлечение данных из нескольких Блокчейн и источников, включая оффлайн информацию, для удобства многосетевых приложений.

В настоящее время требования к хранению архивных узлов Эфириума достигли уровня нескольких ТБ. Столкнувшись с таким объемом данных, основные протоколы индексирования не только поддерживают многосетевую индексацию, но и настраивают фреймы анализа данных под различные потребности приложений, такие как "Подграф" The Graph (Subgraph).

По сравнению с традиционными RPC-точками, индексаторы значительно увеличили эффективность индексирования и запроса данных. Они поддерживают сложные запросы, фильтрацию данных и агрегированную аналитику, а также могут интегрировать источники данных между цепочками. Запускаясь в распределенной среде, индексаторы обеспечивают большую безопасность и производительность, снижая риск сбоев.

Чтение, индексирование для анализа, краткий обзор сектора индексации данных Web3

2.4 Полная цепочка данных: выравнивание по приоритету потока

С учетом того, что требования к приложениям становятся все более сложными, стандартизированные API сложно удовлетворить разнообразные запросы, такие как кросс-чейн доступ или отображение данных вне цепи. Метод "приоритета потоков" в современных дата-пайплайнах предлагает новые идеи для обработки данных в реальном времени, позволяя организациям мгновенно реагировать на данные и принимать решения.

Поставщики услуг данных Блокчейн также развиваются в направлении создания потоков данных. Традиционные поставщики индексирующих услуг запускают продукты потоковых данных в реальном времени, такие как Substreams от The Graph и Mirror от Goldsky. Новые поставщики, такие как Chainbase и SubSquid, предлагают озера данных в реальном времени на основе Блокчейн.

Эти услуги направлены на удовлетворение потребности в实时解析 Блокчейн транзакций и предоставлении полного запроса. Рассматривая данные Блокчейн как поток данных, а не как конечный вывод, мы можем настраивать высокопроизводительные наборы данных для различных бизнес-сценариев.

Чтение, индексирование и анализ, краткий обзор сектора индексации данных Web3

3. AI + База данных? Глубокое сравнение The Graph, Chainbase и Space and Time

3.1 Граф

Сеть The Graph предоставляет многосетевые услуги по индексации и запросу данных через децентрализованные узлы. Ее основной продукт - это рынок выполнения запросов данных и рынок кэширования индексов данных, которые обслуживают запросы пользователей. Сеть The Graph состоит из четырех ролей: индексатор, куратор, делегатор и разработчик, которые обеспечивают функционирование системы через экономические стимулы.

Экосистема The Graph активно принимает технологии ИИ. Инструменты, разработанные Semiotic Labs, такие как AutoAgora, Allocation Optimizer и AgentC, улучшили производительность системы в области ценообразования, распределения ресурсов и пользовательского опыта. Применение этих инструментов позволило The Graph повысить уровень интеллекта и удобство использования.

3.2 Chainbase

Chainbase — это сеть данных по всему Блокчейн, объединяющая данные из нескольких цепочек на одной платформе. Его уникальные функции включают:

  • Реальный дата-озеро: предоставляет мгновенный доступ к потокам данных Блокчейн
  • Двухцепочная архитектура: основана на Eigenlayer AVS для построения исполняющего слоя, параллельно с алгоритмом консенсуса CometBFT
  • Инновационный стандарт формата данных: введение "manuscripts" для оптимизации структуры данных
  • Модель криптомира: сочетание технологий AI модели для создания AI модели, понимающей и предсказывающей交易 в Блокчейн.

AI-модель Theia от Chainbase является её ключевым акцентом. Theia основана на модели DORA от NVIDIA, комбинируя анализ данных на блокчейне и вне его, используя криптографические методы, и реагируя с помощью причинно-следственного вывода, предоставляя пользователям интеллектуальные данные.

Чтение, индексация для анализа, краткий обзор сектора индексации данных Web3

3.3 Пространство и Время

Space and Time (SxT) нацелена на создание проверяемого вычислительного слоя, расширяющего нулевые доказательства на децентрализованных хранилищах данных. Их ключевая технология Proof of SQL обеспечивает защиту от подделки и проверяемость SQL-запросов, предоставляя основу для применения данных на блокчейне в отраслях с высокими требованиями к надежности данных.

SxT сотрудничает с лабораторией инноваций Microsoft AI для разработки инструментов генеративного ИИ, позволяющих пользователям обрабатывать данные Блокчейн с помощью обработки естественного языка. В Space and Time Studio ИИ может автоматически преобразовывать естественный язык в SQL и выполнять запросы.

Чтение, индексирование и анализ, краткий обзор сектора индексирования данных Web3

Заключение и перспективы

Технология индексирования данных Блокчейн прошла путь от первоначального Узел источника данных, через развитие анализа данных и индексаторов, в конечном итоге эволюционируя в полностью цепочечные данные, поддерживаемые ИИ, пройдя процесс постепенного совершенствования. Эти достижения в технологиях не только повысили эффективность и точность доступа к данным, но и принесли интеллектуальный пользовательский опыт.

В будущем, с развитием новых технологий, таких как технологии ИИ и доказательства с нулевым разглашением, услуги данных блокчейна будут становиться все более интеллектуальными и безопасными. В качестве инфраструктуры услуги данных блокчейна продолжат оказывать мощную поддержку инновациям в отрасли.

GRT-4.31%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
ChainDoctorvip
· 11ч назад
Зачем было говорить? Данные просто могут использоваться в качестве топлива.
Посмотреть ОригиналОтветить0
DataChiefvip
· 11ч назад
AI интеграция Блокчейн? Я завидую.
Посмотреть ОригиналОтветить0
ZeroRushCaptainvip
· 11ч назад
Пф, столько лет прошло, а они снова роют ямы под данными? Всё тот же старый подход, только в новой упаковке!
Посмотреть ОригиналОтветить0
MetaverseLandladyvip
· 11ч назад
Скоро 2025 год, данные в блокчейне взрывообразно неконтролируемы.
Посмотреть ОригиналОтветить0
MysteryBoxOpenervip
· 11ч назад
И не хочу учиться, как быть с новичком?
Посмотреть ОригиналОтветить0
ZenZKPlayervip
· 12ч назад
Эти данные для арбитража действительно настоящие.
Посмотреть ОригиналОтветить0
  • Закрепить