Web3 AI necesita encontrar nuevos caminos para superar las barreras tecnológicas de Web2 AI.

2025-07-09 17:32:36

Generación de resúmenes en curso

Las barreras tecnológicas de la IA en Web2 se profundizan, la IA en Web3 necesita encontrar un punto de diferenciación.

Recientemente, la evolución de los modelos multimodales no ha impactado en las principales empresas de IA, sino que ha consolidado aún más la ventaja tecnológica de la IA Web2. Desde la alineación semántica hasta la comprensión visual, desde la incrustación de alta dimensión hasta la fusión de características, los modelos complejos están integrando las diversas formas de expresión a una velocidad sin precedentes, construyendo un bastión de IA cada vez más cerrado. Esta tendencia está casi sin relación con el ámbito de las criptomonedas.

Los recientes intentos de Web3 AI en la dirección de los Agentes parecen tener un rumbo equivocado. Intentar ensamblar un sistema modular multimodal al estilo Web2 con una estructura descentralizada es, en realidad, un desajuste tanto técnico como de pensamiento. En un contexto donde la acoplamiento de módulos es extremadamente fuerte, la distribución de características es altamente inestable y la demanda de poder de cómputo se concentra cada vez más, es difícil que el modularismo multimodal se consolide en un entorno Web3.

El futuro de la IA en Web3 no debe ser una imitación ciega, sino que debe adoptar un enfoque estratégico de desvío. Desde la alineación semántica en espacios de alta dimensión, hasta los cuellos de botella de información en los mecanismos de atención, y la alineación de características bajo potencia de cálculo heterogénea, la IA en Web3 necesita encontrar nuevos caminos y buscar puntos de ruptura diferenciados.

La alineación semántica de alta dimensión es difícil de lograr en Web3 AI

En los sistemas multimodales de IA de Web2 modernos, "alineación semántica" es la tecnología clave para mapear diferentes modalidades de información en el mismo espacio semántico. Esto requiere un espacio de incrustación de alta dimensión como premisa para lograr la comprensión y comparación semántica entre modalidades.

Sin embargo, el protocolo Web3 Agent es difícil de implementar con incrustaciones de alta dimensión. La mayoría de los Web3 Agents solo encapsulan las API existentes en módulos independientes, careciendo de un espacio de incrustación centralizado unificado y de un mecanismo de atención cruzada entre módulos. Esto provoca que la información no pueda interactuar desde múltiples ángulos y niveles entre los módulos, y solo puede procesarse de manera lineal, lo que dificulta la formación de una optimización de circuito cerrado en su totalidad.

Para lograr un agente inteligente de cadena completa con barreras de entrada en la industria, es necesario comenzar con un modelado conjunto de extremo a extremo, una incrustación unificada entre módulos, así como una ingeniería sistemática de entrenamiento y despliegue colaborativo. Sin embargo, actualmente no hay demanda en el mercado para esto, y naturalmente también falta un punto de dolor correspondiente.

El espacio de baja dimensión limita el diseño preciso de los mecanismos de atención

Modelos multimodales de alto nivel requieren mecanismos de atención diseñados de manera precisa. Este mecanismo permite que el modelo se enfoque dinámicamente en las partes más relevantes al procesar la entrada. Sin embargo, la efectividad del mecanismo de atención depende de que los multimodales cuenten con representaciones de alta dimensión.

La IA de Web2, al diseñar mecanismos de atención, utiliza arquitecturas complejas como Query-Key-Value para lograr un enfoque de información eficiente y preciso. En comparación, la IA de Web3 basada en módulos tiene dificultades para implementar una programación de atención unificada. Los formatos y distribuciones de datos devueltos por cada API independiente son diversos, careciendo de una capa de incrustación unificada, lo que impide la formación de un espacio Q/K/V interactivo.

Además, la arquitectura modular de Web3 AI también dificulta la implementación de atención múltiple en paralelo y la asignación dinámica de pesos basada en el contexto global. Estas limitaciones hacen que Web3 AI tenga dificultades para alcanzar los niveles de rendimiento de Web2 AI al abordar tareas complejas y multimodales.

Fusión de características se queda en una unión estática superficial

En la IA de Web2, la fusión de características se realiza mediante una combinación profunda de los vectores de características procesados de diferentes modalidades sobre la base de alineación y atención. Sin embargo, en la IA de Web3, debido a la falta de representaciones de alta dimensión y mecanismos de atención precisos, la fusión de características a menudo se queda en la etapa más simple de concatenación.

La IA de Web2 tiende a un entrenamiento conjunto de extremo a extremo, procesando características multimodales en el mismo espacio de alta dimensión, optimizando de manera colaborativa con tareas posteriores a través de capas de atención y fusión. En contraste, la IA de Web3 a menudo utiliza la combinación de módulos discretos, encapsulando diversos API como agentes independientes, combinando simplemente sus salidas, careciendo de un objetivo de entrenamiento unificado y flujo de gradientes entre módulos.

Además, la IA de Web2 puede utilizar mecanismos de atención para ajustar dinámicamente las estrategias de fusión, mientras que la IA de Web3 a menudo utiliza pesos fijos o reglas simples. En términos de dimensiones de características y complejidad de interacción, la IA de Web3 también tiene dificultades para compararse con la IA de Web2 que se mapea a espacios de alta dimensión. Estas diferencias provocan que la IA de Web3 tenga un rendimiento deficiente al abordar tareas complejas de múltiples modalidades.

Las barreras en la industria de la IA se profundizan, pero las oportunidades aún no se han manifestado

El sistema multimodal de Web2 AI es un gran proyecto de ingeniería que requiere una gran cantidad de datos, potencia de cálculo, algoritmos avanzados y una implementación de ingeniería compleja. Esto constituye una barrera de entrada muy fuerte en la industria y crea la ventaja competitiva central de unos pocos equipos líderes.

Sin embargo, la IA de Web3 no debe seguir ciegamente. Debe centrarse en las ventajas de la descentralización y buscar oportunidades en escenarios como la computación en el borde. Las tareas adecuadas para la IA de Web3 incluyen estructuras ligeras, tareas fácilmente paralelizadas y que se pueden incentivar, como el ajuste fino de LoRA, el alineamiento de comportamiento en el entrenamiento posterior, el procesamiento de datos a través de crowdsourcing, el entrenamiento de modelos básicos pequeños, entre otros.

Actualmente, las barreras de la IA en Web2 apenas están comenzando a formarse, y esta es la etapa inicial de la competencia entre las empresas líderes. La IA en Web3 necesita esperar a que se desvanezcan los beneficios de Web2 para poder identificar verdaderas oportunidades de entrada. Hasta entonces, la IA en Web3 debería elegir cuidadosamente sus puntos de entrada, adoptando una estrategia de "rodear las ciudades desde el campo", acumulando experiencia desde escenarios periféricos y manteniendo flexibilidad para adaptarse a las cambiantes demandas del mercado.

AGENT-2.85%

Ver originales

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

15 me gusta