La reconfiguración del navegador en la era de la IA: de los motores de búsqueda a los agentes inteligentes
La tercera guerra de los navegadores se está desarrollando en silencio. Al mirar hacia atrás en la historia, desde Netscape en los años 90, el IE de Microsoft, hasta el espíritu de código abierto de Firefox y el Chrome de Google, la lucha por los navegadores ha sido una manifestación concentrada del control de la plataforma y el cambio de los paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su velocidad de actualización y la interconexión de su ecosistema, mientras que Google, a través de la estructura "duopolio" de búsqueda y navegador, ha formado un bucle cerrado de entrada a la información.
Sin embargo, hoy en día, este patrón está siendo sacudido. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda "sin clics", lo que reduce el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ya ha comenzado a mostrar inquietud sobre la "ortodoxia de la búsqueda".
El navegador en sí también se enfrenta a una reconfiguración de su papel. No solo es una herramienta para mostrar páginas web, sino que también es un contenedor que reúne múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad privada. Aunque el Agente de IA es poderoso, para realizar interacciones complejas en páginas, invocar datos de identidad locales y controlar elementos de la página web, todavía necesita aprovechar los límites de confianza y el sandbox funcional del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.
Lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no la exhibición de información, sino la invocación de tareas. Los navegadores del futuro deben ser diseñados para el Agente AI - no solo deben leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una gran reducción en los costos de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity construye el navegador nativo Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de criptomonedas como Donut apuntan a un nuevo acceso para la interacción entre la IA y los activos en cadena. La característica común de estos proyectos es: intentan reconstruir el extremo de entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agentes. El navegador, como la interfaz que invoca el mundo de los futuros agentes, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto están siendo reestructurados. La tercera guerra de los navegadores se libra en la "entrada" en lugar de en la "exhibición"; lo que determina el ganador ya no es quién atrae la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada para la invocación.
Breve historia del desarrollo del navegador
A principios de la década de 1990, cuando Internet aún no formaba parte de la vida diaria, Netscape Navigator apareció como un barco de vela que abría un nuevo continente, abriendo las puertas al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí el primero en el verdadero sentido de llegar al público y dar forma a la experiencia de Internet. En ese momento, la gente podía navegar por la web de manera tan fácil a través de una interfaz gráfica, como si de repente todo el mundo se volviera accesible.
Sin embargo, el esplendor a menudo es efímero. Microsoft se dio cuenta rápidamente de la importancia de los navegadores y decidió forzar la integración de Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia puede considerarse un "golpe maestro de plataforma", que desmanteló directamente la posición dominante de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era la opción predeterminada del sistema. IE, aprovechando la capacidad de distribución de Windows, se convirtió rápidamente en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.
En tiempos de crisis, los ingenieros de Netscape eligieron un camino radical e idealista: hicieron público el código fuente del navegador y llamaron a la comunidad de código abierto. Esta decisión pareció ser una "cesión macedonia" en el mundo tecnológico, presagiando el final de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, que se llamó inicialmente Phoenix (que significa renacimiento del fénix), pero que debido a problemas de marca pasó por varios cambios de nombre, y finalmente fue denominado Firefox.
Firefox no es una simple copia de Netscape, ha logrado múltiples avances en experiencia de usuario, ecosistema de complementos y seguridad. Su nacimiento marca la victoria del espíritu de código abierto y también inyecta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, así como el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene su significado.
Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja temporal y la estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, condenando esta competencia a no ser una competición justa desde la línea de salida.
Al mismo tiempo, otro jugador temprano también apareció silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, siempre ha estado a la vanguardia de la industria en términos de tecnología, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Fue un giro notable. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener la apariencia de competencia y evitar un escrutinio antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su creación es Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: cooperación y competencia, siempre van de la mano.
En 2007, IE7 fue lanzado junto con Windows Vista, pero la respuesta del mercado fue mediocre. En cambio, Firefox, gracias a un ritmo de actualización más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su participación en el mercado aumentaba constantemente hasta aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y el viento estaba cambiando.
Google es otra forma de hacer las cosas. Aunque comenzó a gestar su propio navegador en 2001, tardó seis años en convencer al CEO Eric Schmidt para que aprobara el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó el navegador "gordo", pero gracias a la profunda habilidad de Google en publicidad y creación de marca, rápidamente se destacó.
El arma clave de Chrome no son las funciones, sino el ritmo frecuente de actualizaciones de versiones (cada seis semanas) y la experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, volvió a superar a IE, completando la transformación de retador a dominante.
Al mismo tiempo, el internet móvil en China también está formando su propio ecosistema. Un conocido navegador se disparó rápidamente a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, ganando la preferencia de los usuarios de dispositivos de gama baja gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un 46% en un momento dado. Pero esta victoria no fue duradera. Con el fortalecimiento de las revisiones de seguridad de aplicaciones chinas por parte del gobierno indio, el navegador se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.
Al entrar en la década de 2020, la posición dominante de Chrome ya se ha consolidado, con una participación de mercado global estable alrededor del 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla aproximadamente el noventa por ciento de las entradas de búsqueda globales, mientras que el segundo maneja "la primera ventana" a través de la cual la mayoría de los usuarios acceden a la red.
Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición de búsqueda predeterminada en Safari. Algunos análisis señalan que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "tarifa de protección" por su foso.
Pero la dirección del viento ha cambiado una vez más. Con el auge de los modelos de lenguaje a gran escala (LLM), las búsquedas tradicionales han comenzado a sufrir. En 2024, la participación de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptiva es la rumorología sobre que Apple podría lanzar su propio motor de búsqueda de IA - si Safari cambia su motor de búsqueda predeterminado a uno propio, no solo reescribiría el panorama ecológico, sino que también podría sacudir el pilar de beneficios de Alphabet. La reacción del mercado fue rápida, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.
Desde Navigator hasta Chrome, desde el ideal del software abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda basados en IA, la lucha por los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controla la entrada, define el futuro.
A los ojos de los inversores, apoyándose en la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y AI, la tercera guerra de navegadores se está desarrollando gradualmente. A continuación se presenta la situación de financiamiento de algunos proyectos conocidos en la carrera de navegadores AI.
Arquitectura obsoleta de navegadores modernos
Hablando de la arquitectura del navegador, la arquitectura tradicional clásica se muestra en la siguiente figura:
Cliente - Entrada del Frontend
Consulta la entrega más reciente de la capa frontal a través de HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, scraping automático), se puede limitar el flujo o desafiar en esta capa.
Comprensión de consultas
El frontend necesita entender el significado de las palabras que el usuario teclea, hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intenciones, determinando si la consulta es de información, navegación o intención de transacción, y asignando solicitudes Vertical.
Recuperación de candidatos
La tecnología de consulta utilizada por un motor de búsqueda se llama: índice invertido. En un índice directo, simplemente se proporciona un ID para indexar un archivo. Sin embargo, los usuarios no pueden conocer el número del contenido deseado entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional, que permite consultar qué archivos contienen las palabras clave correspondientes. A continuación, se utiliza el índice vectorial para procesar búsquedas semánticas, es decir, buscar contenido similar en significado a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y busca en función de la similitud entre esos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", ya que son semánticamente similares. Después de pasar por el índice invertido y el índice vectorial, aproximadamente cien mil páginas web son preseleccionadas.
Ordenación multinivel
Los sistemas suelen filtrar cientos de miles de páginas candidatas a unas 1000, utilizando características ligeras de miles de dimensiones como BM25, TF-IDF, puntajes de calidad de página, etc., formando un conjunto inicial de candidatos. Estos sistemas se conocen comúnmente como motores de recomendación. Dependiendo de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales de contexto. Por ejemplo, un motor de búsqueda puede combinar la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la búsqueda, entre otros datos, y también considerar elementos de contexto, como el tiempo (horas del día, días específicos de la semana) y eventos externos como noticias de última hora.
Aprendizaje profundo para la clasificación principal
En la fase de búsqueda inicial, un motor de búsqueda utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar los resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático introducido en 2015, diseñado para comprender mejor el significado de las consultas de los usuarios, especialmente las que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales, calculando la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si el documento no contiene exactamente la misma frase.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
17 me gusta
Recompensa
17
8
Compartir
Comentar
0/400
StopLossMaster
· 07-19 05:19
Me muero de risa, ¿ya empezaste a ganar otra vez?
Ver originalesResponder0
DegenGambler
· 07-19 05:00
Una vez más, la batalla de vida o muerte de los gigantes. Solo juega y ya está.
Ver originalesResponder0
OffchainOracle
· 07-17 12:09
¿Google está realmente preocupado ahora?
Ver originalesResponder0
FlashLoanLarry
· 07-16 05:55
hm...otra oportunidad de captura de valor para la optimización del protocolo, la verdad
La lucha por el futuro de la IA y los navegadores: el camino de la transformación de los motores de búsqueda a los agentes inteligentes.
La reconfiguración del navegador en la era de la IA: de los motores de búsqueda a los agentes inteligentes
La tercera guerra de los navegadores se está desarrollando en silencio. Al mirar hacia atrás en la historia, desde Netscape en los años 90, el IE de Microsoft, hasta el espíritu de código abierto de Firefox y el Chrome de Google, la lucha por los navegadores ha sido una manifestación concentrada del control de la plataforma y el cambio de los paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su velocidad de actualización y la interconexión de su ecosistema, mientras que Google, a través de la estructura "duopolio" de búsqueda y navegador, ha formado un bucle cerrado de entrada a la información.
Sin embargo, hoy en día, este patrón está siendo sacudido. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda "sin clics", lo que reduce el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ya ha comenzado a mostrar inquietud sobre la "ortodoxia de la búsqueda".
El navegador en sí también se enfrenta a una reconfiguración de su papel. No solo es una herramienta para mostrar páginas web, sino que también es un contenedor que reúne múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad privada. Aunque el Agente de IA es poderoso, para realizar interacciones complejas en páginas, invocar datos de identidad locales y controlar elementos de la página web, todavía necesita aprovechar los límites de confianza y el sandbox funcional del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.
Lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no la exhibición de información, sino la invocación de tareas. Los navegadores del futuro deben ser diseñados para el Agente AI - no solo deben leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una gran reducción en los costos de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity construye el navegador nativo Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de criptomonedas como Donut apuntan a un nuevo acceso para la interacción entre la IA y los activos en cadena. La característica común de estos proyectos es: intentan reconstruir el extremo de entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agentes. El navegador, como la interfaz que invoca el mundo de los futuros agentes, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto están siendo reestructurados. La tercera guerra de los navegadores se libra en la "entrada" en lugar de en la "exhibición"; lo que determina el ganador ya no es quién atrae la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada para la invocación.
Breve historia del desarrollo del navegador
A principios de la década de 1990, cuando Internet aún no formaba parte de la vida diaria, Netscape Navigator apareció como un barco de vela que abría un nuevo continente, abriendo las puertas al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí el primero en el verdadero sentido de llegar al público y dar forma a la experiencia de Internet. En ese momento, la gente podía navegar por la web de manera tan fácil a través de una interfaz gráfica, como si de repente todo el mundo se volviera accesible.
Sin embargo, el esplendor a menudo es efímero. Microsoft se dio cuenta rápidamente de la importancia de los navegadores y decidió forzar la integración de Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia puede considerarse un "golpe maestro de plataforma", que desmanteló directamente la posición dominante de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era la opción predeterminada del sistema. IE, aprovechando la capacidad de distribución de Windows, se convirtió rápidamente en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.
En tiempos de crisis, los ingenieros de Netscape eligieron un camino radical e idealista: hicieron público el código fuente del navegador y llamaron a la comunidad de código abierto. Esta decisión pareció ser una "cesión macedonia" en el mundo tecnológico, presagiando el final de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, que se llamó inicialmente Phoenix (que significa renacimiento del fénix), pero que debido a problemas de marca pasó por varios cambios de nombre, y finalmente fue denominado Firefox.
Firefox no es una simple copia de Netscape, ha logrado múltiples avances en experiencia de usuario, ecosistema de complementos y seguridad. Su nacimiento marca la victoria del espíritu de código abierto y también inyecta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, así como el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene su significado.
Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja temporal y la estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, condenando esta competencia a no ser una competición justa desde la línea de salida.
Al mismo tiempo, otro jugador temprano también apareció silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, siempre ha estado a la vanguardia de la industria en términos de tecnología, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Fue un giro notable. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener la apariencia de competencia y evitar un escrutinio antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su creación es Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: cooperación y competencia, siempre van de la mano.
En 2007, IE7 fue lanzado junto con Windows Vista, pero la respuesta del mercado fue mediocre. En cambio, Firefox, gracias a un ritmo de actualización más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su participación en el mercado aumentaba constantemente hasta aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y el viento estaba cambiando.
Google es otra forma de hacer las cosas. Aunque comenzó a gestar su propio navegador en 2001, tardó seis años en convencer al CEO Eric Schmidt para que aprobara el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó el navegador "gordo", pero gracias a la profunda habilidad de Google en publicidad y creación de marca, rápidamente se destacó.
El arma clave de Chrome no son las funciones, sino el ritmo frecuente de actualizaciones de versiones (cada seis semanas) y la experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, volvió a superar a IE, completando la transformación de retador a dominante.
Al mismo tiempo, el internet móvil en China también está formando su propio ecosistema. Un conocido navegador se disparó rápidamente a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, ganando la preferencia de los usuarios de dispositivos de gama baja gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un 46% en un momento dado. Pero esta victoria no fue duradera. Con el fortalecimiento de las revisiones de seguridad de aplicaciones chinas por parte del gobierno indio, el navegador se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.
Al entrar en la década de 2020, la posición dominante de Chrome ya se ha consolidado, con una participación de mercado global estable alrededor del 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla aproximadamente el noventa por ciento de las entradas de búsqueda globales, mientras que el segundo maneja "la primera ventana" a través de la cual la mayoría de los usuarios acceden a la red.
Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición de búsqueda predeterminada en Safari. Algunos análisis señalan que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "tarifa de protección" por su foso.
Pero la dirección del viento ha cambiado una vez más. Con el auge de los modelos de lenguaje a gran escala (LLM), las búsquedas tradicionales han comenzado a sufrir. En 2024, la participación de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptiva es la rumorología sobre que Apple podría lanzar su propio motor de búsqueda de IA - si Safari cambia su motor de búsqueda predeterminado a uno propio, no solo reescribiría el panorama ecológico, sino que también podría sacudir el pilar de beneficios de Alphabet. La reacción del mercado fue rápida, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.
Desde Navigator hasta Chrome, desde el ideal del software abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda basados en IA, la lucha por los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controla la entrada, define el futuro.
A los ojos de los inversores, apoyándose en la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y AI, la tercera guerra de navegadores se está desarrollando gradualmente. A continuación se presenta la situación de financiamiento de algunos proyectos conocidos en la carrera de navegadores AI.
Arquitectura obsoleta de navegadores modernos
Hablando de la arquitectura del navegador, la arquitectura tradicional clásica se muestra en la siguiente figura:
Cliente - Entrada del Frontend
Consulta la entrega más reciente de la capa frontal a través de HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, scraping automático), se puede limitar el flujo o desafiar en esta capa.
Comprensión de consultas
El frontend necesita entender el significado de las palabras que el usuario teclea, hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intenciones, determinando si la consulta es de información, navegación o intención de transacción, y asignando solicitudes Vertical.
Recuperación de candidatos
La tecnología de consulta utilizada por un motor de búsqueda se llama: índice invertido. En un índice directo, simplemente se proporciona un ID para indexar un archivo. Sin embargo, los usuarios no pueden conocer el número del contenido deseado entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional, que permite consultar qué archivos contienen las palabras clave correspondientes. A continuación, se utiliza el índice vectorial para procesar búsquedas semánticas, es decir, buscar contenido similar en significado a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y busca en función de la similitud entre esos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", ya que son semánticamente similares. Después de pasar por el índice invertido y el índice vectorial, aproximadamente cien mil páginas web son preseleccionadas.
Ordenación multinivel
Los sistemas suelen filtrar cientos de miles de páginas candidatas a unas 1000, utilizando características ligeras de miles de dimensiones como BM25, TF-IDF, puntajes de calidad de página, etc., formando un conjunto inicial de candidatos. Estos sistemas se conocen comúnmente como motores de recomendación. Dependiendo de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales de contexto. Por ejemplo, un motor de búsqueda puede combinar la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la búsqueda, entre otros datos, y también considerar elementos de contexto, como el tiempo (horas del día, días específicos de la semana) y eventos externos como noticias de última hora.
Aprendizaje profundo para la clasificación principal
En la fase de búsqueda inicial, un motor de búsqueda utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar los resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático introducido en 2015, diseñado para comprender mejor el significado de las consultas de los usuarios, especialmente las que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales, calculando la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si el documento no contiene exactamente la misma frase.