A Reconfiguração do Navegador na Era da IA: De Motores de Busca a Agentes Inteligentes
A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape dos anos 90, o IE da Microsoft, até o Firefox com o espírito de código aberto e o Chrome do Google, a disputa entre navegadores sempre foi uma manifestação concentrada do controle da plataforma e das mudanças de paradigma tecnológico. O Chrome conquistou a posição de domínio graças à velocidade de atualização e à interação com o ecossistema, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informação.
No entanto, hoje, este padrão está a ser abalado. A ascensão dos grandes modelos de linguagem (LLM) está a levar cada vez mais utilizadores a completar tarefas na página de resultados de pesquisa com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, os rumores de que a Apple pretende substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começa a revelar insegurança em relação à "ortodoxia da pesquisa".
Os navegadores estão também a enfrentar uma reconfiguração do seu papel. Eles não são apenas ferramentas para exibir páginas web, mas sim recipientes que agregam várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora os Agentes de IA sejam poderosos, para realizar interações complexas em páginas, chamar dados de identidade local e controlar elementos da web, ainda precisam da confiança e das funcionalidades proporcionadas pelos navegadores. Os navegadores estão a transformar-se de interfaces humanas para plataformas de chamadas de sistema para Agentes.
O que realmente pode quebrar o atual padrão do mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não apenas a exibição de informações, mas a chamada de tarefas. O navegador do futuro deve ser projetado para o Agente de IA - que não apenas lê, mas também escreve e executa. Projetos como o Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para instruções, reduzindo significativamente o custo da interação.
Os principais projetos no mercado começaram a experimentar: a Perplexity construiu um navegador nativo chamado Comet, usando IA para substituir os resultados de busca tradicionais; a Brave combina proteção de privacidade com raciocínio local, utilizando LLM para melhorar a busca e as funções de bloqueio; enquanto projetos nativos de Crypto como o Donut visam uma nova entrada para a interação entre IA e ativos em blockchain. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface para a chamada do mundo pelo futuro Agente, significa que quem puder fornecer "blocos de capacidade" estruturados, chamáveis e confiáveis, poderá se tornar parte da nova geração de plataformas. Desde SEO até AEO (Otimização de Motor de Agentes), desde o tráfego da página até a chamada da cadeia de tarefas, a forma e o pensamento de design dos produtos estão se reestruturando. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; a chave para a vitória não é mais quem captura a atenção dos usuários, mas quem ganha a confiança do Agente e obtém a entrada para a chamada.
Breve História do Desenvolvimento dos Navegadores
No início da década de 90, quando a Internet ainda não fazia parte da vida cotidiana, o Netscape Navigator surgiu, como um barco à vela que abriu um novo continente, abrindo as portas para milhões de usuários ao mundo digital. Este navegador não foi o primeiro, mas foi o primeiro a realmente chegar ao público em geral e moldar a experiência da Internet. Naquela época, as pessoas podiam navegar pelas páginas da web com tanta facilidade através de uma interface gráfica, como se o mundo inteiro de repente se tornasse acessível.
No entanto, a glória é muitas vezes efémera. A Microsoft rapidamente percebeu a importância dos navegadores e decidiu forçar a inclusão do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia é considerada um "golpe de mestre da plataforma", que desmantelou diretamente a posição dominante da Netscape no mercado. Muitos usuários não escolheram o IE ativamente, mas aceitaram-no porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder da indústria, enquanto a Netscape caiu em um caminho de declínio.
Em meio a dificuldades, os engenheiros da Netscape escolheram um caminho radical e idealista - tornaram o código-fonte do navegador público, fazendo um apelo à comunidade de código aberto. Essa decisão parecia uma "renúncia macedônia" no campo da tecnologia, sinalizando o fim de uma era e o surgimento de novas forças. Esse código mais tarde se tornou a base do projeto do navegador Mozilla, inicialmente nomeado de Phoenix (que significa renascimento da fênix), mas devido a problemas de marca registrada, passou por várias mudanças de nome, até finalmente ser chamado de Firefox.
O Firefox não é uma simples cópia do Netscape; ele alcançou várias inovações em termos de experiência do usuário, ecossistema de plugins e segurança. Seu surgimento marca a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou os últimos resquícios do Império Bizantino. Embora essa metáfora seja exagerada, é bastante significativa.
Mas nos anos anteriores ao lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem de tempo e a estratégia de empacotamento do sistema, fazendo com que o Firefox começasse em uma posição de perseguição, o que tornava esta corrida uma competição desigual desde o início.
Enquanto isso, outro jogador inicial também apareceu silenciosamente. Em 1994, o navegador Opera foi lançado, vindo da Noruega, inicialmente como um projeto experimental. Mas a partir da versão 7.0 em 2003, ele introduziu o motor Presto desenvolvido internamente, sendo o primeiro a suportar CSS, layouts responsivos, controle de voz e codificação Unicode, entre outras tecnologias de ponta. Embora o número de usuários fosse limitado, sua tecnologia sempre esteve na vanguarda da indústria, tornando-se "o favorito dos geeks".
No mesmo ano, a Apple lançou o navegador Safari. Esta foi uma reviravolta significativa. Na época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter as aparências de concorrência e evitar uma investigação antitruste. Embora o motor de busca padrão do Safari desde o seu nascimento tenha sido o Google, essa história de laços com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: cooperação e competição, sempre andam de mãos dadas.
Em 2007, o IE7 foi lançado com o Windows Vista, mas a recepção do mercado foi morna. Em contraste, o Firefox, com um ritmo de atualização mais rápido, um mecanismo de extensões mais amigável e um apelo natural para os desenvolvedores, viu sua participação de mercado aumentar de forma constante para cerca de 20%. O domínio do IE começou a se afrouxar, e a maré estava mudando.
O Google adotou uma abordagem diferente. Embora tenha começado a desenvolver seu próprio navegador em 2001, levou seis anos para convencer o CEO Eric Schmidt a aprovar o projeto. O Chrome foi lançado em 2008, baseado no projeto de código aberto Chromium e no motor WebKit utilizado pelo Safari. Foi apelidado de "navegador pesado", mas, graças à profunda habilidade do Google em publicidade e na construção de marcas, rapidamente se destacou.
A principal arma do Chrome não é a funcionalidade, mas sim a frequência das atualizações de versão (a cada seis semanas) e a experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou pela primeira vez o Firefox, alcançando uma quota de mercado de 27%; seis meses depois, ultrapassou novamente o IE, completando a transição de desafiante para dominador.
Simultaneamente, a internet móvel na China também está a formar o seu próprio ecossistema. Um conhecido navegador ganhou rapidamente popularidade no início da década de 2010, especialmente em mercados emergentes como a Índia, Indonésia e China, conquistando a preferência dos usuários de dispositivos de baixo custo com um design leve e características como a compressão de dados para economizar tráfego. Em 2015, a sua quota de mercado global de navegadores móveis ultrapassou os 17%, chegando a atingir 46% na Índia. Mas esta vitória não foi duradoura. Com o governo indiano a reforçar a auditoria de segurança das aplicações chinesas, o navegador foi forçado a sair de um mercado chave, perdendo gradualmente o seu antigo esplendor.
À medida que entramos na década de 2020, a posição dominante do Chrome já está estabelecida, com uma quota de mercado global estável em cerca de 65%. Vale a pena notar que, embora o motor de busca do Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista do mercado, são dois sistemas hegemônicos independentes - o primeiro controla cerca de noventa por cento das entradas de pesquisa global, enquanto o segundo detém a maioria dos usuários que acessam a rede pela "primeira janela".
Para manter essa estrutura de duopólio, o Google não hesitou em investir fortemente. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple apenas para manter o Google como o mecanismo de busca padrão no Safari. Algumas análises apontam que esse gasto equivale a 36% da receita de anúncios de busca que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para proteger seu fosso.
Mas a direção do vento mudou mais uma vez. Com a ascensão de modelos de linguagem de grande escala (LLM), as buscas tradicionais começaram a ser impactadas. Em 2024, a participação de mercado da Google nas buscas caiu de 93% para 89%, embora ainda domine, fissuras começaram a aparecer. Mais disruptiva é a especulação de que a Apple pode lançar seu próprio motor de busca de IA - se o Safari mudar seu mecanismo de busca padrão para sua própria plataforma, isso não apenas reescreverá o ecossistema, mas também poderá abalar o pilar de lucros da Alphabet. O mercado reagiu rapidamente, com as ações da Alphabet caindo de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda inquietação sobre a direção futura da era das buscas.
Desde o Navigator até ao Chrome, passando pela ideia de código aberto até à comercialização da publicidade, da leveza dos navegadores até aos assistentes de busca com IA, a disputa entre navegadores tem sido sempre uma guerra sobre tecnologia, plataformas, conteúdos e controle. O campo de batalha está em constante mudança, mas a essência nunca mudou: quem controla a entrada, define o futuro.
Na visão dos investidores, aproveitando a nova demanda das pessoas por motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está se desenrolando gradualmente. Abaixo estão algumas informações sobre o financiamento de projetos conhecidos na pista de navegadores de IA.
A arquitetura antiga dos navegadores modernos
Falando sobre a arquitetura do navegador, a clássica arquitetura tradicional é mostrada na figura abaixo:
Cliente - Entrada do Frontend
Consultar a entrega mais recente no front-end via HTTPS, completar a descriptografia TLS, amostragem QoS e roteamento geográfico. Se for detectado tráfego anômalo (DDoS, scraping automático), pode haver limitação ou desafio nesta camada.
Compreensão da consulta
A parte frontal precisa entender o significado das palavras digitadas pelo usuário, e existem três etapas: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é uma intenção de informação, navegação ou transação, e atribuindo um pedido Vertical.
Recolha de candidatos
A técnica de consulta utilizada por um determinado motor de busca é chamada de: índice invertido. No índice direto, podemos indexar um arquivo dado um ID. No entanto, os usuários não podem saber o número do conteúdo desejado entre centenas de bilhões de arquivos, portanto, a técnica tradicional de índice invertido é utilizada, permitindo consultar quais arquivos contêm as palavras-chave correspondentes. Em seguida, utiliza-se o índice vetorial para processar a busca semântica, ou seja, encontrar conteúdos que tenham significados semelhantes à consulta. Ele converte textos, imagens e outros conteúdos em vetores de alta dimensão (embedding) e realiza a busca com base na similaridade entre esses vetores. Por exemplo, mesmo que o usuário pesquise "como fazer massa de pizza", o motor de busca pode retornar resultados relacionados a "guia de preparo da massa de pizza", pois são semanticamente semelhantes. Após passar pelo índice invertido e pelo índice vetorial, aproximadamente cem mil páginas da web são inicialmente filtradas.
Classificação Multinível
Os sistemas geralmente filtram centenas de milhares de páginas candidatas para cerca de 1000, formando um conjunto inicial de candidatos, utilizando características leves de milhares de dimensões, como BM25, TF-IDF e pontuação de qualidade da página. Esses sistemas são genericamente chamados de motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de busca e sinais de contexto. Por exemplo, um motor de busca pode integrar o histórico do usuário, o feedback de comportamento de outros usuários, a semântica da página, o significado da consulta, entre outras informações, ao mesmo tempo que considera elementos contextuais, como tempo (períodos do dia, dias específicos da semana) e eventos externos como notícias em tempo real.
Aprendizado profundo para classificação principal
Na fase de pesquisa inicial, um motor de busca utiliza tecnologias como RankBrain e Neural Matching para entender o significado das consultas e filtrar resultados inicialmente relevantes a partir de uma vasta quantidade de documentos. O RankBrain é um sistema de aprendizado de máquina introduzido em 2015, destinado a compreender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele converte consultas e documentos em representações vetoriais, calculando a similaridade entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer massa de pizza", mesmo que o documento não contenha a expressão exata,
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
17 gostos
Recompensa
17
8
Partilhar
Comentar
0/400
StopLossMaster
· 07-19 05:19
Morrendo de rir, já começou a ganhar, não é?
Ver originalResponder0
DegenGambler
· 07-19 05:00
Mais uma vez, a batalha de vida ou morte entre gigantes. Jogar é tudo.
Ver originalResponder0
OffchainOracle
· 07-17 12:09
O Google deve estar realmente preocupado agora.
Ver originalResponder0
FlashLoanLarry
· 07-16 05:55
hm...outra oportunidade de captura de valor para otimização de protocolo tbh
O futuro da luta entre IA e navegadores: o caminho da transformação dos motores de busca para agentes inteligentes
A Reconfiguração do Navegador na Era da IA: De Motores de Busca a Agentes Inteligentes
A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape dos anos 90, o IE da Microsoft, até o Firefox com o espírito de código aberto e o Chrome do Google, a disputa entre navegadores sempre foi uma manifestação concentrada do controle da plataforma e das mudanças de paradigma tecnológico. O Chrome conquistou a posição de domínio graças à velocidade de atualização e à interação com o ecossistema, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informação.
No entanto, hoje, este padrão está a ser abalado. A ascensão dos grandes modelos de linguagem (LLM) está a levar cada vez mais utilizadores a completar tarefas na página de resultados de pesquisa com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, os rumores de que a Apple pretende substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começa a revelar insegurança em relação à "ortodoxia da pesquisa".
Os navegadores estão também a enfrentar uma reconfiguração do seu papel. Eles não são apenas ferramentas para exibir páginas web, mas sim recipientes que agregam várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora os Agentes de IA sejam poderosos, para realizar interações complexas em páginas, chamar dados de identidade local e controlar elementos da web, ainda precisam da confiança e das funcionalidades proporcionadas pelos navegadores. Os navegadores estão a transformar-se de interfaces humanas para plataformas de chamadas de sistema para Agentes.
O que realmente pode quebrar o atual padrão do mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não apenas a exibição de informações, mas a chamada de tarefas. O navegador do futuro deve ser projetado para o Agente de IA - que não apenas lê, mas também escreve e executa. Projetos como o Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para instruções, reduzindo significativamente o custo da interação.
Os principais projetos no mercado começaram a experimentar: a Perplexity construiu um navegador nativo chamado Comet, usando IA para substituir os resultados de busca tradicionais; a Brave combina proteção de privacidade com raciocínio local, utilizando LLM para melhorar a busca e as funções de bloqueio; enquanto projetos nativos de Crypto como o Donut visam uma nova entrada para a interação entre IA e ativos em blockchain. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface para a chamada do mundo pelo futuro Agente, significa que quem puder fornecer "blocos de capacidade" estruturados, chamáveis e confiáveis, poderá se tornar parte da nova geração de plataformas. Desde SEO até AEO (Otimização de Motor de Agentes), desde o tráfego da página até a chamada da cadeia de tarefas, a forma e o pensamento de design dos produtos estão se reestruturando. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; a chave para a vitória não é mais quem captura a atenção dos usuários, mas quem ganha a confiança do Agente e obtém a entrada para a chamada.
Breve História do Desenvolvimento dos Navegadores
No início da década de 90, quando a Internet ainda não fazia parte da vida cotidiana, o Netscape Navigator surgiu, como um barco à vela que abriu um novo continente, abrindo as portas para milhões de usuários ao mundo digital. Este navegador não foi o primeiro, mas foi o primeiro a realmente chegar ao público em geral e moldar a experiência da Internet. Naquela época, as pessoas podiam navegar pelas páginas da web com tanta facilidade através de uma interface gráfica, como se o mundo inteiro de repente se tornasse acessível.
No entanto, a glória é muitas vezes efémera. A Microsoft rapidamente percebeu a importância dos navegadores e decidiu forçar a inclusão do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia é considerada um "golpe de mestre da plataforma", que desmantelou diretamente a posição dominante da Netscape no mercado. Muitos usuários não escolheram o IE ativamente, mas aceitaram-no porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder da indústria, enquanto a Netscape caiu em um caminho de declínio.
Em meio a dificuldades, os engenheiros da Netscape escolheram um caminho radical e idealista - tornaram o código-fonte do navegador público, fazendo um apelo à comunidade de código aberto. Essa decisão parecia uma "renúncia macedônia" no campo da tecnologia, sinalizando o fim de uma era e o surgimento de novas forças. Esse código mais tarde se tornou a base do projeto do navegador Mozilla, inicialmente nomeado de Phoenix (que significa renascimento da fênix), mas devido a problemas de marca registrada, passou por várias mudanças de nome, até finalmente ser chamado de Firefox.
O Firefox não é uma simples cópia do Netscape; ele alcançou várias inovações em termos de experiência do usuário, ecossistema de plugins e segurança. Seu surgimento marca a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou os últimos resquícios do Império Bizantino. Embora essa metáfora seja exagerada, é bastante significativa.
Mas nos anos anteriores ao lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem de tempo e a estratégia de empacotamento do sistema, fazendo com que o Firefox começasse em uma posição de perseguição, o que tornava esta corrida uma competição desigual desde o início.
Enquanto isso, outro jogador inicial também apareceu silenciosamente. Em 1994, o navegador Opera foi lançado, vindo da Noruega, inicialmente como um projeto experimental. Mas a partir da versão 7.0 em 2003, ele introduziu o motor Presto desenvolvido internamente, sendo o primeiro a suportar CSS, layouts responsivos, controle de voz e codificação Unicode, entre outras tecnologias de ponta. Embora o número de usuários fosse limitado, sua tecnologia sempre esteve na vanguarda da indústria, tornando-se "o favorito dos geeks".
No mesmo ano, a Apple lançou o navegador Safari. Esta foi uma reviravolta significativa. Na época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter as aparências de concorrência e evitar uma investigação antitruste. Embora o motor de busca padrão do Safari desde o seu nascimento tenha sido o Google, essa história de laços com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: cooperação e competição, sempre andam de mãos dadas.
Em 2007, o IE7 foi lançado com o Windows Vista, mas a recepção do mercado foi morna. Em contraste, o Firefox, com um ritmo de atualização mais rápido, um mecanismo de extensões mais amigável e um apelo natural para os desenvolvedores, viu sua participação de mercado aumentar de forma constante para cerca de 20%. O domínio do IE começou a se afrouxar, e a maré estava mudando.
O Google adotou uma abordagem diferente. Embora tenha começado a desenvolver seu próprio navegador em 2001, levou seis anos para convencer o CEO Eric Schmidt a aprovar o projeto. O Chrome foi lançado em 2008, baseado no projeto de código aberto Chromium e no motor WebKit utilizado pelo Safari. Foi apelidado de "navegador pesado", mas, graças à profunda habilidade do Google em publicidade e na construção de marcas, rapidamente se destacou.
A principal arma do Chrome não é a funcionalidade, mas sim a frequência das atualizações de versão (a cada seis semanas) e a experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou pela primeira vez o Firefox, alcançando uma quota de mercado de 27%; seis meses depois, ultrapassou novamente o IE, completando a transição de desafiante para dominador.
Simultaneamente, a internet móvel na China também está a formar o seu próprio ecossistema. Um conhecido navegador ganhou rapidamente popularidade no início da década de 2010, especialmente em mercados emergentes como a Índia, Indonésia e China, conquistando a preferência dos usuários de dispositivos de baixo custo com um design leve e características como a compressão de dados para economizar tráfego. Em 2015, a sua quota de mercado global de navegadores móveis ultrapassou os 17%, chegando a atingir 46% na Índia. Mas esta vitória não foi duradoura. Com o governo indiano a reforçar a auditoria de segurança das aplicações chinesas, o navegador foi forçado a sair de um mercado chave, perdendo gradualmente o seu antigo esplendor.
À medida que entramos na década de 2020, a posição dominante do Chrome já está estabelecida, com uma quota de mercado global estável em cerca de 65%. Vale a pena notar que, embora o motor de busca do Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista do mercado, são dois sistemas hegemônicos independentes - o primeiro controla cerca de noventa por cento das entradas de pesquisa global, enquanto o segundo detém a maioria dos usuários que acessam a rede pela "primeira janela".
Para manter essa estrutura de duopólio, o Google não hesitou em investir fortemente. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple apenas para manter o Google como o mecanismo de busca padrão no Safari. Algumas análises apontam que esse gasto equivale a 36% da receita de anúncios de busca que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para proteger seu fosso.
Mas a direção do vento mudou mais uma vez. Com a ascensão de modelos de linguagem de grande escala (LLM), as buscas tradicionais começaram a ser impactadas. Em 2024, a participação de mercado da Google nas buscas caiu de 93% para 89%, embora ainda domine, fissuras começaram a aparecer. Mais disruptiva é a especulação de que a Apple pode lançar seu próprio motor de busca de IA - se o Safari mudar seu mecanismo de busca padrão para sua própria plataforma, isso não apenas reescreverá o ecossistema, mas também poderá abalar o pilar de lucros da Alphabet. O mercado reagiu rapidamente, com as ações da Alphabet caindo de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda inquietação sobre a direção futura da era das buscas.
Desde o Navigator até ao Chrome, passando pela ideia de código aberto até à comercialização da publicidade, da leveza dos navegadores até aos assistentes de busca com IA, a disputa entre navegadores tem sido sempre uma guerra sobre tecnologia, plataformas, conteúdos e controle. O campo de batalha está em constante mudança, mas a essência nunca mudou: quem controla a entrada, define o futuro.
Na visão dos investidores, aproveitando a nova demanda das pessoas por motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está se desenrolando gradualmente. Abaixo estão algumas informações sobre o financiamento de projetos conhecidos na pista de navegadores de IA.
A arquitetura antiga dos navegadores modernos
Falando sobre a arquitetura do navegador, a clássica arquitetura tradicional é mostrada na figura abaixo:
Cliente - Entrada do Frontend
Consultar a entrega mais recente no front-end via HTTPS, completar a descriptografia TLS, amostragem QoS e roteamento geográfico. Se for detectado tráfego anômalo (DDoS, scraping automático), pode haver limitação ou desafio nesta camada.
Compreensão da consulta
A parte frontal precisa entender o significado das palavras digitadas pelo usuário, e existem três etapas: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é uma intenção de informação, navegação ou transação, e atribuindo um pedido Vertical.
Recolha de candidatos
A técnica de consulta utilizada por um determinado motor de busca é chamada de: índice invertido. No índice direto, podemos indexar um arquivo dado um ID. No entanto, os usuários não podem saber o número do conteúdo desejado entre centenas de bilhões de arquivos, portanto, a técnica tradicional de índice invertido é utilizada, permitindo consultar quais arquivos contêm as palavras-chave correspondentes. Em seguida, utiliza-se o índice vetorial para processar a busca semântica, ou seja, encontrar conteúdos que tenham significados semelhantes à consulta. Ele converte textos, imagens e outros conteúdos em vetores de alta dimensão (embedding) e realiza a busca com base na similaridade entre esses vetores. Por exemplo, mesmo que o usuário pesquise "como fazer massa de pizza", o motor de busca pode retornar resultados relacionados a "guia de preparo da massa de pizza", pois são semanticamente semelhantes. Após passar pelo índice invertido e pelo índice vetorial, aproximadamente cem mil páginas da web são inicialmente filtradas.
Classificação Multinível
Os sistemas geralmente filtram centenas de milhares de páginas candidatas para cerca de 1000, formando um conjunto inicial de candidatos, utilizando características leves de milhares de dimensões, como BM25, TF-IDF e pontuação de qualidade da página. Esses sistemas são genericamente chamados de motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de busca e sinais de contexto. Por exemplo, um motor de busca pode integrar o histórico do usuário, o feedback de comportamento de outros usuários, a semântica da página, o significado da consulta, entre outras informações, ao mesmo tempo que considera elementos contextuais, como tempo (períodos do dia, dias específicos da semana) e eventos externos como notícias em tempo real.
Aprendizado profundo para classificação principal
Na fase de pesquisa inicial, um motor de busca utiliza tecnologias como RankBrain e Neural Matching para entender o significado das consultas e filtrar resultados inicialmente relevantes a partir de uma vasta quantidade de documentos. O RankBrain é um sistema de aprendizado de máquina introduzido em 2015, destinado a compreender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele converte consultas e documentos em representações vetoriais, calculando a similaridade entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer massa de pizza", mesmo que o documento não contenha a expressão exata,