Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent trong Web2 chủ yếu là loại dịch vụ doanh nghiệp phổ biến và trưởng thành, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng trở thành chính thống do vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chỉ chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lên tới 23%, do đó cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự công nhận từ thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc áp dụng công nghệ AI vào các sản phẩm ứng dụng không phải lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy tính phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng xuất hiện dự án và sự tăng giá trị
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút được hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt tới con số 20,3 triệu đô la Mỹ đáng kinh ngạc. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng ra mắt các phiên bản kế nhiệm như GPT-4, GP4-4o. Với sự phát triển nhanh chóng như vậy, các ông lớn công nghệ truyền thống đã nhận ra tầm quan trọng của việc ứng dụng các mô hình AI tiên tiến như LLM, và đã đồng loạt tung ra các mô hình và ứng dụng AI của riêng mình, ví dụ như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta ra mắt Llama3, trong khi các công ty Trung Quốc đã giới thiệu các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành một nơi cạnh tranh khốc liệt.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà từ các khảo sát thống kê nghiên cứu AI nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu dự án vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án tăng 59,3% so với năm trước, phản ánh sự đam mê của cộng đồng phát triển toàn cầu đối với nghiên cứu AI.
Sự nhiệt tình đối với công nghệ AI đã phản ánh trực tiếp trên thị trường đầu tư, thị trường đầu tư AI đã cho thấy sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu đô la Mỹ, gấp đôi so với quý 1. Tổng số vốn huy động của các công ty khởi nghiệp AI đã tăng vọt lên 24 tỷ đô la Mỹ, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Musk đã huy động được 6 tỷ đô la Mỹ, với định giá đạt 24 tỷ đô la Mỹ, trở thành công ty khởi nghiệp AI có định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang tái định hình bản đồ lĩnh vực công nghệ với một tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các ông lớn công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, cho đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục ra đời, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó mà tăng vọt. Tổng thể, thị trường AI đang ở trong một thời kỳ vàng phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo ra thông tin tăng cường đã đạt được những tiến bộ đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn phải đối mặt với thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như sự không chắc chắn trong đầu ra của mô hình, rủi ro ảo giác sinh ra thông tin không chính xác và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong những trường hợp ứng dụng yêu cầu độ tin cậy cực kỳ cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ các mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu biết, học hỏi và giải quyết các vấn đề trong thế giới thực. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, khi nó từng bước thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI đang liên tục định hình lại cấu trúc sản xuất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, kết hợp với các nguyên tắc cốt lõi như phi tập trung, kinh tế token và hợp đồng thông minh của Web3, chúng tôi dự đoán sẽ nảy sinh một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng, AI Agent với khả năng tự thực hiện nhiệm vụ của mình, đã thể hiện tiềm năng to lớn để thực hiện các ứng dụng quy mô lớn.
Để làm điều này, chúng tôi bắt đầu nghiên cứu sâu về ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các ứng dụng, cũng như thị trường dữ liệu và mô hình, nhằm xác định và đánh giá những loại dự án và tình huống ứng dụng triển vọng nhất, để hiểu sâu về sự hòa quyện giữa AI và Web3.
Khái niệm làm rõ: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp độc giả hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ lấy một ví dụ từ một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo ra nội dung tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Iron Man, có khả năng hiểu nhu cầu và có thể chủ động tìm kiếm chuyến bay và khách sạn, thực hiện các thao tác đặt chỗ, thêm lịch trình vào lịch.
Hiện nay, trong ngành công nghiệp, định nghĩa phổ biến về AI Agent là hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng. Hệ thống này thu thập thông tin môi trường qua cảm biến, sau khi xử lý, nó tác động vào môi trường thông qua các bộ thực thi (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý kết hợp khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và khả năng sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân chia nhiệm vụ và thực hiện một cách thực sự.
Theo định nghĩa và đặc điểm này, chúng ta có thể nhận thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái xe tự động cấp độ L5 của Tesla có thể được coi là những ví dụ về AI Agent. Những hệ thống này có đặc điểm chung là đều có khả năng nhận biết đầu vào từ người dùng bên ngoài và từ đó đưa ra phản ứng có ảnh hưởng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ ra rằng Transformer là kiến trúc kỹ thuật cấu thành mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGPT là AI Agent phát triển từ mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent chưa hình thành tiêu chuẩn phân loại thống nhất, chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2+Web3, dựa trên các nhãn nổi bật tương ứng với từng dự án, chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một gồm ba loại: cơ sở hạ tầng, tạo nội dung, và tương tác với người dùng, sau đó được chia nhỏ theo các trường hợp sử dụng thực tế:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung cơ bản trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành và ứng dụng cơ bản.
Công cụ phát triển: Cung cấp cho nhà phát triển các công cụ và khung hỗ trợ để xây dựng AI Agent.
Loại xử lý dữ liệu: Xử lý và phân tích dữ liệu ở định dạng khác nhau, chủ yếu dùng để hỗ trợ quyết định, cung cấp nguồn cho việc huấn luyện.
Lớp đào tạo mô hình: Cung cấp dịch vụ đào tạo mô hình cho AI, bao gồm suy luận, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B: Chủ yếu phục vụ người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, dịch vụ theo chiều dọc và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt ở chỗ có sự tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng, mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện sự tương tác hai chiều với người dùng.
Loại hình bạn đồng hành cảm xúc: Cung cấp hỗ trợ cảm xúc và bạn đồng hành AI.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp thông tin chính xác hơn cho Agent.
Nội dung tạo ra: Các dự án loại này tập trung vào việc tạo nội dung, sử dụng công nghệ mô hình lớn để tạo ra các hình thức nội dung khác nhau theo chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình hình phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, việc phát triển AI Agent trong Internet truyền thống Web2 đang thể hiện xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba số dự án tập trung vào các lĩnh vực cơ sở hạ tầng, trong đó chủ yếu là các dịch vụ B2B và các công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên các công nghệ và khung đã được kiểm nghiệm theo thời gian, từ đó giảm thiểu độ khó và rủi ro trong phát triển. Tương đương với "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy từ nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI trong thị trường doanh nghiệp cấp bách hơn nhiều, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, có lợi cho việc phát triển các dự án tiếp theo.
Giới hạn trong các trường hợp ứng dụng: Trong khi đó, chúng tôi nhận thấy rằng các AI sinh nội dung có ứng dụng tương đối hạn chế trong thị trường B2B. Do tính không ổn định trong sản phẩm đầu ra, các doanh nghiệp có xu hướng ưu tiên những ứng dụng có khả năng nâng cao năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của các AI sinh nội dung trong thư viện dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và những cân nhắc thực tế về các tình huống ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và sự làm rõ hơn về nhu cầu thị trường, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các loại hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án đầu ngành AI Agent Web2
Chúng tôi sẽ đi sâu vào việc khám phá một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, lấy ba dự án Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo ra, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng thực hiện cuộc đối thoại tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 là 277 triệu, nền tảng có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng có độ tuổi từ 18 đến 34, cho thấy đặc điểm nhóm người dùng trẻ tuổi. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, với định giá đạt 1 tỷ USD, do a16z dẫn đầu.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền để sử dụng mô hình ngôn ngữ lớn của công ty mẹ Google là Alphabet, điều này cho thấy Character AI đang áp dụng công nghệ tự phát triển. Đáng chú ý là, các nhà sáng lập của công ty Noam Shazeer và Daniel De Freitas đã từng tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Bằng cách trích dẫn và liên kết tham khảo, nó đảm bảo tính đáng tin cậy và độ chính xác của thông tin, đồng thời nó sẽ giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, lượt truy cập vào ứng dụng di động và máy tính để bàn của họ đã tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố đã huy động được 62,7 triệu USD, đạt giá trị ước tính 1,04 tỷ USD, do Daniel Gross dẫn dắt, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình này phù hợp cho nghiên cứu học thuật chuyên nghiệp và các lĩnh vực chuyên sâu.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
24 thích
Phần thưởng
24
9
Chia sẻ
Bình luận
0/400
GasBankrupter
· 07-14 06:00
Cái này thật sự hữu dụng? Rơm không bằng mua đáy
Xem bản gốcTrả lời0
tokenomics_truther
· 07-13 14:37
8% chiếm tỷ lệ vốn hóa thị trường 23% thật sự ấn tượng
Xem bản gốcTrả lời0
StakeTillRetire
· 07-13 07:29
Dữ liệu vẫn ổn đấy, đáng để đầu tư một chút.
Xem bản gốcTrả lời0
SleepyValidator
· 07-13 01:55
Có chút cuốn 23% vốn hóa thị trường chỉ có 8% số lượng
Xem bản gốcTrả lời0
GasFeeWhisperer
· 07-13 01:55
thị trường tăng dự kiến đã sẵn sàng, chỉ còn xem agent có chạy nhanh không.
Xem bản gốcTrả lời0
0xLostKey
· 07-13 01:52
Được chơi cho Suckers mới đã đến
Xem bản gốcTrả lời0
AltcoinAnalyst
· 07-13 01:52
Từ dữ liệu cho thấy tỷ lệ vốn hóa thị trường của lĩnh vực Agent đã đạt 23%, đường cong tăng trưởng TVL phù hợp với dự đoán, nhưng cần lưu ý cấu trúc phân bổ token và rủi ro tập trung trọng số của từng tài sản, khuyến nghị tham gia một cách vừa phải để duy trì thanh khoản, cá nhân tôi không khuyến nghị vị thế nặng.
Xem bản gốcTrả lời0
HorizonHunter
· 07-13 01:52
Danh tiếng đã giảm về 0 thuộc về... thị trường tăng tiếp theo sẽ phụ thuộc vào điều này.
Xem bản gốcTrả lời0
Web3Educator
· 07-13 01:27
*điều chỉnh kính* dữ liệu thú vị về các tác nhân ai... nhưng đừng tự lừa dối mình về việc tokenomics là bí quyết kỳ diệu ở đây
Liệu AI Agent có thể trở thành vũ khí chiến thắng trong lĩnh vực Web3+AI?
Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent trong Web2 chủ yếu là loại dịch vụ doanh nghiệp phổ biến và trưởng thành, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng trở thành chính thống do vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chỉ chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lên tới 23%, do đó cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự công nhận từ thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc áp dụng công nghệ AI vào các sản phẩm ứng dụng không phải lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy tính phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng xuất hiện dự án và sự tăng giá trị
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút được hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt tới con số 20,3 triệu đô la Mỹ đáng kinh ngạc. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng ra mắt các phiên bản kế nhiệm như GPT-4, GP4-4o. Với sự phát triển nhanh chóng như vậy, các ông lớn công nghệ truyền thống đã nhận ra tầm quan trọng của việc ứng dụng các mô hình AI tiên tiến như LLM, và đã đồng loạt tung ra các mô hình và ứng dụng AI của riêng mình, ví dụ như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta ra mắt Llama3, trong khi các công ty Trung Quốc đã giới thiệu các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành một nơi cạnh tranh khốc liệt.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà từ các khảo sát thống kê nghiên cứu AI nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu dự án vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án tăng 59,3% so với năm trước, phản ánh sự đam mê của cộng đồng phát triển toàn cầu đối với nghiên cứu AI.
Sự nhiệt tình đối với công nghệ AI đã phản ánh trực tiếp trên thị trường đầu tư, thị trường đầu tư AI đã cho thấy sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu đô la Mỹ, gấp đôi so với quý 1. Tổng số vốn huy động của các công ty khởi nghiệp AI đã tăng vọt lên 24 tỷ đô la Mỹ, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Musk đã huy động được 6 tỷ đô la Mỹ, với định giá đạt 24 tỷ đô la Mỹ, trở thành công ty khởi nghiệp AI có định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang tái định hình bản đồ lĩnh vực công nghệ với một tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các ông lớn công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, cho đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục ra đời, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó mà tăng vọt. Tổng thể, thị trường AI đang ở trong một thời kỳ vàng phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo ra thông tin tăng cường đã đạt được những tiến bộ đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn phải đối mặt với thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như sự không chắc chắn trong đầu ra của mô hình, rủi ro ảo giác sinh ra thông tin không chính xác và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong những trường hợp ứng dụng yêu cầu độ tin cậy cực kỳ cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ các mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu biết, học hỏi và giải quyết các vấn đề trong thế giới thực. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, khi nó từng bước thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI đang liên tục định hình lại cấu trúc sản xuất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, kết hợp với các nguyên tắc cốt lõi như phi tập trung, kinh tế token và hợp đồng thông minh của Web3, chúng tôi dự đoán sẽ nảy sinh một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng, AI Agent với khả năng tự thực hiện nhiệm vụ của mình, đã thể hiện tiềm năng to lớn để thực hiện các ứng dụng quy mô lớn.
Để làm điều này, chúng tôi bắt đầu nghiên cứu sâu về ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các ứng dụng, cũng như thị trường dữ liệu và mô hình, nhằm xác định và đánh giá những loại dự án và tình huống ứng dụng triển vọng nhất, để hiểu sâu về sự hòa quyện giữa AI và Web3.
Khái niệm làm rõ: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp độc giả hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ lấy một ví dụ từ một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo ra nội dung tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Iron Man, có khả năng hiểu nhu cầu và có thể chủ động tìm kiếm chuyến bay và khách sạn, thực hiện các thao tác đặt chỗ, thêm lịch trình vào lịch.
Hiện nay, trong ngành công nghiệp, định nghĩa phổ biến về AI Agent là hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng. Hệ thống này thu thập thông tin môi trường qua cảm biến, sau khi xử lý, nó tác động vào môi trường thông qua các bộ thực thi (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý kết hợp khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và khả năng sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân chia nhiệm vụ và thực hiện một cách thực sự.
Theo định nghĩa và đặc điểm này, chúng ta có thể nhận thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái xe tự động cấp độ L5 của Tesla có thể được coi là những ví dụ về AI Agent. Những hệ thống này có đặc điểm chung là đều có khả năng nhận biết đầu vào từ người dùng bên ngoài và từ đó đưa ra phản ứng có ảnh hưởng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ ra rằng Transformer là kiến trúc kỹ thuật cấu thành mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGPT là AI Agent phát triển từ mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent chưa hình thành tiêu chuẩn phân loại thống nhất, chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2+Web3, dựa trên các nhãn nổi bật tương ứng với từng dự án, chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một gồm ba loại: cơ sở hạ tầng, tạo nội dung, và tương tác với người dùng, sau đó được chia nhỏ theo các trường hợp sử dụng thực tế:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung cơ bản trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành và ứng dụng cơ bản.
Công cụ phát triển: Cung cấp cho nhà phát triển các công cụ và khung hỗ trợ để xây dựng AI Agent.
Loại xử lý dữ liệu: Xử lý và phân tích dữ liệu ở định dạng khác nhau, chủ yếu dùng để hỗ trợ quyết định, cung cấp nguồn cho việc huấn luyện.
Lớp đào tạo mô hình: Cung cấp dịch vụ đào tạo mô hình cho AI, bao gồm suy luận, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B: Chủ yếu phục vụ người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, dịch vụ theo chiều dọc và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt ở chỗ có sự tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng, mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện sự tương tác hai chiều với người dùng.
Loại hình bạn đồng hành cảm xúc: Cung cấp hỗ trợ cảm xúc và bạn đồng hành AI.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp thông tin chính xác hơn cho Agent.
Nội dung tạo ra: Các dự án loại này tập trung vào việc tạo nội dung, sử dụng công nghệ mô hình lớn để tạo ra các hình thức nội dung khác nhau theo chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình hình phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, việc phát triển AI Agent trong Internet truyền thống Web2 đang thể hiện xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba số dự án tập trung vào các lĩnh vực cơ sở hạ tầng, trong đó chủ yếu là các dịch vụ B2B và các công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên các công nghệ và khung đã được kiểm nghiệm theo thời gian, từ đó giảm thiểu độ khó và rủi ro trong phát triển. Tương đương với "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy từ nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI trong thị trường doanh nghiệp cấp bách hơn nhiều, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, có lợi cho việc phát triển các dự án tiếp theo.
Giới hạn trong các trường hợp ứng dụng: Trong khi đó, chúng tôi nhận thấy rằng các AI sinh nội dung có ứng dụng tương đối hạn chế trong thị trường B2B. Do tính không ổn định trong sản phẩm đầu ra, các doanh nghiệp có xu hướng ưu tiên những ứng dụng có khả năng nâng cao năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của các AI sinh nội dung trong thư viện dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và những cân nhắc thực tế về các tình huống ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và sự làm rõ hơn về nhu cầu thị trường, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các loại hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án đầu ngành AI Agent Web2
Chúng tôi sẽ đi sâu vào việc khám phá một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, lấy ba dự án Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo ra, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng thực hiện cuộc đối thoại tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 là 277 triệu, nền tảng có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng có độ tuổi từ 18 đến 34, cho thấy đặc điểm nhóm người dùng trẻ tuổi. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, với định giá đạt 1 tỷ USD, do a16z dẫn đầu.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền để sử dụng mô hình ngôn ngữ lớn của công ty mẹ Google là Alphabet, điều này cho thấy Character AI đang áp dụng công nghệ tự phát triển. Đáng chú ý là, các nhà sáng lập của công ty Noam Shazeer và Daniel De Freitas đã từng tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Bằng cách trích dẫn và liên kết tham khảo, nó đảm bảo tính đáng tin cậy và độ chính xác của thông tin, đồng thời nó sẽ giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, lượt truy cập vào ứng dụng di động và máy tính để bàn của họ đã tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố đã huy động được 62,7 triệu USD, đạt giá trị ước tính 1,04 tỷ USD, do Daniel Gross dẫn dắt, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình này phù hợp cho nghiên cứu học thuật chuyên nghiệp và các lĩnh vực chuyên sâu.