大型モデルが携帯電話に「スリム化」、次期iPhoneは登場?

「エンドツーサイドの大型モデル」の波が到来している。ファーウェイやクアルコムなどのチップ大手は、携帯電話が新世代の種の進化を実現できるように、デバイス側に大規模なAIモデルを組み込むことを検討している。

クラウド サーバーに依存してサービスを提供する ChatGPT や Midjourney などの AI アプリケーションと比較して、エンドサイドの大規模モデルはインテリジェンスをローカルで実現することに焦点を当てています。その利点は、プライバシーをより適切に保護できると同時に、学習を通じて携帯電話がユーザーのパーソナルスマートアシスタントになることができ、クラウドサーバーのダウンタイムなどを心配する必要がないことです。

しかし、現状の技術条件では、携帯電話の性能は大型機種の運用をサポートするには程遠い。業界における主流の技術的解決策は、枝刈り、量子化、蒸留によって大規模なモデルを「スリム化」し、精度の低下を最小限に抑えることを前提として、必要なリソースとエネルギーの消費を削減することです。

クアルコムはエンドサイドの大型モデル向けチップの開発を開始した。これは、AIモデルを搭載したモバイル端末が私たちのところにやってくることを示しています。

携帯電話メーカーが大型モデルを携帯端末に先導

AIの大型モデルがクラウドからスマート端末へと押し寄せている。

8月4日、2023 Huawei Developer Conferenceで、HuaweiはHarmonyOS 4をリリースしました。前世代のオペレーティングシステムと比較して、その最も重要な変更点は、AIの大規模モデル機能をシステムの最下層に組み込んだことです。ファーウェイはAIモデルが「スマート端末側」に移行する序曲を切り開いている。

現在、ChatGPTやMidjourneyなどのAIアプリケーションが提供するサービスは、基本的にクラウドサーバー上で完結します。 ChatGPT を例にとると、大規模なモデルとその背後にあるコンピューティング リソースはリモート サーバーに保存されており、ユーザーはリアルタイムでサーバーと対話し、入力されたテキストはサーバーによって処理されて応答が得られます。この利点は、サーバーには通常強力なコンピューティング リソースが装備されており、高負荷に対応するためにいつでも拡張できるため、モデルの効率的かつ安定した動作を保証できることです。

ここで、新しいサポート ロジックが登場しました。ファーウェイは端末に大型モデルを導入しようとしているため、上記の作業はすべてローカルで実行できることになるが、携帯電話システム自体には一定のAI機能が備わっており、インテリジェントなアップグレードを実現するためにAIクラウドサービスにアクセスする必要はない。

ファーウェイのエグゼクティブディレクター兼ターミナルBGのCEOであるYu Chengdong氏は、HarmonyOS 4がファーウェイのPanguモデルによってサポートされており、スマートターミナルのインタラクション、高レベルの生産性効率、パーソナライズされたサービスという全く新しいAIエクスペリエンス革命をユーザーにもたらすことを期待していると紹介した。 。

HarmonyOS 4 は AI メガモデルを導入

HarmonyOS 4のAI機能は現在主にファーウェイのスマートアシスタント「Xiaoyi」によって具現化されている。大型モデルが接続された後、Xiaoyi は音声対話に基づいてテキスト、画像、文書などのさまざまな形式の入力を拡張し、自然言語理解能力が向上します。また、Xiaoyi は、指示に従って、写真からテキストを自動的に抽出したり、さまざまな種類の商用電子メールのコンテンツを生成したり、画像を生成したりするなど、さまざまなサービスやシナリオに接続することができます。

さらに重要な変化は、Xiaoyi には記憶と学習の能力が備わっており、使い続けるうちにますます「マスター」を意識し、旅行やアクティビティの計画などの計画をインテリジェントに提示し、それを実現できるようになります。ユーザーの習慣に応じて、パーソナライズされた推奨事項を提供します。ファーウェイは、Xiaoyi のこれらの新機能が 8 月下旬に公開テスト体験を開始することを明らかにしました。

ファーウェイは、AIモデルを携帯電話システムの最下層に組み込むことで、携帯電話全体のインテリジェンスを向上させたいと考えている。 Xiaoyi の上記の機能は「高度」ではありませんが、それらを実現するには、ユーザーは多くの場合、ChatGPT、Midjourney、およびその他の多くのアプリケーションを同時に呼び出して完了する必要があります。携帯電話自体に AI 機能が搭載されると、より多用途なアシスタントのようなものになり、包括的なサービスを提供します。

HarmonyOS 4のリリース前に、ファーウェイは実際にAI大型モデルをモバイル端末に接続しようと試みた。ファーウェイは今年3月に携帯電話「P60」を発売し、内蔵のスマート画像検索機能はマルチモーダル大型モデル技術に基づいており、携帯電話側のモデルを小型化することで、携帯電話上での自然言語モデルの動作を実現した。側面が実現します。

ファーウェイは、AIモデルをデバイスに導入した最初の企業ではない。 2023年の世界人工知能会議で、クアルコムは、第2世代Snapdragon 8を搭載した携帯電話上で生成AIモデル「安定拡散」を実行し、20ステップの推論を実行する、エンドサイドに入る大規模モデルの運用実践をデモンストレーションしました。 15 秒以内に 512x512 ピクセルの画像が生成され、画像効果はクラウド処理レベルと大きく変わりません。

上海MWC 2023期間中、Honorの最高経営責任者(CEO)Zhao Ming氏は、Honorはマルチモーダルで自然なインタラクション、正確な意図認識、複雑なタスク向けの閉ループサービスを実現するために、スマートフォン側でのエンドサイド大規模モデルの展開を推進するとも述べた。

同じく注目を集めているのはAppleで、1カ月前には自社開発のAjaxフレームワークをベースにした人工知能ツール「Apple GPT」を秘密裏に開発していることが明らかになった。具体的な詳細はまだ明らかにされていないが、業界では一般に、Appleが音声アシスタントSiriの知能を向上させるためにシステムレベルで大規模なモデルを追加し、Siriが「帽子を脱げる」ようにする可能性が高いと推測されている。人工的な精神遅滞」。

誇大宣伝か、それとも新たな革命か?

携帯電話メーカーが大型モデルに注力するのは珍しいことではありませんが、なぜ彼らは「デバイス・トゥ・サイド」路線をとるのでしょうか。結局のところ、Huawei Xiaoyiのインタラクションと生成機能はクラウドサーバーを通じて提供することもでき、コストはより経済的であり、テクノロジーの実装が容易であるようです。

それは誇大広告なのでしょうか、それともAIの大型モデルをスマートモバイル端末に搭載することが本当に必要なのでしょうか?この問題に関して、Yu Chengdong 氏と Zhao Ming 氏は、プライバシー セキュリティとパーソナライゼーションという 2 つのキーワードについて言及しました。

Yu Chengdong氏は、ファーウェイがすべてのAIエクスペリエンスの革新とシーンデザインの第一原則はセキュリティとプライバシー保護であり、より責任あるAIを作成することであると主張し、AIによって生成されたコンテンツがマークされることを約束していると強調した。

クラウドでデータを処理する場合と比較して、スマート端末側の最も明白な利点はプライバシーとセキュリティです。これまで、ChatGPT は繰り返しデータ漏洩の嵐に巻き込まれてきました。サムスンは今年3月、半導体従業員がChatGPTを利用して企業機密を漏洩した疑いがあるとして、社内でのChatGPTの使用禁止命令を出し、個人のプライバシーデータを使用・漏洩した場合の賠償額は同額に上る30億米ドルとして。

データ処理がエンド側で行われる場合、ユーザーの個人データはクラウドサーバーにアップロードされないため、プライバシー漏洩のリスクが大幅に軽減されます。これは、プライバシーが保証されている場合に限り、携帯電話の AI アシスタントが真にライフ スチュワードになるための前提条件も提供し、ユーザーは学習のために AI に安心してデータを渡すことができます。

Zhao Ming 氏の理解によれば、エンドサイド AI モデルの使命はユーザーをより深く理解することであり、「自分が何時に寝るか、何が食べたいかを知ることで当面のニーズを解決できます。これは洞察を得る能力を持つことと同等です」 「これを行うには、ユーザーの個人データと習慣に基づいて AI をトレーニングする必要があります。最終的には、スマートフォンが、ユーザーのケータリングや予約を支援できる万能アシスタント、またはパーソナル ロボット秘書になることが期待されています」 、コンサルティング、エンターテイメント、オフィス、その他のマルチシナリオの要件。

これに対し、ChatGPT をはじめとする主流の AI アプリケーションは標準化された製品であり、そのままパーソナルアシスタントとしての機能を持たせることは難しく、ユーザーを理解せず、ユーザーの入力指示に応答するだけです。個人の携帯電話はすでに私用の個人用スマートデバイスであり、人間の言語を理解するAIモデルが携帯電話上で動作するようになれば、知能の度合いは間違いなく大幅に向上します。

さらに、クラウドに依存するアプリケーションも不安定です。たとえば、ネットワークやサーバーの理由により、クラウドの応答速度が遅くなったり、完全にクラッシュしたりすることがあります。これは ChatGPT で何度も発生しており、ローカライズされた大規模な「クラウドラグ」を避けるため、クラウドに依存します。

上記の特徴を踏まえると、大型モデルの「デバイス・トゥ・サイド革命」の可能性が示されており、長年開発のボトルネックとなっていた携帯電話も、同様に新たなエキサイティングな種の進化を遂げることが期待されています。大画面スマートフォンの登場とiPhoneの発売。

しかし、大型モデルが携帯電話でその強みを発揮するには明らかな問題があります。それは、携帯電話のチップがそれに耐えられるかどうかです。大規模なモデルには数百億または数千億のパラメータが含まれることが多く、天文学的なレベルのトレーニングが必要であり、膨大な計算能力を消費するため、既存の携帯電話チップのパフォーマンスでは明らかに要件を満たすことができません。

この点に関して、現在業界で主流となっている解決策は「モデルの小型化」です。

簡単に言うと、モデルのネットワーク構造を決定する際に、精度をできるだけ落とさないことを前提にモデルを「スリム化」し、必要なリソースとエネルギーの消費を削減します。このプロセスには通常 3 つのステップがあり、精度に非常に小さな影響を与えるモデル内のパラメーターを削除する (「枝刈り」と呼ばれます)、低精度のデータ型を推論に使用する (専門用語で「量子化」と呼ばれます)、および複雑なモデル 、似ているがより単純なモデルを抽出するため、これは明確に「蒸留」と呼ばれます。最終的な目標は、モデルのサイズを縮小することです。

一方で、クアルコムなどのチップメーカーも、AI大型モデルのエンドサイド向けに専用チップの導入・開発を進めている。以前、クアルコムの5GモバイルプラットフォームSnapdragon 8 Gen2は、AI固有のHexagonプロセッサを初めて統合し、独立した専用電源システムを使用し、マイクロスライス推論、INT4精度、Transformerネットワークアクセラレーションなどをサポートしながら、より高いパフォーマンスを提供しました。エネルギー消費とメモリ使用量を削減します。

エンドサイドの大型モデルは、新世代のスマート端末革命を引き起こします。 IDC は、2026 年までに中国市場の端末機器プロセッサのほぼ 50% が AI エンジン テクノロジーを搭載すると予測しています。 AIが人間のテクノロジー生活にもたらすまた大きな変化が現れるかもしれない。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)