Новая бизнес-модель за битвой за вычислительную мощность
Восторг вокруг "алхимии" больших моделей пройдет, но вычислительная мощность становится новой бизнес-моделью. Провайдеры вычислительной мощности должны заранее подготовиться и вовремя переключиться.
В последнее время исследователи использовали 40-летние данные о погоде и 200 графических процессоров (GPU) для предварительного обучения, и за примерно 2 месяца они обучили метеорологическую модель с количеством параметров в сотни миллионов. При расчете стоимости одной GPU в 7,8 юаня/час, стоимость обучения этой модели может превысить 2 миллиона юаней. Если же речь идет о тренировке универсальной модели, стоимость может увеличиться в сотни раз.
В настоящее время в Китае существует более 100 крупных моделей с масштабом 1 миллиард параметров. Однако в условиях стремительного роста числа крупных моделей в отрасли, проблема нехватки высококачественных GPU становится все более актуальной. Высокие затраты на вычислительную мощность, нехватка вычислительной мощности и финансирования стали самыми очевидными проблемами, стоящими перед отраслью.
Недостаток высококачественных GPU является нерешаемой проблемой для всей отрасли. В период пика цена одной A100 достигала 200-300 тыс. юаней, а арендная плата за сервер A100 на месяц возросла до 50-70 тыс. юаней/мес. Несмотря на это, высокая цена все еще может не гарантировать получение чипов.
Конкуренция на рынке крупных моделей жесткая, без вложений в десятки миллиардов долларов трудно продолжать разработку крупных моделей. Некоторые предприниматели заявляют, что без поддержки в сотни миллиардов долларов этот путь будет трудным. По мере того как рынок переходит от восторга к рациональности, компании также будут контролировать затраты и корректировать стратегии в соответствии с изменениями ожиданий.
面对 вычислительная мощность 短缺,企业采取了多种应对措施:
Используйте более качественные данные для повышения эффективности обучения
Повышение возможностей инфраструктуры для стабильной работы выше 1000 калорий.
Оптимизация распределения ресурсов вычислительной мощности
Переход от облачной вычислительной архитектуры к архитектуре суперкомпьютеров
Используйте отечественные платформы вместо GPU от NVIDIA
Каждый из этих методов является относительно крупным проектом, и обычным компаниям трудно удовлетворить потребности через собственные дата-центры. Многие команды алгоритмов выбирают профессиональных поставщиков вычислительной мощности для получения поддержки.
Вычислительная мощность уже стала новой моделью услуг. Услуга вычислительной мощности основана на разнообразной вычислительной мощности, связанной с сетью вычислительной мощности, с целью обеспечения эффективной вычислительной мощности. Она включает не только вычислительную мощность, но и единое упаковывание таких ресурсов, как хранилище, сеть и т. д., в виде услуги (, выполняющей доставку вычислительной мощности, как API ).
С точки зрения структуры цепочки поставок, upstream-компании в основном предоставляют вычислительную мощность, midstream-компании отвечают за производство и поставку вычислительной мощности, а downstream-компании являются пользователями вычислительной мощности. В настоящее время основными моделями оплаты являются расчет по объему и годовая/месячная подписка.
С ростом потребности в высокопроизводительных вычислениях больших моделей, услуги вычислительной мощности, возникшие на основе облачных сервисов, быстро вошли в массовое сознание, сформировав уникальную индустриальную цепочку и бизнес-модель. В начальный период взрыва индустрии вычислительной мощности наблюдался дефицит высококачественных GPU, высокие затраты на вычислительную мощность и борьба за "чипы" стали уникальным феноменом этой эпохи.
В долгосрочной перспективе переход вычислительной мощности в качестве услуги является определенной тенденцией. Провайдеры вычислительной мощности должны быть готовы к тому, чтобы своевременно корректировать стратегии, когда большие модели вернутся к рациональности, а рыночные направления быстро изменятся.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
5
Поделиться
комментарий
0/400
StakeOrRegret
· 07-14 02:28
Деньги не пришли, нечего говорить.
Посмотреть ОригиналОтветить0
ParanoiaKing
· 07-14 02:27
Не хватает карт, с ума схожу. Когда будет повторение катастрофы майнинга?
Битва за вычислительную мощность в эпоху больших моделей: как провайдеры услуг могут адаптироваться к новым бизнес-моделям
Новая бизнес-модель за битвой за вычислительную мощность
Восторг вокруг "алхимии" больших моделей пройдет, но вычислительная мощность становится новой бизнес-моделью. Провайдеры вычислительной мощности должны заранее подготовиться и вовремя переключиться.
В последнее время исследователи использовали 40-летние данные о погоде и 200 графических процессоров (GPU) для предварительного обучения, и за примерно 2 месяца они обучили метеорологическую модель с количеством параметров в сотни миллионов. При расчете стоимости одной GPU в 7,8 юаня/час, стоимость обучения этой модели может превысить 2 миллиона юаней. Если же речь идет о тренировке универсальной модели, стоимость может увеличиться в сотни раз.
В настоящее время в Китае существует более 100 крупных моделей с масштабом 1 миллиард параметров. Однако в условиях стремительного роста числа крупных моделей в отрасли, проблема нехватки высококачественных GPU становится все более актуальной. Высокие затраты на вычислительную мощность, нехватка вычислительной мощности и финансирования стали самыми очевидными проблемами, стоящими перед отраслью.
Недостаток высококачественных GPU является нерешаемой проблемой для всей отрасли. В период пика цена одной A100 достигала 200-300 тыс. юаней, а арендная плата за сервер A100 на месяц возросла до 50-70 тыс. юаней/мес. Несмотря на это, высокая цена все еще может не гарантировать получение чипов.
Конкуренция на рынке крупных моделей жесткая, без вложений в десятки миллиардов долларов трудно продолжать разработку крупных моделей. Некоторые предприниматели заявляют, что без поддержки в сотни миллиардов долларов этот путь будет трудным. По мере того как рынок переходит от восторга к рациональности, компании также будут контролировать затраты и корректировать стратегии в соответствии с изменениями ожиданий.
面对 вычислительная мощность 短缺,企业采取了多种应对措施:
Каждый из этих методов является относительно крупным проектом, и обычным компаниям трудно удовлетворить потребности через собственные дата-центры. Многие команды алгоритмов выбирают профессиональных поставщиков вычислительной мощности для получения поддержки.
Вычислительная мощность уже стала новой моделью услуг. Услуга вычислительной мощности основана на разнообразной вычислительной мощности, связанной с сетью вычислительной мощности, с целью обеспечения эффективной вычислительной мощности. Она включает не только вычислительную мощность, но и единое упаковывание таких ресурсов, как хранилище, сеть и т. д., в виде услуги (, выполняющей доставку вычислительной мощности, как API ).
С точки зрения структуры цепочки поставок, upstream-компании в основном предоставляют вычислительную мощность, midstream-компании отвечают за производство и поставку вычислительной мощности, а downstream-компании являются пользователями вычислительной мощности. В настоящее время основными моделями оплаты являются расчет по объему и годовая/месячная подписка.
С ростом потребности в высокопроизводительных вычислениях больших моделей, услуги вычислительной мощности, возникшие на основе облачных сервисов, быстро вошли в массовое сознание, сформировав уникальную индустриальную цепочку и бизнес-модель. В начальный период взрыва индустрии вычислительной мощности наблюдался дефицит высококачественных GPU, высокие затраты на вычислительную мощность и борьба за "чипы" стали уникальным феноменом этой эпохи.
В долгосрочной перспективе переход вычислительной мощности в качестве услуги является определенной тенденцией. Провайдеры вычислительной мощности должны быть готовы к тому, чтобы своевременно корректировать стратегии, когда большие модели вернутся к рациональности, а рыночные направления быстро изменятся.