Лидеры мнений
Индивидуальные LLM для каждого бизнеса? DeepSeek показывает нам путь

Однажды, в мире технологий был призыв «мобильные телефоны для всех» – и действительно, мобильная связь революционизировала бизнес (и мир). Сегодня эквивалент этого призыва – дать всем доступ к приложениям ИИ. Но真正ая сила ИИ заключается в его использовании для конкретных потребностей бизнеса и организаций. Путь, проложенный китайским стартапом DeepSeek, демонстрирует, как ИИ может быть использован всеми, особенно теми, у кого ограниченный бюджет, для удовлетворения их конкретных потребностей. Действительно, появление более дешевых решений ИИ обещает изменить глубоко укоренившуюся тенденцию, когда решения ИИ часто остаются недоступными для многих малых бизнесов и организаций из-за требований к бюджету.
LLM – это – или были – дорогой проект, требующий доступа к огромным объемам данных, большому количеству мощных компьютеров для обработки данных и времени и ресурсов, инвестированных в обучение модели. Но эти правила меняются. Работая на скромном бюджете, DeepSeek разработал свою собственную LLM и приложение типа ChatGPT для запросов – с гораздо меньшими инвестициями, чем те, которые были необходимы для аналогичных систем, построенных американскими и европейскими компаниями. Подход DeepSeek открывает окно в разработку LLM для более мелких организаций, которые не имеют миллиардов для траты. На самом деле, день, когда большинство малых организаций смогут разработать свои собственные LLM для удовлетворения своих конкретных целей, может быть не за горами, обычно предоставляя более эффективное решение, чем общие LLM, такие как ChatGPT.
Хотя дебаты остаются о истинной стоимости DeepSeek, это не просто стоимость, которая отличает его и подобные модели: это тот факт, что он полагался на менее продвинутые чипы и более сосредоточенный подход к обучению. Как китайская компания, подверженная американским экспортным ограничениям, DeepSeek не смогла получить доступ к продвинутым чипам Nvidia, которые обычно используются для тяжелых вычислений, необходимых для разработки LLM, и была вынуждена использовать менее мощные чипы Nvidia H-800, которые не могут обрабатывать данные так быстро или эффективно.
Чтобы компенсировать отсутствие мощности, DeepSeek использовал другой, более сосредоточенный и прямой подход к разработке LLM. Вместо того, чтобы бросать горы данных на модель и полагаться на вычислительную силу для маркировки и применения данных, DeepSeek сузил обучение, используя небольшое количество высококачественных “холодных” данных и применение IRL (итеративное обучение с подкреплением, с алгоритмом, применяющим данные к различным сценариям и обучающимся на них). Этот сосредоточенный подход позволяет модели учиться быстрее, с меньшим количеством ошибок и меньшим количеством потраченной вычислительной мощности.
Аналогично тому, как родители могут направлять конкретные движения ребенка, помогая ему успешно перевернуться за первый раз – а не оставляя ребенка разобраться самостоятельно, или преподавая ребенку более широкий спектр движений, который мог бы помочь ему перевернуться – ученые, обучающие эти более сосредоточенные модели ИИ, фокусируются на том, что наиболее необходимо для определенных задач и результатов. Такие модели, вероятно, не имеют столь широкого применения, как более крупные LLM, такие как ChatGPT, но они могут быть надежными для конкретных приложений и выполнять их с точностью и эффективностью. Даже критики DeepSeek признают, что его упрощенный подход к разработке значительно повысил эффективность, позволяя ему делать больше с гораздо меньшими затратами.
Этот подход заключается в том, чтобы дать ИИ лучшие входные данные, чтобы он мог достичь своих вех наиболее умным и эффективным способом, и может быть ценен для любой организации, которая хочет разработать LLM для своих конкретных потребностей и задач. Такой подход становится все более ценным для малого бизнеса и организаций. Первый шаг – начать с правильных данных. Например, компания, которая хочет использовать ИИ, чтобы помочь своим командам продаж и маркетинга, должна обучить свою модель на тщательно отобранном наборе данных, который фокусируется на разговорах о продажах, стратегиях и метриках. Это не позволяет модели тратить время и вычислительную мощность на нерелевантную информацию. Кроме того, обучение должно быть структурировано поэтапно, гарантируя, что модель освоит каждую задачу или понятие, прежде чем перейти к следующему.
Это также имеет параллели с воспитанием ребенка, как я сама узнала, став матерью несколько месяцев назад. В обоих случаях руководящий, пошаговый подход избегает расточительства ресурсов и снижает трение. Наконец, такой подход как с человеческими детьми, так и с моделями ИИ приводит к итеративному улучшению. Когда ребенок растет, или модель учится больше, ее способности улучшаются. Это означает, что модели можно усовершенствовать и улучшить, чтобы лучше справляться с реальными ситуациями.
Этот подход сохраняет затраты на низком уровне, не позволяя проектам ИИ стать истощением ресурсов, делая их более доступными для более мелких команд и организаций. Он также приводит к лучшей производительности моделей ИИ быстрее; и, поскольку модели не перегружены ненужными данными, они также могут быть скорректированы, чтобы адаптироваться к новой информации и меняющимся бизнес-потребностям – ключевым в конкурентных рынках.
Приход DeepSeek и мира более дешевого, более эффективного ИИ – хотя он первоначально вызвал панику в мире ИИ и на фондовых рынках – в целом является положительным развитием для сектора ИИ. Более высокая эффективность и более низкие затраты на ИИ, по крайней мере для определенных сосредоточенных приложений, в конечном итоге приведут к более широкому использованию ИИ в целом, что стимулирует рост для всех, от разработчиков до производителей чипов и до конечных пользователей. На самом деле, DeepSeek иллюстрирует парадокс Джевонса – где более высокая эффективность, скорее всего, приведет к более широкому использованию ресурса, а не к его сокращению. Поскольку эта тенденция, кажется, продолжится, малый бизнес, который фокусируется на использовании ИИ для удовлетворения своих конкретных потребностей, также будет лучше подготовлен к росту и успеху.












