Лидеры мысли

Следующий прорыв в области искусственного интеллекта кроется в ваших резервных копиях

опубликованный 2 сентября, 2025

Доктор Ассаф Натанзон, Главный архитектор Eon

Представьте себе возможности страховой компании, способной за считанные секунды изолировать все претензии по ущербу, связанному с пожарами, на северо-западе Тихого океана за последнее десятилетие, или если бы отдел продаж мог собирать отзывы пользователей с определённым настроем для заблаговременного улучшения функций, не теряя потенциальных клиентов. Потенциальные положительные результаты использования ваших исторических данных для передачи данных ИИ безграничны, но только если резервное копирование перестанет быть таким уж сложным.

Годами компании всех отраслей, от страхования до индустрии развлечений, относились к своим старым данным как к пыльному страховому полису — тому, что хранишь вдали от цивилизации и надеешься, что не воспользуешься. Эти компании накопили и хранят горы данных, файлов и видео, которые практически не видны и не представляют никакой ценности, кроме как для резервного копирования или для соблюдения нормативных требований.

Так в чём же проблема, если эти данные так и остаются где-то в глубине цифрового шкафа? Ведь многие из них были отложены не просто так, верно?

Такое мышление «ну и что?» игнорирует реальность эпохи искусственного интеллекта, которая радикально изменила ожидания потребителей в отношении всевозможных услуг и опыта. В мире, где от компаний ждут действий на основе информации, получаемой с помощью искусственного интеллекта в режиме реального времени, и предоставления персонализированного, контекстно-обширного опыта, все эти «спящие» данные теперь являются одним из самых недооценённых стратегических активов предприятия.

Резервное копирование осталось в прошлом

В современном мире, где все быстрее развивается облачная технология, резервное копирование слишком часто рассматривается как статический страховой полис — нечто такое, что компании могут настроить, забыть и надеяться никогда не трогать.

Реальность гораздо сложнее и обходится гораздо дороже.

Первая проблема — это отсутствие видимости. Во фрагментированных экосистемах резервного копирования разрастание ресурсов, теневые ИТ-ресурсы и неправильно настроенные теги затрудняют подтверждение того, что именно защищено, или обнаружение того, что не защищено. Облачные инструменты резервного копирования усугубляют проблему, поскольку, несмотря на простоту подключения, им часто не хватает критически важных функций, таких как полноценный поиск и восстановление отдельных элементов. Сторонние инструменты пытаются заполнить эти пробелы, но сами по себе добавляют сложности, требуя развертывания агентов и дополнительных машин в среде клиента, сложной настройки политик резервного копирования и скрытых моделей ценообразования, когда компании платят не только за лицензии, но и за каждую единицу сохранённых или переданных данных.

Когда данные необходимы – для обеспечения соответствия требованиям, юридических или операционных нужд – процессы восстановления, предлагаемые этими традиционными моделями, оказываются неэффективны. Большинство инструментов требуют полного восстановления из моментальных снимков, что приводит к полному восстановлению экземпляра, даже если требуется лишь небольшой фрагмент данных. Другими словами, командам приходится восстанавливать всю базу данных, когда для них важна только таблица или даже одна строка. В результате возникают огромные временные, вычислительные и финансовые затраты. Системы резервного копирования большинства компаний не обладают возможностями детального восстановления, чтобы обойти этот избыточный и неэффективный процесс.

Требования соответствия выявляют ещё одну болевую точку. Немногие команды могут доказать успешность резервного копирования в режиме реального времени во время аудита или продемонстрировать, что политики хранения конфиденциальных данных, шифрование и контроль доступа применялись должным образом. В динамичном многооблачном мире это может привести в лучшем случае к повсеместному хранению и значительному раздуванию хранилища, а в худшем — к пробелам, из-за которых конфиденциальные данные остаются непроверенными и незащищёнными.

Организации, которые обращаются с резервными копиями так же, как раньше обращались с пассивными архивами, такими как LTO или Glacier, сталкиваются с растущим разрывом между скоростью облачного копирования и готовностью к резервному копированию. Без автоматического обнаружения и классификации данные могут ускользнуть даже в высокодинамичных средах. Резервные копии остаются неполными или непоследовательными, а расходы на тушение возникающих пожаров продолжают стремительно расти.

От резервного копирования до озер данных: выход на новый уровень возможностей ИИ

Простая «модернизация» хранилищ не откроет новую эру в стратегии управления данными. Вместо этого предприятиям необходимо преобразовать свои резервные копии в полностью доступные для поиска и аналитики данные. данные озер – не только для удовлетворения требований соответствия и восстановления, но и для подачи обширных высококачественных наборов данных, необходимых современным моделям ИИ для обучения и эффективной работы в больших масштабах.

В модели озера данных резервные копии не существуют как статические снимки. Они становятся динамическими репозиториями, дополненными контекстными метаданными, индексированными для детального поиска и подключенными к аналитическим инструментам. Вместо того, чтобы просто выполнять требования по аварийному восстановлению и соблюдению нормативных требований, они активно способствуют бизнес-аналитике, разработке инновационных продуктов и взаимодействию с клиентами.

Ключевые факторы, способствующие этому сдвигу:

Автоматизированное контекстное извлечение данных: Благодаря тегированию на основе искусственного интеллекта и обработке естественного языка исторические записи, документы, изображения и видео можно аннотировать с помощью подробных, доступных для поиска дескрипторов.
Возможности детального восстановления: Вместо того чтобы помещать в карантин целый набор данных, компании могут буквально за считанные секунды извлечь отдельные файлы, транзакции, таблицы или медиаклипы, не нарушая при этом работу более крупных наборов данных.
Простая интеграция в аналитические конвейеры: Как только резервные копии станут доступными для поиска и запросов, их можно будет напрямую использовать в наборах данных для обучения ИИ, панелях управления в режиме реального времени и рабочих процессах анализа тенденций.

Это влияние преобразует. Например, банк может обучить алгоритмы обнаружения мошенничества на основе данных о транзакциях, хранящихся в статике на протяжении десятилетия, выявляя аномалии, невидимые в меньших выборках. Медицинский работник может аналогичным образом извлечь все истории болезни пациентов, соответствующие определённому генетическому маркеру, для проведения исследований, а развлекательная компания может использовать исторические данные о настроениях аудитории для управления производством контента.

То, что когда-то было «мертвыми данными», становится постоянно растущим стратегическим активом. Резервное копирование из центра затрат превращается в конкурентное преимущество, стимулируя инновации в различных отраслях.

Добыча «мертвых данных» для бизнес-потенциала

К счастью, ситуация меняется. Современные системы хранения данных уже могут включать объектно-ориентированное и тематическое хранение, автоматическое индексирование и извлечение контекстных метаданных, что делает архивы мгновенно доступными для поиска и готовыми к использованию в бизнесе.

Например, Google Cloud сотрудничает с крупными производителями и автомобильными компаниями, такими как Ford и Kyocera, над объединением исторически разрозненных активов, обработкой и стандартизацией данных, а также улучшением прозрачности данных от заводского цеха до облака. Финансовые учреждения, которые накапливаются петабайты данных о транзакциях и взаимодействии с клиентами стремятся получить доступ к этой золотой жиле для обучения моделей искусственного интеллекта, ориентированных на финансовую сферу, что подчеркивает, насколько ценными стали глубокие исторические данные.

Даже в сфере медиа и развлечений эти сценарии использования обладают поразительным потенциалом. Взять, к примеру, Netflix, чьи расходы на оригинальный и лицензионный контент, как ожидается, достигнут рекордных значений. 18 миллиардов долларов в этом годуДругими словами, Netflix восседает на Эвересте из резервных копий данных, медиафайлов, метаданных, информации о видеотегах и многого другого, и всё это должно быть подвергнуто регулированию с учётом множества региональных норм соответствия, многочисленных стандартов доступности и множества различных облачных провайдеров. Оцифровка такого ошеломляющего объёма контента в одном снимке для восстановления резервной копии просто невозможна. А теперь представьте, насколько проще было бы проанализировать данные с помощью возможностей детального восстановления и мгновенного поиска.

Именно это и позволяет сделать переход к озерам данных.

Доказательство кроется в результатах: при использовании правильных инструментов и правильного стратегического мышления резервное хранилище становится креативным инструментом создания добавленной стоимости, а не просто страховым полисом.

Лучшее резервное копирование означает лучшие бизнес-результаты

Современные предприятия определяются данными и скоростью. Устаревшие системы резервного копирования сдерживают работу команд по обоим направлениям.

Резервные копии не следует рассматривать как хранилища или как механизм выживания в худшем случае. Напротив, они должны стать двигателями роста, креативности и конкурентного преимущества, и новые технологические решения готовы обеспечить этот переход. Компании, которые модернизируют свою архитектуру резервного копирования сегодня, станут движущей силой завтрашних прорывов в финансах, здравоохранении, СМИ и других областях.

Доктор Ассаф Натанзон, главный архитектор Eon

Ассаф Натанзон — вице-президент и главный архитектор вечность, продвигая инновации в области хранения данных, управления данными и киберустойчивых архитектур. Ранее он занимал должности технического вице-президента и главного архитектора в Huawei Storage, где создал OceanProtect, многомиллиардную платформу вторичного хранения данных, а также должность технического директора подразделения защиты данных Dell/EMC, курируя портфель продуктов стоимостью 3.5 млрд долларов. Будучи пионером в области репликации, дедупликации, сжатия и технологий RAID, Ассаф является обладателем более 550 патентов США (более 250 из которых находятся на рассмотрении), что делает его одним из самых плодовитых изобретателей в области корпоративных систем хранения данных. Он имеет докторскую степень по информатике, полученную в Университете Бен-Гуриона, и специализируется на восстановлении данных после сбоев.

Unite.ИИ

Следующий прорыв в области искусственного интеллекта кроется в ваших резервных копиях

Резервное копирование осталось в прошлом

От резервного копирования до озер данных: выход на новый уровень возможностей ИИ

Добыча «мертвых данных» для бизнес-потенциала

Лучшее резервное копирование означает лучшие бизнес-результаты

Вам может понравиться