Лідери думок

Революція штучного інтелекту – це революція даних: чому зберігання має значення більше ніж будь-коли

mm

Легкий доступ до даних та можливість використовувати їх у значимих способах завжди були важливими, але в епоху штучного інтелекту, машинного навчання та даних аналітики вони стали абсолютно необхідними. Глобальний ринок штучного інтелекту, який зараз оцінюється понад 390 мільярдів доларів, очікується перевищить 826 мільярдів доларів до 2030 року. Однак цей зростання залежить від того, що технологія штучного інтелекту продовжить розвиватися та збільшуватися в застосуванні. Досягнення цього вимагає величезних обсягів даних. Організації по всьому світу зберігають приблизно 7,2 зеттабайта (ЗБ) даних у 2024 році, і ця цифра очікується зросте до 15,1 ЗБ до 2027 року. Це велике зростання підкреслює необхідність надійних, доступних рішень для зберігання, які можуть обробляти зростаючі вимоги до даних.

Вибух штучного інтелекту в різних галузях – від фінансів та охорони здоров’я до виробництва та роздрібної торгівлі – ще більше прискорив попит на великі та добре підготовлені набори даних. Системи штучного інтелекту процвітають на даних, використовуючи їх для вдосконалення алгоритмів, покращення прогнозних моделей та оптимізації автоматизації. За даними провідних фірм, таких як IDC, чим більше високоякісних даних має організація, тим більше вона може покращити ефективність результатів штучного інтелекту, щоб забезпечити розумніші рішення та підвищити операційну ефективність. Однак виклик полягає не тільки в зборі та генерації великих обсягів даних, але й у забезпеченні їх довгострокового зберігання та доступності. Без належних рішень для зберігання бізнес ризикує втратити цінну інформацію, яка могла б сформувати наступну хвилю досягнень штучного інтелекту.

Важливість даних для штучного інтелекту

Для того, щоб штучний інтелект продовжував розвиватися за поточним темпом, йому необхідно постійно покращувати ефективність та точність. Єдиний спосіб досягти цього – постійно забезпечувати моделі штучного інтелекту високоякісними даними для навчання. Набори даних, використані для навчання великих мовних моделей (LLM), зростали за дивовижною швидкістю, подвоєнню розміру щороку з 2010 року. Наприклад, GPT-2 був навчений на наборі даних, який містив приблизно 3 мільярди слів, тоді як GPT-4, випущений лише чотири роки пізніше, був навчений на наборі даних, який містив приблизно 9,75 трильйонів слів.

Цей швидкий розвиток наборів даних для навчання штучного інтелекту представляє значний виклик: як ефективно зберігати великі обсяги високоякісних даних. Оскільки системи штучного інтелекту споживають величезні обсяги існуючих текстових даних, включаючи книги, статті та дослідження, організації ризикують вичерпати високоякісний людський матеріал. Це може змусити розробників штучного інтелекту покладатися на штучно створений контент для майбутнього навчання, що може привести до потенційних проблем, таких як зниження точності, зниження креативності та збільшення повторюваності. Для протидії цьому ризику організації повинні пріоритезувати збереження більшості даних, які вони генерують, оскільки вони можуть стати цінним ресурсом для навчання моделей штучного інтелекту в майбутньому. Ця необхідність стимулює попит на надійні, масштабовані та довгострокові рішення для зберігання.

Дані аналітики як конкурентна перевага: немає штучного інтелекту без інформаційної архівізації

Аналітика даних, керована штучним інтелектом, стала краєвидом сучасної бізнес-стратегії, надаючи організаціям можливість виявляти закономірності, передбачати тенденції та приймати швидші, розумніші рішення. Однак, хоча штучний інтелект перебуває в центрі уваги, легко забути про невидиму основу, на якій все побудовано: дані. Конкретніше, інфраструктуру, яка робить десятиліття даних доступними тоді, коли й там, де це потрібно – те, що ми зараз називаємо Інформаційним архівом (IA).

Інформаційний архів як глибокий резервуар організаційних знань, часто розміщений на ефективних, масштабованих рішеннях для зберігання, таких як стрічковий зберігання. Це місце, де зберігаються величезні обсяги структурованих та неструктурованих даних – не тільки для дотримання вимог законодавства, але й для підтримки потенційних інновацій, які можуть привести до конкурентних переваг. Коли настає час для навчання моделей штучного інтелекту, великі набори даних тимчасово витягуються з цього архіву в високопродуктивні системи. Як тільки навчання завершено, дані повертаються в інформаційний архів для довгострокового зберігання. Цей цикл доступу та збереження робить можливим безперервний розвиток штучного інтелекту.

Спроможність організації приймати високоефективні, даних-орієнтовані рішення не залежить тільки від останніх інструментів штучного інтелекту. Вона залежить від того, чи можна отримати доступ та зберегти правильну інформацію – з часом, в масштабі та без жертвування ефективністю витрат. Якщо все зроблено правильно, дані аналітики можуть персоналізувати досвід клієнтів, оптимізувати операції та швидко реагувати на зміну ринкових умов. Однак все це залежить від довгострокової стратегії даних, яка розглядає збір інформації не як проблему зберігання, а як стратегічний актив. Майбутнє належить організаціям, які розглядають свої історичні дані як живий ресурс – той, який продовжує зростати в цінності з кожним інсайтом, одержаним за допомогою штучного інтелекту.

Нові можливості для перевіреної технології

Рост даних, керованих штучним інтелектом, вводить нові вимоги до рішень для зберігання. Організації потребують системи, яка дозволяє довгострокове зберігання величезних наборів даних, забезпечуючи доступність, стійкість та безпеку. Крім того, з ростом кібератак – глобальні витрати на кіберзлочинність очікується досягнуть 10,5 трильйонів доларів на рік до 2025 року – безпека даних стала критичним фактором для будь-якого рішення для зберігання. Багато підприємств можуть інстинктивно шукати нові, недавно розроблені технології зберігання, щоб задовольнити ці вимоги. Однак через необхідність надійного зберігання зараз організації повинні розглянути існуючу технологію, яка вже довела свою надійність: стрічкове зберігання.

Десятиліттями багато встановлених організацій покладалися на стрічкове зберігання, навіть коли нові, хмарні компанії нехтували ним. Однак повернення штучного інтелекту, машинного навчання та передових даних аналітики створило нові випадки використання цієї перевіреної технології. Стрічкове зберігання пропонує потужну комбінацію масштабованості, гнучкості, ефективності витрат та безпеки, що робить його ідеальним рішенням для управління величезними роботами штучного інтелекту та машинного навчання. На відміну від багатьох інших рішень для зберігання, стрічка дуже стійка, оскільки вона не споживає енергію під час зберігання даних, що суттєво знижує її вуглецевий слід. Крім того, її автономна здатність забезпечує додатковий рівень захисту проти кіберзагроз, таких як атаки програм-вимагальників, оскільки дані, збережені на стрічці, є природно імунними до віддалених порушень.

Сучасні рішення для стрічкового зберігання еволюціонували, щоб задовольнити вимоги штучного інтелекту та даних аналітики. З останнім прогресом у високоефективній технології стрічкового зберігання підприємства можуть зберігати петабайти даних за частку вартості традиційних хмарних рішень. Крім того, довговічність стрічки – часто понад 30 років – забезпечує, що організації можуть зберегти цінні набори даних без ризику погіршення даних. Це робить її дуже привабливою опцією для підприємств, які шукають майбутнє своєму інфраструктурі даних, зберігаючи при цьому ефективність витрат.

Революція штучного інтелекту та даних

Тривajuча революція штучного інтелекту є фундаментально революцією даних. Організації, які не пріоритезують зберігання та доступність даних, ризикують відставати в світі, який усе більше керується даними. Більше даних означає більше можливостей для інновацій та конкурентної диференціації. Приймаючи масштабовані та безпечні рішення для зберігання, включаючи відновлену потенціал стрічкового зберігання, організації можуть забезпечити собі місце на чолі досягнень штучного інтелекту та даних-орієнтованого прийняття рішень. Коли підприємства продовжують орієнтуватися в складностях зростання, керованого штучним інтелектом, ті, які визнають важливість збереження даних та розумних рішень для зберігання, будуть тими, хто процвітає в майбутньому, орієнтованому на дані.

Карлос Сандоваль є менеджером пропозицій для світових продуктів стрічкової ленти LTO, розташованих на кампусі IBM Гвадалахара в Мексиці. Карлос є випускником університету Гвадалахари, Мексика, за спеціальністю електроніки та зв'язку, і має ступінь MBA в промисловому інженерії. Карлос вперше приєднався до IBM у 1995 році і працював в галузі інформаційних технологій та процесного інженерії субзборок жорстких дисків до 2008 року. У 2010 році він повернувся в IBM як менеджер проекту з розробки нових продуктів стрічкової ленти, і в останні роки він перейшов на посаду менеджера фізичних продуктів стрічкової ленти, де зараз він відповідає за світові продукти IBM LTO.