Suivez nous sur

La rĂ©volution de l'IA est une rĂ©volution des donnĂ©es : pourquoi le stockage est plus important que jamais

Des leaders d'opinion

La rĂ©volution de l'IA est une rĂ©volution des donnĂ©es : pourquoi le stockage est plus important que jamais

mm

L'accès facile aux donnĂ©es et la capacitĂ© Ă  les exploiter efficacement ont toujours Ă©tĂ© importants, mais Ă  l'ère de l'IA, de l'apprentissage automatique et de l'analyse de donnĂ©es, c'est devenu absolument essentiel. Le marchĂ© mondial de l'IA, actuellement Ă©valuĂ© Ă  plus de 390 milliards de dollars, devrait dĂ©passer 826 milliards de dollars par 2030. Cependant, cette croissance dĂ©pend de l'Ă©volution continue de la technologie de l'IA et de sa valeur ajoutĂ©e. Pour y parvenir, il faut disposer de vastes quantitĂ©s de donnĂ©es. Les organisations du monde entier ont stockĂ© environ 7.2 zettaoctets (Zo) de donnĂ©es en 2024, et ce chiffre devrait atteindre 15.1 Zo d'ici 2027Cette croissance majeure souligne le besoin de solutions de stockage fiables et accessibles, capables de gĂ©rer les demandes croissantes de donnĂ©es.

L'explosion des applications basées sur l'IA dans tous les secteurs, de la finance et de la santé à l'industrie manufacturière et au commerce de détail, a encore accéléré la demande de vastes ensembles de données bien préparés. Les systèmes d'IA s'appuient sur les données pour affiner les algorithmes, améliorer les modèles prédictifs et optimiser l'automatisation. Selon des entreprises de premier plan comme IDC, plus des données de haute qualité Plus une organisation possède de données, plus elle peut améliorer l'efficacité des résultats de l'IA pour permettre une prise de décision plus éclairée et optimiser l'efficacité opérationnelle. Cependant, le défi ne réside pas seulement dans la collecte et la génération de volumes massifs de données, mais aussi dans leur conservation et leur accessibilité à long terme. Sans solutions de stockage adaptées, les entreprises risquent de perdre des informations précieuses qui pourraient façonner la prochaine vague de progrès de l'IA.

L'importance des données pour l'IA

Pour que l'IA continue de progresser à son rythme actuel, elle doit constamment améliorer son efficacité et sa précision. Le seul moyen d'y parvenir est de fournir aux modèles d'IA des données continues et de haute qualité pour leur entraînement. Les ensembles de données utilisés pour entraîner les grands modèles linguistiques (LLM) ont connu une croissance fulgurante. triple de taille chaque année depuis 2010Par exemple, GPT-2 a été formé sur un ensemble de données contenant environ 3 milliards de mots, tandis que GPT-4, publié seulement quatre ans plus tard, a été formé sur environ 9.75 billions de mots.

Cette expansion rapide des jeux de donnĂ©es d'entraĂ®nement de l'IA pose un dĂ©fi majeur : comment stocker de manière rentable de grandes quantitĂ©s de donnĂ©es de haute qualitĂ© ? Les systèmes d'IA consommant d'importantes quantitĂ©s de donnĂ©es textuelles existantes, notamment des livres, des articles et des rapports de recherche, les organisations risquent d'Ă©puiser le contenu de haute qualitĂ© gĂ©nĂ©rĂ© par l'homme. Cela pourrait contraindre les dĂ©veloppeurs d'IA Ă  s'appuyer sur ce contenu pour leurs futurs entraĂ®nements, ce qui pourrait entraĂ®ner des problèmes tels qu'une prĂ©cision rĂ©duite, une crĂ©ativitĂ© rĂ©duite et une augmentation des rĂ©pĂ©titions. Pour contrer ce risque, les organisations doivent prioriser la conservation de la majoritĂ© des donnĂ©es qu'elles gĂ©nèrent, car elles pourraient devenir une ressource prĂ©cieuse pour l'entraĂ®nement des modèles d'IA Ă  l'avenir. Cette nĂ©cessitĂ© stimule la demande de solutions de stockage robustes, Ă©volutives et pĂ©rennes.

L'analyse des donnĂ©es comme avantage concurrentiel : il n'y a pas d'IA sans IA

L'analyse basĂ©e sur l'IA est devenue un pilier de la stratĂ©gie d'entreprise moderne, offrant aux organisations la possibilitĂ© de dĂ©celer des schĂ©mas, de prĂ©dire les tendances et de prendre des dĂ©cisions plus rapides et plus judicieuses. Mais si l'IA est sous les projecteurs, on oublie souvent son fondement mĂ©connu : les donnĂ©es. Plus prĂ©cisĂ©ment, l'infrastructure qui rend des dĂ©cennies de donnĂ©es disponibles au moment et Ă  l'endroit oĂą elles sont nĂ©cessaires – ce que nous appelons aujourd'hui l'intelligence artificielle. Archive d'informations (IA).

L'IA est un important réservoir de connaissances organisationnelles, souvent hébergé sur un stockage économique et évolutif comme la bande magnétique. C'est là que sont conservés d'importants volumes de données structurées et non structurées, non seulement à des fins de conformité, mais aussi pour alimenter l'innovation potentielle et générer des avantages concurrentiels. Lors de l'entraînement des modèles d'IA, de vastes ensembles de données sont temporairement extraits de ces archives et placés dans des systèmes hautes performances. Une fois l'entraînement terminé, les données sont renvoyées à l'IA pour une conservation à long terme. Ce cycle d'accès et de conservation permet le développement continu de l'IA.

La capacité d'une organisation à prendre des décisions percutantes et fondées sur les données ne repose pas uniquement sur les outils d'IA les plus récents. Elle dépend de sa capacité à accéder aux informations pertinentes et à les conserver, durablement, à grande échelle et sans compromettre la rentabilité. Bien menée, l'analyse des données permet de personnaliser l'expérience client, de rationaliser les opérations et de s'adapter rapidement à l'évolution des marchés. Cependant, tout cela repose sur une stratégie de données à long terme qui considère la collecte d'informations non pas comme un problème de stockage, mais comme un atout stratégique. L'avenir appartient aux organisations qui traitent leurs données historiques comme une ressource vivante, dont la valeur continue de croître grâce aux informations issues de l'IA.

 De nouvelles opportunitĂ©s pour une technologie Ă©prouvĂ©e

L'essor des applications d'IA pilotées par les données engendre de nouvelles exigences en matière de solutions de stockage. Les organisations ont besoin d'un système permettant le stockage à long terme d'ensembles de données volumineux, tout en garantissant l'accessibilité, la pérennité et la sécurité. De plus, avec la multiplication des cyberattaques, le coût mondial de la cybercriminalité est estimé à 100 millions de dollars. 10.5 billions de dollars par an d'ici 2025—La sécurité des données est devenue un enjeu crucial pour toute solution de stockage. De nombreuses entreprises recherchent instinctivement des technologies de stockage de pointe et récemment développées pour répondre à ces exigences. En raison du besoin de stockage fiable, maintenantCependant, les organisations devraient envisager une technologie existante qui a déjà prouvé sa fiabilité : le stockage sur bande.

Pendant des décennies, de nombreuses organisations établies ont eu recours au stockage sur bande, même si les entreprises plus récentes, natives du cloud, l'ont négligé. Cependant, le retour de l'IA, du machine learning et de l'analyse avancée des données a offert de nouveaux cas d'utilisation pour cette technologie éprouvée. Le stockage sur bande offre une puissante combinaison d'évolutivité, de flexibilité, de rentabilité et de sécurité, ce qui en fait une solution idéale pour gérer des charges de travail massives d'IA et de machine learning. Contrairement à de nombreuses autres solutions de stockage, la bande est très durable, car elle ne consomme pas d'énergie lors du stockage des données, ce qui réduit considérablement son empreinte carbone. De plus, sa capacité hors ligne offre une couche de protection supplémentaire contre les menaces de cybersécurité telles que les attaques par rançongiciel, car les données stockées sur bande sont intrinsèquement immunisées contre les violations à distance.

Les solutions modernes de stockage sur bande ont évolué pour répondre aux exigences de l'IA et de l'analyse de données. Grâce aux dernières avancées en matière de technologie de bande haute capacité, les entreprises peuvent stocker des pétaoctets de données à un coût bien inférieur à celui des solutions cloud traditionnelles. De plus, la longévité des bandes, souvent supérieure à 30 ans, garantit aux organisations la préservation de précieux ensembles de données sans risque de dégradation. C'est donc une option très attractive pour les entreprises qui cherchent à pérenniser leur infrastructure de données tout en maintenant une rentabilité optimale.

La révolution de l'IA et des données

La révolution de l'IA en cours est fondamentalement une révolution des données. Les organisations qui ne priorisent pas le stockage et l'accessibilité des données risquent de se laisser distancer dans un monde de plus en plus axé sur les données. Plus de données signifie plus d'opportunités d'innovation et de différenciation concurrentielle. En adoptant des solutions de stockage évolutives et sécurisées, notamment le potentiel renouvelé des bandes magnétiques, les organisations peuvent s'assurer de rester à la pointe des avancées de l'IA et de la prise de décision basée sur les données. Alors que les entreprises continuent de composer avec les complexités d'une croissance induite par l'IA, celles qui reconnaissent l'importance de la conservation des données et des solutions de stockage intelligentes seront celles qui prospéreront dans un avenir centré sur les données.

Carlos Sandoval est responsable de l'offre mondiale de produits de bandes LTO sur le campus IBM de Guadalajara, au Mexique. Ingénieur en électronique et communications diplômé de l'Université de Guadalajara, au Mexique, il est également titulaire d'un MBA en génie industriel. Il a rejoint IBM en 1995 et a travaillé dans l'ingénierie informatique et des procédés de sous-ensembles de disques durs jusqu'en 2008. En 2010, il est revenu chez IBM en tant que chef de projet pour le développement de nouveaux produits de bandes. Ces dernières années, il est devenu responsable de l'offre mondiale de produits de bandes physiques, où il est désormais responsable des produits IBM LTO.