ソートリーダー
November 1, 2024
AI開発における汚れたデータの高コスト
AI開発における現代のゴールドラッシュが進行中であることは、秘密ではありません。 2024 Work Trend Indexによると、40%以上のビジネスリーダーは、人工知能(AI)を使用してビジネスプロセスを根本的に再設計することを予想しています。 これは、単なる技術的なアップグレードではなく、ビジネスが運営される方法、意思決定が行われる方法、顧客とのやり取りが行われる方法の根本的な変革です。 この急速な開発は、データとファーストパーティーデータ管理ツールに対する需要を促しています。 Forresterによると、92%のテクノロジーリーダーは、2024年にデータ管理とAIの予算を増やす予定です。 最新のMcKinsey Global Survey on AIによると、65%の回答者は、組織が定期的に生成的なAI技術を使用していることを示しました。 この採用は、大きな飛躍を示していますが、同時に重要な課題も浮き彫りになります。 AIシステムに供給されるデータの品質です。 データによってのみ効果的なAIが実現可能な業界では、信頼性が高く正確なデータが入手できにくくなっています。 不良データの高コスト不良データは、新しい問題ではありませんが、その影響はAIの時代に増大しています。 2017年にマサチューセッツ工科大学(MIT)が行った研究によると、不良データは、企業の収益の15%から25%を占めることがあります。 2021年には、Gartnerは、不良データが組織に年間平均12.9百万ドルのコストをもたらすと推定しています。 不完全、不正確、または一貫性のないデータである「汚れたデータ」は、AIシステムに連鎖的な影響を及ぼす可能性があります。 AIモデルが不良な品質のデータでトレーニングされた場合、結果として得られる洞察と予測は根本的に欠陥があります。 これは、AIアプリケーションの有効性を損なうだけでなく、这些技術に依存するビジネスに重大なリスクをもたらします。 これは、限られたリソースをデータのクリーンアップと整理に集中させることを余儀なくされた企業のデータサイエンスチームにとって、大きな頭痛の種となっています。 最近のエンジニアリング報告書によると、57%のデータサイエンスプロフェッショナルは、仕事において不良なデータ品質が主な問題であると回答しました。 AIモデルの影響不良データがAI開発に及ぼす影響は、3つの主要な方法で表れます: 精度と信頼性の低下:AIモデルは、データから導かれたパターンと相関関係によって繁栄します。入力データが汚染されている場合、モデルは信頼できない出力を生成します。これは、間違った戦略、製品の失敗、顧客の信頼の喪失につながる可能性があります。...