ソートリーダー6 months ago
AIの『知識』が50年古いとき:無視できないコンプライアンスリスク
偽のAIの洞察は、企業が生成ツールの使用を増やしているため、緊急の課題となっている。AIの採用に対する広範な熱狂にもかかわらず、批判の強い潮流もある。批判的な評論家はしばしば、AIの出力における明らかにランダムで予測不可能な不正確さを指摘し、これによりAIの価値が損なわれ、特に医療や交通などの分野では、誤った出力が誤った処方や列車の衝突につながる可能性があるため、人間に実際の危害をもたらす可能性もある。これらの不正確さは、しばしばAIの『hallucinations』に帰せられ、AIが「最善の推測」回答を生成し、本当の回答と同じ自信を持って回答するが、知識や能力のギャップについてユーザーに通知するのではなく、そのようなhallucinationsは最初の目で見たときに難しく、より深刻な問題が存在する。データ品質の負債:AIのアキレス腱AIシステムが古くなった、不完全な、または不正確なデータから情報を取得すると、誤った出力が発生するが、すぐにはわかりにくい。たとえば、AIに医療条件の症状を特定するように求め、50年前の論文に基づいて回答を受け取ることができる。結果は、明らかに間違っているように見えず、最初の見た目ではありそうもないが、患者と医療提供者にとって実際のリスクをもたらす。 同様のことが他の業界でも当てはまる。AIモデルに古くなった、古くなった、または部分的な情報が含まれている場合、誤った出力のリスクが高くなる。企業がAIをビジネスクリティカルなプロセスに統合するにつれて、不十分なデータ管理から誤った結論を導き出すリスクも増大する。規制当局のための正確性これは、日常業務だけでなく、コンプライアンスの課題でもある。規制要件は、不正確なAIに対処するために急速に進化している。たとえば、AIに対する初期の規制措置が行われた。特に、イタリアがChatGPTを一時的に禁止し、EUデータ保護委員会がChatGPTに対する規制措置を調整するために専門タスクフォースを立ち上げた。 規制変更の中で最も重要なのは、世界初の包括的なAI法規制であるEU AI法の成立である。法令は、AIシステムのリスクレベルに基づいて義務を定め、禁止される「受け入れられないリスク」のシステムから、「高リスク」のシステムまで、透明性、データ品質、ガバナンス、人間の監視に関する厳格な要件を課す。 EU AI法の重要性は、その雄大な範囲にではなく、規制当局がAIに拘束力のある、執行可能なルールを課すことを明確にし、組織がコンプライアンスと透明性をAIの採用の不可欠な部分として扱うことを示している。 法令は、AI開発の大部分に影響を及ぼす可能性がある。中核には、AIを安全にし、基本的な権利と価値を尊重することがある。新しい原則に基づくエコシステムの中で、潜在的なAIの不正確さの原因、データとデータセット、モデル不透明度とアクセス、システム設計と使用を診断する。AIソリューションは、これらの要素すべての構成である。問題があれば、否定的な結果をもたらす。さらに、AIの設計、モデル開発、展開、運用に使用されるデータは、ビジネスレコードで構成されることが多く、これらはさまざまなコンプライアンス要件の対象となる。 言い換えれば、AIを取り巻く規制環境は、データ入力とデータ出力の両方で厳しくなっている。コンプライアントで現在的で関連性のあるデータをAIに提供するための5つのステップこの二重の課題、コンプライアントなデータ処理と高品質の入力による高品質の出力を確保するために、企業はトレーニングデータと推論データを管理する必要がある。不幸にも、これは多くの企業がまだ欠けているものである。 少なくとも、組織は、AIイニシアチブに広範なコンプライアンスとガバナンスプログラムを適用する必要がある。AIモデルに供給するデータ、モデルとシステムの設計、AIを介して生成される決定とコンテンツについて、適切なレコードを取得して維持する必要がある。 しかし、組織はさらに重要なステップを踏む必要がある。AIの展開に使用されるすべてのデータ、初期トレーニングまたは「ライブ」作業のいずれかに対して、完全な管理を確保する必要がある。これには、高品質のデータ管理とストレージ戦略が必要であり、すべての関連データを知的に収集、クリーン、ストア、分類、エンティティ化する必要がある。実現するには、4つの重要なステップを検討する必要がある:1. データの血統と出典これには、データの源、起源、所有権、およびメタデータの変更(許可されている場合)をそのライフサイクル全体で維持することが含まれる。また、メタデータと、そこから派生したすべてのドキュメントまたはアーティファクトを維持することも含まれる。2. データの真贋これには、すべてのデータの明確な所有権の連鎖を維持し、オブジェクトをそのネイティブ形式でストアし、オブジェクトを受け取ったときにデータが変更されていないことを示すためにハッシュ化することが含まれる。さらに、各オブジェクトの完全な監査履歴と、すべての変更やイベントに関するアクションを維持する必要がある。3. データの分類データのセットまたはタイプの性質を確立することが重要である。組織は、構造化データ、半構造化データ、構造化データのセットを管理する必要がある。各クラスに一意のスキーマを与えることで、組織は、データを不要に操作して、柔軟性のないデータ構造に強制的に合わせることなく、さまざまなデータのセットを管理できる。4. データの正規化メタデータの共通の定義と形式を確立することが重要である。分析とAIソリューションで使用するために。明確に定義されたスキーマは重要な要素であり、関連するデータの正規化されたビューを維持するために、データを変換またはマッピングするツールも必要である。5. データのエンティティ化企業は、ユーザーまたはシステムのプロファイルに基づいて、オブジェクトまたはフィールドレベルで、グラニュラーなエンティティ化コントロールが必要である。これは、データがアクセスを許可されたユーザーとシステムに利用可能であり、許可されていないユーザーにはアクセスが制限または制限されることを意味する。 これらの重要な要素を整えることで、企業は、AIモデルに提供されるデータが高品質でコンプライアントであることを保証するために最も適切な位置に立つことができる。AIは、業界全体で改善と効率化をもたらすが、それが起こるためには、堅実なデータ基盤が不可欠である。