Лидеры мнений

Когда «знания» ИИ 50-летней давности: риск соблюдения, который нельзя игнорировать

Published September 22, 2025

Updated April 26, 2026

George Tziahanas, VP of Compliance, at Archive360

Вопрос ложных выводов ИИ является насущной проблемой, поскольку предприятия увеличивают использование генеративных инструментов. Несмотря на широкий энтузиазм по поводу внедрения ИИ, существует также сильная критика. Критические комментаторы часто указывают на казалось бы случайные, непредсказуемые неточности в выводах ИИ, которые подрывают его ценность – и даже могут нанести реальный вред людям, особенно в таких секторах, как здравоохранение и транспорт, где ложные выводы теоретически могут привести к всему, от неправильного рецепта до столкновения поездов.

Часто эти неточности объясняются «галлюцинациями» ИИ – случаями, когда ИИ генерирует ответ «лучшего предположения», передаваемый с той же уверенностью, что и «настоящий» ответ, а не информируя пользователя о пробеле в его знаниях или способностях. Галлюцинации могут быть трудно обнаружить на первый взгляд – но есть более тихая, не менее серьезная проблема, которая еще труднее обнаружить.

Долг качества данных: ахиллесова пята ИИ

Когда системы ИИ используют устаревшие, неполные или неточные данные, возникают ложные выводы, но они менее сразу обнаружимы. Например, вы можете попросить ИИ определить симптомы медицинского состояния и получить ответ, основанный на 50-летней статье, а не на текущих исследованиях. Результат вряд ли будет выглядеть сразу, смешно неправильным – но эта первоначальная видимость правдоподобия представляет реальный риск как для пациента, так и для поставщика медицинских услуг.

То же самое верно и для других отраслей – если данные, которые подают модели ИИ, содержат старую, устаревшую или частичную информацию, существует высокий риск ложных выводов. И по мере того, как все больше компаний интегрируют ИИ в бизнес-критические процессы, растет риск выведения ложных выводов из плохо управляемых данных.

Точность для регулятора

Это не только проблема для повседневных операций – это также значительный вызов соблюдения. Регуляторные требования быстро эволюционируют, чтобы решить проблемы, связанные с неточным ИИ. Например, ряд ранних регуляторных действий по ИИ уже состоялся; в частности, когда Италия временно запретила ChatGPT по причинам конфиденциальности, и Европейский совет по защите данных запустил специальную рабочую группу для координации потенциальных действий по обеспечению соблюдения в отношении ChatGPT.

Одним из наиболее показательных регуляторных изменений стало принятие Закона ЕС об ИИ, первого всестороннего правового рамочного документа для ИИ. Закон устанавливает обязательства на основе уровня риска систем ИИ, от систем «неприемлемого риска», которые запрещены, до «высокорисковых» систем, которые сталкиваются с жесткими требованиями в отношении прозрачности, качества данных, управления и надзора человека.

Значимость Закона ЕС об ИИ заключается не в его амбициозном объеме, а, что важно, в созданном им прецеденте. Регуляторы делают ясно, что ИИ будет подвергаться обязательным, исполняемым правилам, и что организации должны относиться к соблюдению и прозрачности в отношении того, где и как используется ИИ, как неотъемлемую часть внедрения ИИ, а не как после мысли.

Закон имеет широкий объем, с потенциальным влиянием на большую часть разработок ИИ. В его основе лежит обеспечение безопасности ИИ, уважая фундаментальные права и ценности. В рамках этой новой основанной на принципах экосистемы происходит диагностика потенциальных источников неточностей ИИ, включая данные и наборы данных, которые питают модели, непрозрачность модели и доступ, а также конструкцию и использование системы. Решения ИИ представляют собой конструкцию всех трех – проблемы с любым из них могут иметь негативный результат. Не только это, но и данные, которые используются при проектировании, разработке, развертывании и эксплуатации ИИ, вероятно, будут состоять в основном из бизнес-записей, которые сами подлежат различным требованиям соблюдения.

Иными словами, регуляторная среда, окружающая ИИ, становится все более жесткой – и это верно как для входных данных, так и для выходных данных, хотя последние получают больше заголовков.

Пять шагов для обеспечения соответствия и актуальности данных ИИ

Чтобы решить эту двойную проблему – обеспечение как соответствующего обращения с данными, так и высококачественного входного сигнала, который позволяет получать высококачественный выходной сигнал – бизнесу необходимо контролировать обучающие и выводящие данные. К сожалению, это то, чего не хватает многим предприятиям.

Как минимум, организации должны применять свои более широкие программы соблюдения и управления к инициативам ИИ. Они должны начать фиксировать и поддерживать соответствующие записи о данных, которые они подают моделям ИИ, как модели и системы спроектированы, а также о решениях и содержании, сгенерированном через ИИ.

Однако также становится критически важным для организаций сделать шаг вперед и обеспечить полный контроль над всеми данными, которые могут быть использованы в развертываниях ИИ, будь то для первоначального обучения или «живой» работы. Для этого требуется высококачественная стратегия управления и хранения данных, гарантирующая, что все соответствующие данные собираются, очищаются, хранятся, классифицируются и ограничиваются доступом. Чтобы достичь этого, организации должны рассмотреть четыре ключевых шага:

1. Происхождение и родословная данных

Это включает в себя поддержание записи о источнике данных, их происхождении, владении и любых изменениях метаданных (если разрешено) на протяжении всего жизненного цикла. Это также означает поддержание богатых метаданных и всех основных документов или артефактов, из которых они получены.

2. Аутентичность данных

Это требует поддержания четкой цепочки хранения для всех данных, хранения объектов в их родных формах и хеширования полученных объектов для демонстрации того, что данные остаются неизменными. Кроме того, организации должны поддерживать полную историю аудита для каждого объекта и для всех действий и событий, связанных с любыми изменениями.

3. Классификация данных

Установление характера набора или типа данных важно. Организации должны быть в состоянии управлять структурированными данными, полуструктурированными данными и структурированными наборами данных. Назначение каждому классу уникальной схемы может позволить организациям управлять разнообразными наборами данных без единой фиксированной онтологии – избегая ненужного манипулирования данными для того, чтобы заставить их входить в жесткую структуру данных.

4. Нормализация данных

Установление общих определений и форматов метаданных важно для использования в аналитике и решениях ИИ. Ясно определенные схемы являются важным элементом, вместе с инструментами, которые могут преобразовывать или сопоставлять данные для поддержания последовательных, нормализованных представлений связанных данных.

5. Права доступа к данным

Предприятиям необходимы детальные механизмы контроля доступа, включая доступ на уровне объекта или поля, на основе профилей пользователя или системы. Это означает, что правильные данные доступны пользователям и системам, которые имеют право доступа к ним, в то время как доступ ограничивается или ограничивается для тех, кто не имеет права.

С этими важными элементами на месте бизнес будет лучше всего подготовлен к обеспечению того, что данные, предоставляемые моделям ИИ, являются как высококачественными, так и соответствующими. ИИ будет стимулировать улучшения и повышение эффективности во всех отраслях – но для этого необходимо иметь прочную основу данных.

Related Topics:AI compliance archive360 archives compliance knowledge

George Tziahanas, VP of Compliance, at Archive360

Джордж Тзiahanas является вице-президентом по соблюдению требований и ассоциированным генеральным юрисконсультом в Archive360. Джордж является исполнительным лидером с глубоким пониманием сложных технологий, банковских регулирований, управления данными и управления рисками. И, тесно сотрудничает с текущими и потенциальными клиентами, чтобы обеспечить выполнение сложных требований к управлению данными и соблюдению требований, соответствующих решениям Archive360.