Искусственный интеллект
Цитаты: Может ли новая функция Anthropic решить проблему доверия ИИ?

Проверка ИИ уже некоторое время является серьезной проблемой. большие языковые модели (LLM) развивались невероятными темпами, однако задача доказательства их точности осталась нерешенной.
Антропный пытается решить эту проблему, и из всех крупных компаний, занимающихся ИИ, я думаю, у них самые лучшие шансы.
Компания выпустила Цитаты, новая функция API для своего Модели Клода что меняет то, как системы ИИ проверяют свои ответы. Эта технология автоматически разбивает исходные документы на удобоваримые части и связывает каждое сгенерированное ИИ утверждение с его первоисточником — подобно тому, как академические статьи ссылаются на свои источники.
Citations пытается решить одну из самых насущных проблем искусственного интеллекта: доказать точность и достоверность создаваемого контента. Вместо того, чтобы требовать сложной оперативной разработки или ручной проверки, система автоматически обрабатывает документы и обеспечивает проверку источника на уровне предложений для каждого утверждения.
Полученные данные демонстрируют многообещающие результаты: точность цитирования повысилась на 15% по сравнению с традиционными методами.
Почему это важно именно сейчас
Доверие к ИИ стало критическим препятствием для внедрения на предприятии (а также для индивидуального внедрения). Поскольку организации выходят за рамки экспериментального использования ИИ и переходят к основным операциям, невозможность эффективной проверки результатов ИИ создала существенное узкое место.
Текущие системы проверки выявляют очевидную проблему: организации вынуждены выбирать между скоростью и точностью. Ручные процессы проверки не масштабируются, а непроверенные результаты ИИ несут слишком большой риск. Эта проблема особенно актуальна в регулируемых отраслях, где точность не просто предпочтительна — она обязательна.
Время Citations наступает в решающий момент в развитии ИИ. По мере того, как языковые модели становятся все более сложными, потребность во встроенной проверке растет пропорционально. Нам нужно создавать системы, которые можно уверенно развертывать в профессиональных средах, где точность не подлежит обсуждению.
Разбор технической архитектуры
Магия Citations заключается в подходе к обработке документов. Citations не похож на другие традиционные системы ИИ. Они часто рассматривают документы как простые текстовые блоки. С помощью Citations инструмент разбивает исходные материалы на то, что Anthropic называет «кусками». Это могут быть отдельные предложения или определяемые пользователем разделы, которые создают гранулярную основу для проверки.
Вот техническая разбивка:
Обработка и ведение документов
Citations обрабатывает документы по-разному в зависимости от их формата. Для текстовых файлов по сути нет ограничений сверх стандартного лимита в 200,000 XNUMX токенов для общего количества запросов. Это включает ваш контекст, подсказки и сами документы.
Обработка PDF-файлов более сложная. Система обрабатывает PDF-файлы визуально, а не только как текст, что приводит к некоторым ключевым ограничениям:
- Ограничение на размер файла 32 МБ
- Максимум 100 страниц в документе
- Каждая страница потребляет 1,500–3,000 токенов.
Управление токенами
Теперь перейдем к практической стороне этих ограничений. Когда вы работаете с Citations, вам нужно тщательно продумать свой бюджет токенов. Вот как он распределяется:
Для стандартного текста:
- Полный лимит запросов: 200,000 жетонов
- Включено: Контекст + подсказки + документы
- Никакой отдельной платы за цитирование.
Для PDF-файлов:
- Более высокое потребление токенов на страницу
- Накладные расходы на визуальную обработку
- Необходим более сложный расчет токенов
Цитаты против RAG: основные различия
Цитаты - это не Поисковая дополненная генерация (RAG) система – и это различие имеет значение. В то время как системы RAG фокусируются на поиске релевантной информации из базы знаний, Citations работает с информацией, которую вы уже выбрали.
Подумайте об этом так: RAG решает, какую информацию использовать, в то время как Citations обеспечивает правильное использование информации. Это означает:
- ТРЯПКА: Осуществляет поиск информации
- Цитирование: Управляет проверкой информации
- Комбинированный потенциал: Обе системы могут работать вместе
Такой выбор архитектуры означает, что Citations отличается исключительной точностью в рамках предоставленных контекстов, оставляя стратегии поиска на усмотрение дополнительных систем.
Пути интеграции и производительность
Настройка проста: Цитаты проходят через Стандартный API Anthropic, что означает, что если вы уже используете Claude, вы на полпути. Система напрямую интегрируется с API сообщений, устраняя необходимость в отдельном хранилище файлов или сложных изменениях инфраструктуры.
Структура ценообразования соответствует модели Anthropic, основанной на токенах, с ключевым преимуществом: вы платите за входные токены исходных документов, но за сами цитирования дополнительная плата не взимается. Это создает предсказуемую структуру расходов, которая масштабируется по мере использования.
Показатели эффективности рассказывают убедительную историю:
- 15% улучшение общей точности цитирования
- Полное устранение исходных галлюцинаций (с 10% возникновения до нуля)
- Проверка на уровне предложения для каждого заявления
Организации (и частные лица), использующие непроверенные системы ИИ, оказываются в невыгодном положении, особенно в регулируемых отраслях или в условиях высоких рисков, где точность имеет решающее значение.
Заглядывая вперед, мы, вероятно, увидим:
- Интеграция функций, подобных Citations, становится стандартом
- Эволюция систем проверки за пределами текста и на других носителях
- Разработка отраслевых стандартов проверки
Вся отрасль действительно должна переосмыслить надежность и верификацию ИИ. Пользователи должны достичь точки, в которой они смогут легко проверить каждое утверждение.












