Connect with us

Нові набори даних Off-the-Shelf (OTS) від Appen прискорюють розгортання штучного інтелекту

Штучний інтелект

Нові набори даних Off-the-Shelf (OTS) від Appen прискорюють розгортання штучного інтелекту

mm

Appen Limited (ASX:APX), провідний постачальник високоякісних навчальних даних для організацій, які будують ефективні системи штучного інтелекту у великому масштабі, сьогодні оголосив про нові набори даних off-the-shelf (OTS). Ці набори даних розроблені для полегшення та прискорення процесу придбання високоякісних навчальних даних, необхідних для прискорення проектів штучного інтелекту (AI) та машинного навчання (ML). Нові набори даних OTS включають рух людського тіла та інноваційні звуки плачу дитини, а також скриптовану мову та зображення з текстом, придатні для оптичного розпізнавання символів (OCR) для мов з високим попитом, але складними для отримання, таких як арабська, хорватська, грецька, угорська, тайська та інші. З розширенням наборів даних загальна кількість наборів даних OTS від Appen налічує понад 250 наборів, що складаються з понад 11 000 годин аудіо, понад 25 000 зображень та понад 8,7 мільйонів слів у 80 мовах та декількох діалектах.

Набори даних OTS від Appen є швидким та економічно ефективним інструментом для початку проекту штучного інтелекту або машинного навчання з високоякісними навчальними даними. Команди, які розширюють свої можливості штучного інтелекту, також можуть використати набори даних OTS для ефективного покращення точності, розробки нових навичок моделей та впровадження інших удосконалень у свої моделі штучного інтелекту. Набір даних OTS часто доставляється протягом одного тижня, наприклад, порівняно з 8-12 тижнями для нового проекту збору та анотації даних – або навіть довше, залежно від складності. Усі набори даних Appen розроблені за допомогою повністю прозорої, добровільної методології, тому спеціалісти штучного інтелекту можуть бути впевнені, що їхні дані чисті та відповідні вимогам, що усуває потенційний ризик негативної реакції та шкоди репутації.

“Команди штучного інтелекту по всьому світу, які працюють над проектами з тісними термінами та гнучкими вимогами до даних, можуть виграти від використання наборів даних off-the-shelf”, – сказав Вілсон Панг, технічний директор Appen. “Набори даних OTS скорочують час до отримання результатів та забезпечують доступ до високоякісних даних за нижчу загальну вартість порівняно з традиційними методами. Ми в Appen приймаємо необхідні заходи для забезпечення того, щоб усі наші набори даних були отримані етично та були демографічно збалансовані, що дозволяє компаніям підтримувати відповідальну практику штучного інтелекту, мінімізуючи упередженість у своїх моделях та забезпечуючи справедливе ставлення до анотаторів даних. Ви завжди знаєте точну якість набору даних OTS, що допомагає створювати кращий штучний інтелект, який працює у реальному світі”.

MediaInterface надавала рішення мовної технології закладам охорони здоров’я в Німеччині та інших частинах Європи понад 20 років. Коли компанія розширювала свою діяльність до Франції, у неї було повністю локалізоване програмне забезпечення, але бракувало французьких лексичних даних, особливо французьких імен та назв місць, які часто згадуються у інформації про здоров’я пацієнтів. Використовуючи набори даних OTS від Appen, MediaInterface придбала приблизно 21 000 французьких імен та 14 000 назв місць. “Критичні дані від Appen були включені до нашого фоновому лексикону для успішного запуску на новому ринку, і це допомагає нам розбудовувати нові словники для наших клієнтів та зміцнювати наш підхід для майбутніх запусків ринку”, – сказала Інес Вендлер, менеджер продукту в MediaInterface.

Най досвідченіші експерти штучного інтелекту поєднують набори даних OTS з проектами збору та анотації даних на вимогу для задоволення складних потреб навчальних даних для тренування моделей штучного інтелекту. Appen є лідером у наданні продовжуваної підтримки через ряд спеціальних послуг збору даних, таких як постійна анотація даних та розумне маркування, через інструменти штучного інтелекту та автоматизовані робочі процеси для максимізації ефективності.

“Ми взаємодіємо зі штучним інтелектом з моменту пробудження до моменту сну – через віртуальних помічників, чат-ботів, пошукових систем, соціальних мереж, медичних пристроїв, розумних автомобілів та інших застосунків”, – сказав Джудіт Бішоп, старший директор спеціалістів штучного інтелекту Appen, яка очолює команду з 100 лінгвістів та мовних експертів. “Мова часто є основним інтерфейсом для багатьох цих привабливих випадків використання штучного інтелекту, тому для забезпечення гарного досвіду модель повинна бути навчена працювати для всіх. Зобов’язання Appen щодо високоякісних даних та відповідальної, етичної розробки штучного інтелекту дозволяє компаніям, які купують наші набори даних off-the-shelf, прискорити свої проекти штучного інтелекту з повною впевненістю у своїх даних”.

До списку існуючих сотень наборів даних, які вже доступні на appen.com, додані нові набори даних OTS від Appen, які тепер доступні:

  • Скриптована мова для арабської (Єгипет), арабської (Саудівська Аравія), арабської (Об’єднані Арабські Емірати), центральної кхмерської (Камбоджа), хорватської, грецької, угорської, польської, іспанської (Іспанія) та турецької
  • Зображення OCR для спрощеного китайського друкованого тексту, тайського друкованого тексту та фінського друкованого тексту – Включає попередньо записані білборди, зовнішню упаковку, знаки, журнали та меню для навчання та оновлення моделей комп’ютерного зору OCR
  • Рух людського тіла (Китай) – Включає анотовані відео руху людей, відстежувані на рівні пікселів, придатні для розробки ігор, фітнес-додатків та іншого
  • Звуки плачу дитини (Китай) – Включає попередньо записані та анотовані звуки дитини, які можна використовувати для навчання моделей штучного інтелекту розпізнаванню різних звуків плачу та попередженню батьків

Для отримання більшої інформації та запиту зразка набору даних OTS від Appen натисніть тут.

Даніель є великим прибічником того, як штучний інтелект в кінцевому підсумку порушить все. Він дихає технологіями і живе, щоб спробувати нові гаджети.