- Терминология (А до D)
- AI контрол на възможностите
- AI Ops
- албуми
- Ефективност на активите
- Автокодер
- Обратно разпространение
- Теорема на Бейс
- Голямо количество от данни
- Chatbot: Ръководство за начинаещи
- Изчислително мислене
- Компютърно зрение
- Матрица на объркването
- Конволюционни невронни мрежи
- Кибер защита
- Data Fabric
- Разказване на данни
- Science Data
- Съхранение на данни
- Дърво на решенията
- Deepfakes
- Дълбоко обучение
- Дълбоко подкрепящо обучение
- DevOps
- DevSecOps
- Дифузионни модели
- Digital Twin
- Намаляване на размерите
- Терминология (E до K)
- Edge AI
- Емоция AI
- Ансамбъл обучение
- Етичен хакерство
- ETL
- Обясним AI
- Федерално обучение
- FinOps
- Генеративен AI
- Генеративна състезателна мрежа
- Генеративно срещу дискриминационно
- Градиентно усилване
- Градиентно спускане
- Малкократно обучение
- Класификация на изображенията
- ИТ операции (ITOPs)
- Автоматизация на инциденти
- Инженеринг на влиянието
- К-средства групиране
- K-най-близки съседи
- Терминология (L до Q)
- Терминология (R до Z)
- Укрепване на обучението
- Отговорен AI
- RLHF
- Роботизирана автоматизация на процесите
- Структуриран срещу неструктуриран
- Анализ на чувството
- Надзиравани срещу ненаблюдавани
- Поддръжка на векторни машини
- Синтетични данни
- Синтетични медии
- Класификация на текста
- TinyML
- Прехвърляне на обучение
- Трансформаторни невронни мрежи
- Тест на Тюринг
- Търсене по векторно сходство
AI 101 г
Какво е Data Fabric?
Съдържание
Често свързвана с изкуствен интелект (AI) и машинно обучение (ML), тъканта от данни е един от основните инструменти за конвертиране на необработени данни в бизнес разузнаване.
Но какво точно е структура за данни?
Платформата за данни е архитектура и софтуер, които предлагат унифицирана колекция от активи с данни, бази данни и архитектури на бази данни в рамките на едно предприятие. Той улеснява интегрирането от край до край на различни канали за данни и облачни среди чрез използването на интелигентни и автоматизирани системи.
Тъканите за данни станаха по-важни, тъй като продължават да се случват големи разработки с хибридния облак, интернет на нещата (IoT), AI и крайните изчисления. Това доведе до огромно увеличение на големите данни, което означава, че организациите имат още повече за управление.
За да се справят с тези големи данни, компаниите трябва да се съсредоточат върху обединяването и управлението на среди с данни, което постави няколко предизвикателства като силози за данни, рискове за сигурността и затруднения при вземането на решения. Тези предизвикателства са това, което е довело екипите за управление на данни да възприемат решения за тъкани на данни, които помагат за унифициране на системите за данни, укрепват поверителността и сигурността, подобряват управлението и осигуряват по-голяма достъпност на данните на работниците.
Интегрирането на данни води до вземане на решения, базирани на повече данни, и докато предприятията в миналото са използвали различни платформи за данни за специфични аспекти на бизнеса, тъканите за данни позволяват данните да се разглеждат по-свързано. Всичко това води до по-добро разбиране на жизнения цикъл на клиента и помага за установяване на връзки между данните.
Каква е целта на Data Fabric?
Тъканите за данни се използват за създаване на унифициран изглед на свързаните данни, което улеснява достъпа до информация, независимо от нейното местоположение, асоциация с база данни или структура. Платформите за данни също опростяват анализа с AI и машинно обучение.
Друга цел на структурата за данни е да улесни разработването на приложения, тъй като създава общ модел за достъп до информация, отделен от традиционните силози на приложения и бази данни. Тези модели осигуряват по-добър достъп до информация, но също така подобряват ефективността чрез установяване на един слой, където достъпът до данни може да се управлява във всички ресурси.
Въпреки че няма една единствена архитектура на данни за структура на данни, често се казва, че има шест основни компонента за този тип рамка на данни:
Управление на данни: Отговаря за управлението на данните и сигурността на данните.
Поглъщане на данни: Обединява данните от облака и идентифицира връзките между структурирани и неструктурирани данни.
Обработка на данни: Усъвършенства данните, за да се гарантира, че се извеждат само подходящи данни за извличане на данни.
Оркестрация на данни: Наистина важен слой от рамката, отговорен за трансформирането, интегрирането и почистването на данни, така че да могат да се използват в целия бизнес.
Откриване на данни: Извежда нови начини за интегриране на източници на данни.
Достъп до данни: Позволява потреблението на данни, осигурява правилните разрешения за определени екипи за спазване на регулациите и помага за извеждането на съответните данни чрез използването на табла за управление и други инструменти за визуализация на данни.
Предимства на Data Fabric
Има много бизнес и технически предимства на тъканите за данни, като например:
Разбийте силозите с данни: Съвременните бизнеси често страдат от изоставяне на данни, тъй като модерните бази данни са свързани с групи от приложения и често се разрастват с добавянето на нови към предприятието. Силозите за данни съдържат данни с различни структури и формати, но тъканите за данни могат да подобрят достъпа до корпоративна информация и да използват събраните данни за подобряване на оперативната ефективност.
Обединяване на бази данни: Платформите за данни също помагат на компаниите да обединяват бази данни, които са разпръснати на голяма площ. Те гарантират, че разликите в местоположението не водят до бариери за достъп. Платформите за данни опростяват разработката на приложения и могат да се използват за оптимизиране на използването на конкретни приложения, без да правят данните по-малко достъпни за други приложения. Те могат също да обединяват данни, които вече са преместени в силози.
Единен начин за достъп до информация: Data fabrics подобрява преносимостта на приложенията и действа като единствен начин за достъп до информация както в облака, така и в центъра за данни.
Генерирайте прозрения с ускорено темпо: Решенията за структура на данни могат лесно да обработват сложни набори от данни, което ускорява времето за прозрение. Тяхната архитектура позволява предварително изградени аналитични модели и когнитивни алгоритми за обработка на данни в мащаб и скорост.
Използва се от технически и нетехнически потребители: Data fabrics не са насочени само към технически потребители. Архитектурата е гъвкава и може да се използва с широк набор от потребителски интерфейси. Те могат да помогнат за изграждането на табла за управление, които могат да бъдат разбрани от бизнес ръководителите, или техните сложни инструменти могат да се използват за изследване на данни от специалисти по данни.
Най-добри практики за внедряване на Data Fabrics
Глобалният пазар на данни непрекъснато се разширява и има силно търсене в пространството. Много компании се стремят да внедрят архитектура на данни, за да оптимизират своите корпоративни данни, и следват някои общи най-добри практики.
Една такава практика е да се приеме модел на процес DataOps. Data fabric и DataOps не са идентични, но според модел DataOps има тясна свързаност между процесите на данни, инструментите и потребителите. Чрез подравняването на потребителите да разчитат на данни, те могат да използват инструментите и да прилагат прозрения. Без модел DataOps потребителите могат да се затруднят да извлекат достатъчно от структурата на данните.
Друга най-добра практика е да се избегне превръщането на структурата от данни в просто друго езеро от данни, което е често срещано явление. Например, истинска структура от данни не може да бъде постигната, ако имате всички архитектурни компоненти, като източници на данни и анализи, но нито един от API и SDK. Data fabric се отнася до дизайна на архитектурата, а не до отделна технология. А някои от определящите черти на архитектурата са оперативната съвместимост между компонентите и готовността за интеграция.
Също така е изключително важно за организацията да разбере своето съответствие и регулаторни изисквания. Архитектурата на структурата на данни може да подобри сигурността, управлението и съответствието с нормативните изисквания.
Тъй като данните не са разпръснати в системите, съществува по-малка заплаха от излагане на чувствителни данни. С това казано, важно е да разберете съответствието и регулаторните изисквания, преди да внедрите структура за данни. Различните типове данни могат да попадат под различни регулаторни юрисдикции. Едно решение е да се използват автоматизирани политики за съответствие, които гарантират, че трансформацията на данни е в съответствие със законите.
Случаи на използване на Data Fabric
Има много различни приложения за тъкан за данни, но някои от тях са много често срещани. Един такъв често срещан пример е виртуалното/логическо събиране на географски разнообразни активи от данни за улесняване на достъпа и анализа. В този случай структурата на данни обикновено се използва за централизирано управление на бизнеса. Тъй като разпределените линейни операции, които събират и използват данните, се поддържат чрез традиционни интерфейси за приложения и достъп до данни/заявки, има много какво да се спечели от организации, които имат регионална или национална сегментация на своите дейности. Тези организации често изискват централно управление и координация.
Друг основен случай на използване на тъкани за данни е създаването на унифициран модел на данни след сливане или придобиване. Когато това се случи, базата данни и политиките за управление на данни на предишната независима организация често се променят, което означава, че става по-трудно да се събира информация извън организационните граници. Платформата за данни може да преодолее това чрез създаване на унифициран изглед на данни, който позволява на комбинирания обект да се хармонизира в един модел на данни.
Алекс Макфарланд е AI журналист и писател, изследващ най-новите разработки в областта на изкуствения интелект. Той е сътрудничил с множество стартиращи фирми и публикации в областта на изкуствения интелект по целия свят.
Може да ви хареса
Големи данни срещу малки данни: Основни разлики
Наука за данни срещу компютърни науки: Ключови разлики
Data Science срещу Data Mining: Ключови разлики
Дълбоко обучение срещу невронни мрежи
Машинно обучение срещу Data Science: Ключови разлики
Машинно обучение срещу изкуствен интелект: ключови разлики