- คำศัพท์ (A ถึง D)
- การควบคุมความสามารถของ AI
- AIOps
- อัลบั้ม
- ประสิทธิภาพของสินทรัพย์
- ตัวเข้ารหัสอัตโนมัติ
- การขยายพันธุ์หลัง
- ทฤษฎีบทเบย์
- ข้อมูลขนาดใหญ่
- Chatbot: คู่มือสำหรับผู้เริ่มต้น
- การคิดเชิงคำนวณ
- วิสัยทัศน์คอมพิวเตอร์
- เมทริกซ์ความสับสน
- เครือข่ายประสาทเทียม
- cybersecurity
- ผ้าข้อมูล
- การเล่าเรื่องข้อมูล
- ข้อมูลวิทยาศาสตร์
- คลังข้อมูล
- ต้นไม้ตัดสินใจ
- Deepfakes
- การเรียนรู้ลึก ๆ
- การเรียนรู้การเสริมแรงเชิงลึก
- devops
- DevSecOps
- แบบจำลองการแพร่กระจาย
- ดิจิตอลแฝด
- การลดขนาด
- คำศัพท์ (E ถึง K)
- เอดจ์ไอ
- อารมณ์ AI
- การเรียนรู้ทั้งมวล
- การแฮ็กอย่างมีจริยธรรม
- ETL
- AI ที่อธิบายได้
- สหพันธ์การเรียนรู้
- ฟินอ๊อฟ
- กำเนิด AI
- เครือข่ายผู้ให้กำเนิด
- กำเนิดเทียบกับการเลือกปฏิบัติ
- ไล่โทนสี
- โคตรไล่ระดับ
- การเรียนรู้ไม่กี่ช็อต
- การจำแนกรูปภาพ
- การดำเนินงานด้านไอที (ITOps)
- ระบบอัตโนมัติของเหตุการณ์
- วิศวกรรมอิทธิพล
- K-หมายถึงการจัดกลุ่ม
- K-เพื่อนบ้านที่ใกล้ที่สุด
- คำศัพท์ (L ถึง Q)
- คำศัพท์ (R ถึง Z)
- การเรียนรู้เสริมแรง
- AI ที่มีความรับผิดชอบ
- อาร์แอลเอชเอฟ
- ระบบอัตโนมัติของกระบวนการหุ่นยนต์
- มีโครงสร้าง vs ไม่มีโครงสร้าง
- การวิเคราะห์ความเชื่อมั่น
- อยู่ภายใต้การดูแล vs ไม่ได้รับการดูแล
- สนับสนุนเครื่องเวกเตอร์
- ข้อมูลสังเคราะห์
- สื่อสังเคราะห์
- การจัดประเภทข้อความ
- TinyML
- ถ่ายทอดการเรียนรู้
- เครือข่ายประสาทหม้อแปลง
- การทดสอบของทัวริง
- การค้นหาความคล้ายคลึงกันของเวกเตอร์
AI 101
Data Fabric คืออะไร?
สารบัญ
มักเกี่ยวข้องกับปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (ML) โครงสร้างข้อมูลเป็นหนึ่งในเครื่องมือหลักสำหรับการแปลงข้อมูลดิบให้เป็นระบบธุรกิจอัจฉริยะ
แต่ผ้าข้อมูลคืออะไรกันแน่?
โครงสร้างข้อมูลคือสถาปัตยกรรมและซอฟต์แวร์ที่นำเสนอชุดรวมของสินทรัพย์ข้อมูล ฐานข้อมูล และสถาปัตยกรรมฐานข้อมูลภายในองค์กร ช่วยอำนวยความสะดวกในการรวมท่อข้อมูลและสภาพแวดล้อมคลาวด์แบบ end-to-end ผ่านการใช้ระบบอัจฉริยะและอัตโนมัติ
โครงสร้างข้อมูลมีความสำคัญมากขึ้นเนื่องจากการพัฒนาที่สำคัญยังคงดำเนินต่อไปด้วยไฮบริดคลาวด์ อินเทอร์เน็ตของสรรพสิ่ง (IoT) AI และเอดจ์คอมพิวติ้ง สิ่งนี้ทำให้เกิดการเพิ่มขึ้นอย่างมากของข้อมูลขนาดใหญ่ ซึ่งหมายความว่าองค์กรต่างๆ ต้องจัดการมากขึ้น
เพื่อจัดการกับข้อมูลขนาดใหญ่นี้ บริษัทต่างๆ จะต้องมุ่งเน้นไปที่การรวมและการกำกับดูแลของสภาพแวดล้อมข้อมูล ซึ่งก่อให้เกิดความท้าทายหลายประการ เช่น ไซโลข้อมูล ความเสี่ยงด้านความปลอดภัย และปัญหาคอขวดในการตัดสินใจ ความท้าทายเหล่านี้เป็นสิ่งที่ทำให้ทีมจัดการข้อมูลหันมาใช้โซลูชันดาต้าแฟบริค ซึ่งช่วยรวมระบบข้อมูล เสริมสร้างความเป็นส่วนตัวและความปลอดภัย ปรับปรุงการกำกับดูแล และช่วยให้พนักงานสามารถเข้าถึงข้อมูลได้มากขึ้น
การรวมข้อมูลนำไปสู่การตัดสินใจที่ขับเคลื่อนด้วยข้อมูลมากขึ้น และในขณะที่องค์กรต่างๆ เคยใช้แพลตฟอร์มข้อมูลที่แตกต่างกันสำหรับแง่มุมเฉพาะของธุรกิจ แฟบริคข้อมูลช่วยให้สามารถดูข้อมูลได้อย่างสอดคล้องกันมากขึ้น ทั้งหมดนี้นำไปสู่ความเข้าใจที่ดีขึ้นเกี่ยวกับวงจรชีวิตของลูกค้า และช่วยสร้างการเชื่อมต่อระหว่างข้อมูล
จุดประสงค์ของ Data Fabric คืออะไร?
แฟบริคข้อมูลถูกใช้เพื่อสร้างมุมมองที่เป็นหนึ่งเดียวของข้อมูลที่เกี่ยวข้อง ซึ่งอำนวยความสะดวกในการเข้าถึงข้อมูลโดยไม่คำนึงถึงตำแหน่งที่ตั้ง การเชื่อมโยงฐานข้อมูล หรือโครงสร้าง โครงสร้างข้อมูลยังทำให้การวิเคราะห์ง่ายขึ้นด้วย AI และการเรียนรู้ของเครื่อง
จุดประสงค์อีกประการหนึ่งของโครงสร้างข้อมูลคือเพื่ออำนวยความสะดวกในการพัฒนาแอปพลิเคชัน เนื่องจากสร้างแบบจำลองทั่วไปสำหรับการเข้าถึงข้อมูลที่แยกจากแอปพลิเคชันดั้งเดิมและไซโลฐานข้อมูล โมเดลเหล่านี้ช่วยให้เข้าถึงข้อมูลได้ดีขึ้น แต่ยังปรับปรุงประสิทธิภาพด้วยการสร้างชั้นเดียวที่สามารถจัดการการเข้าถึงข้อมูลได้จากทรัพยากรทั้งหมด
แม้ว่าจะไม่มีสถาปัตยกรรมข้อมูลเดียวสำหรับแฟบริคข้อมูล แต่ก็มักกล่าวกันว่ามีองค์ประกอบพื้นฐาน XNUMX ส่วนสำหรับเฟรมเวิร์กข้อมูลประเภทนี้:
การจัดการข้อมูล: รับผิดชอบด้านการกำกับดูแลข้อมูลและความปลอดภัยของข้อมูล
การนำเข้าข้อมูล: นำข้อมูลระบบคลาวด์มารวมกันและระบุการเชื่อมต่อระหว่างข้อมูลที่มีโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง
การประมวลผล: ปรับแต่งข้อมูลเพื่อให้แน่ใจว่าเฉพาะข้อมูลที่เกี่ยวข้องเท่านั้นที่แสดงสำหรับการดึงข้อมูล
การประสานข้อมูล: เลเยอร์ที่สำคัญจริงๆ ของเฟรมเวิร์กที่รับผิดชอบในการแปลง ผสานรวม และล้างข้อมูลเพื่อให้สามารถใช้กับธุรกิจได้
การค้นพบข้อมูล: แสดงวิธีการใหม่ในการรวมแหล่งข้อมูล
การเข้าถึงข้อมูล: เปิดใช้งานการใช้ข้อมูล รับรองการอนุญาตที่ถูกต้องสำหรับบางทีมในการปฏิบัติตามกฎระเบียบ และช่วยแสดงข้อมูลที่เกี่ยวข้องผ่านการใช้แดชบอร์ดและเครื่องมือการแสดงข้อมูลอื่นๆ
ประโยชน์ของ Data Fabric
Data Fabric มีประโยชน์ทางธุรกิจและทางเทคนิคมากมาย เช่น:
ทำลายไซโลข้อมูล: ธุรกิจสมัยใหม่มักประสบกับปัญหาไซโลข้อมูล เนื่องจากฐานข้อมูลสมัยใหม่เชื่อมโยงกับกลุ่มแอปพลิเคชัน และมักจะเติบโตเมื่อมีการเพิ่มฐานข้อมูลใหม่เข้าไปในองค์กร ไซโลข้อมูลเก็บข้อมูลที่มีโครงสร้างและรูปแบบต่างกัน แต่โครงสร้างข้อมูลสามารถปรับปรุงการเข้าถึงข้อมูลขององค์กรและใช้ข้อมูลที่รวบรวมเพื่อปรับปรุงประสิทธิภาพการดำเนินงาน
รวมฐานข้อมูล: โครงสร้างข้อมูลยังช่วยให้บริษัทรวมฐานข้อมูลที่กระจายอยู่ทั่วพื้นที่ขนาดใหญ่ พวกเขาทำให้แน่ใจว่าความแตกต่างของตำแหน่งไม่ส่งผลให้เกิดอุปสรรคในการเข้าถึง โครงสร้างข้อมูลทำให้การพัฒนาแอปพลิเคชันง่ายขึ้นและสามารถใช้เพื่อเพิ่มประสิทธิภาพการใช้ข้อมูลแอปพลิเคชันเฉพาะโดยไม่ทำให้แอปพลิเคชันอื่นเข้าถึงข้อมูลได้น้อยลง พวกเขายังสามารถรวมข้อมูลที่ย้ายไปไว้ในไซโลแล้ว
ทางเดียวในการเข้าถึงข้อมูล: โครงสร้างข้อมูลช่วยปรับปรุงความสามารถในการพกพาของแอปพลิเคชันและทำหน้าที่เป็นช่องทางเดียวในการเข้าถึงข้อมูลทั้งในระบบคลาวด์และศูนย์ข้อมูล
สร้างข้อมูลเชิงลึกด้วยอัตราเร่ง: โซลูชัน Data Fabric สามารถจัดการชุดข้อมูลที่ซับซ้อนได้อย่างง่ายดาย ซึ่งช่วยเร่งเวลาในการทำความเข้าใจ สถาปัตยกรรมของพวกเขาช่วยให้โมเดลการวิเคราะห์ที่สร้างไว้ล่วงหน้าและอัลกอริธึมการรับรู้เพื่อประมวลผลข้อมูลตามขนาดและความเร็ว
ใช้โดยผู้ใช้ด้านเทคนิคและไม่ใช่ด้านเทคนิค: โครงสร้างข้อมูลไม่ได้มุ่งเป้าไปที่ผู้ใช้ด้านเทคนิคเท่านั้น สถาปัตยกรรมมีความยืดหยุ่นและสามารถใช้กับอินเทอร์เฟซผู้ใช้ที่หลากหลาย พวกเขาสามารถช่วยสร้างแดชบอร์ดที่ผู้บริหารธุรกิจสามารถเข้าใจได้ หรือเครื่องมือที่ซับซ้อนสามารถใช้สำหรับการสำรวจข้อมูลโดยนักวิทยาศาสตร์ข้อมูล
แนวทางปฏิบัติที่ดีที่สุดสำหรับการนำ Data Fabric ไปใช้
ตลาดข้อมูลทั่วโลกมีการขยายตัวอย่างต่อเนื่อง และมีความต้องการอย่างมากในด้านนี้ หลายบริษัทต้องการใช้สถาปัตยกรรมข้อมูลเพื่อเพิ่มประสิทธิภาพข้อมูลองค์กรของตน และปฏิบัติตามแนวทางปฏิบัติที่ดีที่สุดทั่วไป
แนวทางปฏิบัติอย่างหนึ่งคือการยอมรับโมเดลกระบวนการ DataOps โครงสร้างข้อมูลและ DataOps ไม่เหมือนกัน แต่ตามแบบจำลอง DataOps มีการเชื่อมต่ออย่างใกล้ชิดระหว่างกระบวนการข้อมูล เครื่องมือ และผู้ใช้ การจัดตำแหน่งให้ผู้ใช้พึ่งพาข้อมูล พวกเขาสามารถใช้ประโยชน์จากเครื่องมือและใช้ข้อมูลเชิงลึกได้ หากไม่มีโมเดล DataOps ผู้ใช้สามารถพยายามดึงข้อมูลจากโครงสร้างข้อมูลได้เพียงพอ
แนวทางปฏิบัติที่ดีที่สุดอีกประการหนึ่งคือการหลีกเลี่ยงการเปลี่ยนโครงสร้างข้อมูลให้เป็นเพียงที่เก็บข้อมูลสำรองอื่น ซึ่งเป็นเหตุการณ์ทั่วไป ตัวอย่างเช่น โครงสร้างข้อมูลที่แท้จริงไม่สามารถทำได้หากคุณมีส่วนประกอบทางสถาปัตยกรรมทั้งหมด เช่น แหล่งข้อมูลและการวิเคราะห์ แต่ไม่มี API และ SDK โครงสร้างข้อมูลหมายถึงการออกแบบสถาปัตยกรรม ไม่ใช่เทคโนโลยีเดียว และลักษณะเฉพาะบางประการของสถาปัตยกรรมคือความสามารถในการทำงานร่วมกันระหว่างส่วนประกอบต่างๆ และความพร้อมในการผสานรวม
สิ่งสำคัญสำหรับองค์กรในการทำความเข้าใจการปฏิบัติตามข้อกำหนดและข้อกำหนดด้านกฎระเบียบ สถาปัตยกรรมโครงสร้างข้อมูลสามารถปรับปรุงความปลอดภัย การกำกับดูแล และการปฏิบัติตามกฎระเบียบได้
เนื่องจากข้อมูลไม่ได้กระจัดกระจายไปตามระบบ การเปิดเผยข้อมูลที่ละเอียดอ่อนจึงมีความเสี่ยงน้อยกว่า จากที่กล่าวมา สิ่งสำคัญคือต้องเข้าใจการปฏิบัติตามข้อกำหนดและข้อบังคับก่อนที่จะนำโครงสร้างข้อมูลไปใช้ ประเภทข้อมูลที่แตกต่างกันอาจอยู่ภายใต้เขตอำนาจศาลที่แตกต่างกัน ทางออกหนึ่งคือการใช้นโยบายการปฏิบัติตามอัตโนมัติเพื่อให้แน่ใจว่าการแปลงข้อมูลเป็นไปตามกฎหมาย
กรณีการใช้งานดาต้าแฟบริค
มีการใช้ดาต้าแฟบริคที่แตกต่างกันมากมาย แต่มีบางส่วนที่ใช้กันทั่วไป ตัวอย่างทั่วไปอย่างหนึ่งคือการรวบรวมเสมือน/เชิงตรรกะของสินทรัพย์ข้อมูลที่หลากหลายทางภูมิศาสตร์เพื่ออำนวยความสะดวกในการเข้าถึงและการวิเคราะห์ โครงสร้างข้อมูลมักใช้สำหรับการจัดการธุรกิจแบบรวมศูนย์ในกรณีนี้ เนื่องจากการดำเนินการแบบกระจายสายที่รวบรวมและใช้ข้อมูลได้รับการสนับสนุนผ่านแอปพลิเคชันแบบดั้งเดิมและอินเทอร์เฟซการเข้าถึงข้อมูล/การสืบค้น จึงมีจำนวนมากที่จะได้รับจากองค์กรที่มีการแบ่งส่วนกิจกรรมในระดับภูมิภาคหรือระดับประเทศ องค์กรเหล่านี้มักต้องการการจัดการและการประสานงานจากส่วนกลาง
กรณีการใช้งานที่สำคัญอีกประการหนึ่งสำหรับโครงสร้างข้อมูลคือการสร้างแบบจำลองข้อมูลที่รวมเป็นหนึ่งหลังจากการควบรวมหรือซื้อกิจการ เมื่อสิ่งเหล่านี้เกิดขึ้น ฐานข้อมูลและนโยบายการจัดการข้อมูลขององค์กรอิสระก่อนหน้านี้มักจะเปลี่ยนแปลง หมายความว่าการรวบรวมข้อมูลข้ามขอบเขตขององค์กรจะทำได้ยากขึ้น โครงสร้างข้อมูลสามารถเอาชนะสิ่งนี้ได้โดยการสร้างมุมมองรวมของข้อมูลที่ช่วยให้เอนทิตีที่รวมกันสามารถประสานกันในรูปแบบข้อมูลเดียว
Alex McFarland เป็นนักข่าวและนักเขียนด้าน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมมือกับสตาร์ทอัพด้าน AI และสิ่งพิมพ์ต่างๆ มากมายทั่วโลก
คุณอาจชอบ
ข้อมูลขนาดใหญ่เทียบกับข้อมูลขนาดเล็ก: ความแตกต่างที่สำคัญ
วิทยาศาสตร์ข้อมูลกับวิทยาการคอมพิวเตอร์: ความแตกต่างที่สำคัญ
วิทยาศาสตร์ข้อมูลกับการขุดข้อมูล: ความแตกต่างที่สำคัญ
การเรียนรู้เชิงลึกกับโครงข่ายประสาทเทียม
การเรียนรู้ของเครื่องเทียบกับวิทยาศาสตร์ข้อมูล: ความแตกต่างที่สำคัญ
การเรียนรู้ของเครื่องเทียบกับปัญญาประดิษฐ์: ความแตกต่างที่สำคัญ