stub Хийх хандлага нь таны AI/ML стратегийг хэрхэн устгах вэ, энэ талаар юу хийх вэ - Unite.AI
бидэнтэй хамт холбоно

Бодлын удирдагчид

Хийх хандлага нь таны AI/ML стратегийг хэрхэн устгах вэ, энэ талаар юу хийх вэ?

mm

Нийтэлсэн

 on

Ямар ч төрлийн загвар дахь "хэвийн" гэдэг нь үнэн зөв хариулт өгөхийн тулд хангалттай өндөр чанартай, олон төрлийн өгөгдөлд сургагдаагүй тул загвар нь сануулга эсвэл оролтын өгөгдөлд буруу хариу үйлдэл үзүүлэх нөхцөл байдлыг тодорхойлдог. Нэг жишээ болно Apple-ийн нүүр царай таних утасны түгжээг тайлах онцлог нь цайвар өнгөтэй биш харин бараан арьстай хүмүүст хамаагүй өндөр амжилтгүй болсон. Загвар өмсөгч нь бараан арьстай хүмүүсийн зургийг хангалттай сургаж амжаагүй байжээ. Энэ нь хэвийх хандлага харьцангуй бага эрсдэлтэй жишээ байсан ч ЕХ-ны хиймэл оюун ухааны тухай хуульд зах зээлд гарахаас өмнө загварын үр нөлөөг (болон хяналтыг) нотлох шаардлагыг тавьсан нь яг ийм шалтгаан болсон юм. Бизнес, санхүү, эрүүл мэнд, хувийн нөхцөл байдалд нөлөөлөх үр дүн бүхий загваруудад итгэлтэй байх ёстой, эс тэгвээс тэдгээрийг ашиглахгүй.

Өгөгдлийн тусламжтайгаар гажуудалтай тэмцэх

Их хэмжээний өндөр чанартай өгөгдөл

Өгөгдлийн менежментийн олон чухал туршлагуудын дунд a AI/ML загваруудын хэвийх байдлыг даван туулах, багасгах гол бүрэлдэхүүн хэсэг нь их хэмжээний өндөр чанартай, олон төрлийн өгөгдлийг олж авах явдал юм.. Үүний тулд ийм өгөгдөлтэй олон байгууллагатай хамтран ажиллах шаардлагатай. Уламжлал ёсоор өгөгдөл олж авах, хамтран ажиллах нь нууцлал ба/эсвэл IP хамгаалалтын асуудалтай тулгардаг-эмзэг мэдээллийг загвар эзэмшигчид илгээх боломжгүй бөгөөд загвар эзэмшигч нь IP хаягаа өгөгдөл эзэмшигч рүү дамжуулах эрсдэлгүй. Түгээмэл шийдэл бол хуурамч эсвэл синтетик өгөгдөлтэй ажиллах явдал бөгөөд энэ нь ашигтай байж болох ч бодит, бүрэн контекст өгөгдлийг ашиглахтай харьцуулахад хязгаарлалттай байдаг. Нууцлалыг сайжруулдаг технологиуд (PETs) нэн шаардлагатай хариултуудыг өгдөг газар юм.

Синтетик өгөгдөл: Хаах, гэхдээ бүрэн биш

Синтетик өгөгдөл бодит өгөгдлийг дуурайх зорилгоор зохиомлоор үүсгэгддэг. Үүнийг хийхэд хэцүү ч AI хэрэгслүүдийн тусламжтайгаар арай хялбар болно. Сайн чанарын синтетик өгөгдөл нь бодит өгөгдөлтэй ижил зайтай байх ёстой, эс тэгвээс энэ нь ашиггүй болно. Чанартай синтетик өгөгдлийг жижиг, хязгаарлагдмал популяци эсвэл AI үйлчилгээ үзүүлэгчид хангалттай мэдээлэлгүй байгаа популяцийн цоорхойг нөхөх замаар сургалтын мэдээллийн олон талт байдлыг үр дүнтэй нэмэгдүүлэхэд ашиглаж болно. Синтетик өгөгдлийг бодит ертөнцөд хангалттай хэмжээгээр олоход хэцүү байж болох захын тохиолдлуудыг шийдвэрлэхэд ашиглаж болно. Нэмж дурдахад, байгууллагууд бодит өгөгдөлд хандах хандалтыг хаадаг мэдээллийн оршин суух болон нууцлалын шаардлагыг хангахын тулд синтетик мэдээллийн багц үүсгэж болно. Энэ гайхалтай сонсогдож байна; Гэсэн хэдий ч синтетик өгөгдөл нь шийдэл биш харин тааварын нэг хэсэг юм.

Синтетик өгөгдлийн тодорхой хязгаарлалтуудын нэг бол бодит ертөнцөөс салгах явдал юм. Жишээлбэл, зөвхөн синтетик өгөгдөл дээр сургагдсан бие даасан тээврийн хэрэгсэл нь бодит, урьдчилан тооцоолоогүй замын нөхцөл байдалтай тэмцэнэ. Нэмж дурдахад, синтетик өгөгдөл нь түүнийг үүсгэхэд ашигласан бодит ертөнцийн өгөгдлөөс хазайлтыг өвлөн авдаг бөгөөд энэ нь бидний хэлэлцүүлгийн зорилгыг бараг үгүйсгэдэг. Дүгнэж хэлэхэд, синтетик өгөгдөл нь нарийн тааруулах, захын тохиолдлуудыг шийдвэрлэхэд ашигтай сонголт боловч загварын үр ашгийг мэдэгдэхүйц сайжруулж, хэвийх байдлыг багасгах нь бодит ертөнцийн өгөгдөлд хандахад тулгуурладаг.

Илүү сайн арга: PET-ийг идэвхжүүлсэн ажлын урсгалаар дамжуулан бодит өгөгдөл

PET нь ашиглалтын явцад өгөгдлийг хамгаалдаг. AI/ML загваруудын тухайд тэд мөн ажиллуулж буй загварын IP-ийг хамгаалж чадна - "хоёр шувуу, нэг чулуу". PET ашигладаг шийдлүүд нь өгөгдлийн нууцлал, аюулгүй байдлын асуудлаас болж урьд өмнө нэвтэрч байгаагүй бодит, эмзэг мэдээллийн багц дээр загваруудыг сургах боломжийг олгодог. Бодит өгөгдөл рүү өгөгдлийн урсгалын түгжээг тайлах нь хэвийх байдлыг багасгах хамгийн сайн сонголт юм. Гэхдээ энэ нь үнэндээ яаж ажиллах вэ?

Одоогоор тэргүүлэх сонголтууд нь нууц тооцооллын орчноос эхэлж байна. Дараа нь стандарт итгэмжлэгдсэн гүйцэтгэлийн орчинд (TEE) ороогүй өгөгдлийн засаглал, аюулгүй байдлын шаардлагуудыг шийдвэрлэхийн зэрэгцээ PETs-д суурилсан програм хангамжийн шийдэлтэй нэгтгэх болно. Энэхүү шийдлийн тусламжтайгаар загвар болон өгөгдлийг аюулгүй тооцоолох орчинд илгээхээс өмнө бүгдийг шифрлэдэг. Хүрээлэн буй орчныг хаана ч байрлуулж болох бөгөөд энэ нь өгөгдлийг нутагшуулах тодорхой шаардлагыг шийдвэрлэхэд чухал юм. Энэ нь тооцооллын явцад загварын IP болон оролтын өгөгдлийн аюулгүй байдлыг хангана гэсэн үг бөгөөд итгэмжлэгдсэн гүйцэтгэлийн орчны үйлчилгээ үзүүлэгч хүртэл түүний доторх загвар эсвэл өгөгдөлд хандах эрхгүй байдаг. Дараа нь шифрлэгдсэн үр дүнг хянаж үзэхээр буцааж илгээж, бүртгэлийг хянах боломжтой.

Энэ урсгал нь хаана ч байсан, хэнд байгаа ч хамаагүй хамгийн сайн чанарын өгөгдлийг нээж, бидний итгэж болохуйц хэвийх утгыг багасгах, өндөр үр ашигтай загвар гаргах замыг бий болгодог. Энэхүү урсгал нь ЕХ-ны хиймэл оюун ухааны тухай хуульд AI зохицуулалтын хамгаалагдсан хязгаарлагдмал орчинд тавигдах шаардлагуудыг тодорхойлсон зүйл юм.

Ёс зүй, хууль тогтоомжийг дагаж мөрдөхөд дэмжлэг үзүүлэх

Чанартай, бодит мэдээлэл олж авах нь хэцүү байдаг. Өгөгдлийн нууцлал болон нутагшуулах шаардлага нь байгууллагуудын хандах боломжтой мэдээллийн багцыг нэн даруй хязгаарладаг. Инноваци, өсөлтийг бий болгохын тулд өгөгдөл түүнээс үнэ цэнийг гаргаж чадах хүмүүст урсах ёстой.

ЕХ-ны хиймэл оюун ухааны тухай хуулийн 54-р зүйлд "өндөр эрсдэлтэй" загварын төрлүүдийг зах зээлд гаргахаас өмнө юуг нотлох шаардлагатайг заасан байдаг. Товчхондоо, багууд доторх бодит ертөнцийн өгөгдлийг ашиглах шаардлагатай болно AI зохицуулалтын хамгаалагдсан хязгаарлагдмал орчин Гарчиг III Бүлэг 2-т дэлгэрэнгүй тайлбарласан бүх хяналтыг хангалттай загварын үр дүнтэй, дагаж мөрдөхийг харуулах. Хяналтад хяналт, ил тод байдал, тайлбарлах боломжтой байдал, өгөгдлийн аюулгүй байдал, өгөгдлийн хамгаалалт, өгөгдлийг багасгах, загварын хамгаалалт багтана- DevSecOps + Data Ops гэж бодоорой.

Эхний сорилт бол ашиглах бодит өгөгдлийн багцыг олох явдал юм – учир нь энэ нь ийм загварын төрлүүдийн хувьд угаасаа эмзэг өгөгдөл юм. Техникийн баталгаа байхгүй бол олон байгууллага загвар үйлчилгээ үзүүлэгчдээ өгөгдөлдөө итгэхээс эргэлзэж магадгүй эсвэл үүнийг зөвшөөрөхгүй. Нэмж дурдахад, уг акт нь "AI зохицуулалтын хамгаалагдсан хязгаарлагдмал орчин"-ыг тодорхойлсон арга нь өөрөө сорилт юм. Зарим шаардлагууд нь загварыг ажиллуулсны дараа өгөгдлийг системээс устгах баталгаа, түүнийг нотлох засаглалын хяналт, хэрэгжилт, тайлагнах зэрэг орно.

Олон байгууллага бэлэн өгөгдөл цэвэр өрөө (DCR) болон найдвартай гүйцэтгэлийн орчин (TEE) ашиглахыг оролдсон. Гэхдээ эдгээр технологиуд нь дангаараа их хэмжээний туршлага шаарддаг бөгөөд өгөгдөл болон хиймэл оюун ухааны зохицуулалтын шаардлагыг хангах, ажиллуулахын тулд ажилладаг.
DCR нь ашиглахад илүү хялбар боловч AI/ML-ийн илүү бат бөх хэрэгцээнд хараахан ашиггүй байна. TEE нь найдвартай серверүүд бөгөөд ашигтай, хурдан байхын тулд нэгдсэн хамтын ажиллагааны платформ шаардлагатай хэвээр байна. Гэсэн хэдий ч энэ нь нууцлалыг сайжруулах технологийн платформуудыг TEE-тэй нэгтгэж, уг ажлыг арилгах, хиймэл оюун ухааны зохицуулалтын хамгаалагдсан хязгаарлагдмал орчинг тохируулах, ашиглах, улмаар эмзэг мэдээллийг олж авах, ашиглах боломжийг тодорхойлж байна.

Нууцлалыг хамгаалах үүднээс илүү олон төрлийн, иж бүрэн өгөгдлийн багцыг ашиглах боломжийг олгосноор эдгээр технологи нь хиймэл оюун ухаан болон ML-ийн үйл ажиллагаа нь мэдээллийн нууцлалтай холбоотой ёс зүйн стандарт, хууль эрх зүйн шаардлагад нийцэж байгаа эсэхийг баталгаажуулахад тусалдаг (жишээлбэл, Европ дахь GDPR болон ЕХ-ны AI-ийн тухай хууль). Дүгнэж хэлэхэд, шаардлага нь ихэвчлэн дуугарах, санаа алдах зэргээр хангагддаг ч эдгээр шаардлагууд нь загвар боловсруулахад ашигласан өгөгдлийн субьектүүдийн нууцлалыг хамгаалахын зэрэгцээ өгөгдөлд тулгуурласан чухал шийдвэр гаргахад итгэж, найдаж болох илүү сайн загваруудыг бүтээхэд биднийг чиглүүлж байна. болон тохируулга.

Ади Хирштейн бол бүтээгдэхүүний дэд захирал юм Хоёрдмол технологи. Ади нь үндсэндээ өгөгдөл болон хиймэл оюун ухааны салбарт B20B стартапуудад төвлөрсөн технологийн компаниудад гүйцэтгэх захирал, бүтээгдэхүүний менежер, бизнес эрхлэгчээр 2 гаруй жилийн туршлагыг бий болгож, инновацийг удирдан чиглүүлдэг. Duality-ээс өмнө Ади McKinsey-ийн худалдаж авсан Iguazio (MLOps компани)-д бүтээгдэхүүн хариуцсан дэд захирлаар ажиллаж байсан ба түүнээс өмнө Zettapoint (Мэдээллийн сан ба хадгалалтын компани) нэртэй өөр нэг стартапыг худалдан авсны дараа EMC-д бүтээгдэхүүн хариуцсан захирлаар ажиллаж байсан. Бүтээгдэхүүнийг анхнаас нь зах зээлд нэвтэрч, өсөлтөд хүргэсэн бүтээгдэхүүний дэд захирал.