tunggul Kumaha Bias Bakal Maéhan Strategi AI/ML Anjeun sareng Naon Anu Dipigawe Ngeunaan Éta - Unite.AI
Connect with kami

Panginten Pamingpin

Kumaha Bias Bakal Maéhan Strategi AI/ML Anjeun sareng Naon Anu Kudu Dilakukeun Ngeunaan Éta

mm

dimuat

 on

'Bias' dina modél naon waé jinis ngajelaskeun kaayaan dimana modél éta ngaréspon teu akurat kana ajakan atanapi input data sabab teu acan dilatih kalayan data anu cukup kualitas luhur, rupa-rupa pikeun masihan réspon anu akurat. Hiji conto bakal jadi Fitur muka konci telepon pangenal wajah Apple, anu gagal dina tingkat anu langkung luhur pikeun jalma anu kulitna langkung poék tibatan nada anu langkung terang. Modélna henteu acan dilatih dina gambar anu cukup pikeun jalma anu kulitna poék. Ieu mangrupikeun conto bias anu rélatif-resiko rendah tapi leres-leres naha UU AI EU parantos nyayogikeun syarat pikeun ngabuktikeun efficacy modél (sareng kadali) sateuacan angkat ka pasar. Model sareng kaluaran anu mangaruhan bisnis, kauangan, kaséhatan, atanapi kaayaan pribadi kedah dipercaya, atanapi moal dianggo.

Tackling bias jeung Data

Jilid ageung Data Kualitas Luhur

Di antara loba prakték manajemén data penting, a Komponén konci pikeun ngatasi sareng ngaminimalkeun bias dina modél AI / ML nyaéta kéngingkeun volume ageung data anu rupa-rupa, kualitas luhur.. Ieu peryogi kolaborasi sareng sababaraha organisasi anu gaduh data sapertos kitu. Sacara tradisional, akuisisi data sareng kolaborasi ditantang ku privasi sareng / atanapi masalah panyalindungan IP-data sénsitip henteu tiasa dikirim ka nu gaduh modél, sareng nu gaduh modél teu tiasa risiko bocor IP-na ka nu gaduh data. A workaround umum nyaéta pikeun digawe sareng data bohongan atawa sintétik, nu bisa jadi mangpaat tapi ogé mibanda watesan dibandingkeun ngagunakeun nyata, data pinuh-kontéks. Ieu dimana téknologi ningkatkeun privasi (PET) nyayogikeun jawaban anu diperyogikeun.

Data sintétik: Tutup, tapi henteu Cukup

Data sintétik dihasilkeun sacara artifisial pikeun niru data nyata. Ieu sesah dilakukeun tapi janten rada gampang sareng alat AI. Data sintétik anu kualitasna saé kedah gaduh jarak fitur anu sami sareng data nyata, atanapi éta moal aya mangpaatna. Data sintétik anu berkualitas tiasa dianggo pikeun sacara efektif ningkatkeun karagaman data pelatihan ku cara ngeusian celah pikeun populasi anu langkung alit, terpinggirkan, atanapi pikeun populasi anu panyadia AI ngan saukur teu gaduh data anu cekap. Data sintétik ogé tiasa dianggo pikeun ngungkulan pasualan-pasualan anu hese dipendakan dina jilid anu nyukupan di dunya nyata. Salaku tambahan, organisasi tiasa ngahasilkeun set data sintétik pikeun nyugemakeun karésidénan data sareng syarat privasi anu ngahalangan aksés kana data nyata. Ieu hurung hébat; kumaha oge, data sintétik téh ngan sapotong teka nu, teu solusi.

Salah sahiji watesan atra tina data sintétik nyaéta pegatkeun sambungan ti dunya nyata. Contona, kandaraan otonom dilatih solely on data sintétik bakal bajoang jeung nyata, kaayaan jalan teu kaduga. Sajaba ti, data sintétik inherits bias ti data dunya nyata dipaké pikeun ngahasilkeun eta-geulis ngéléhkeun tujuan diskusi urang. Dina kacindekan, data sintétik mangrupakeun pilihan mangpaat pikeun fine tuning jeung alamat kasus ujung, tapi perbaikan signifikan dina efficacy model jeung minimization bias masih ngandelkeun kana ngakses data dunya nyata.

Cara anu Langkung Saé: Data Nyata via Alur Kerja anu diaktipkeun PETs

PET ngajaga data nalika dianggo. Nalika datang ka model AI/ML, aranjeunna ogé tiasa ngajagi IP tina modél anu dijalankeun - "dua manuk, hiji batu." Solusi anu ngagunakeun PETs nyayogikeun pilihan pikeun ngalatih modél dina set data anu sénsitip anu saacanna henteu tiasa diaksés kusabab masalah privasi sareng kaamanan data. Ieu muka konci dataflows kana data nyata mangrupa pilihan pangalusna pikeun ngurangan bias. Tapi kumaha sabenerna bakal dianggo?

Pikeun ayeuna, pilihan utama dimimitian ku lingkungan komputasi rahasia. Teras, integrasi sareng solusi parangkat lunak dumasar PETs anu ngajantenkeun éta siap dianggo di luar kotak bari ngémutan pamaréntahan data sareng syarat kaamanan anu henteu kalebet dina lingkungan palaksanaan dipercaya standar (TEE). Kalayan solusi ieu, modél sareng data sadayana énkripsi sateuacan dikirim ka lingkungan komputasi anu aman. Lingkungan tiasa di-host di mana waé, anu penting nalika nyayogikeun syarat lokalisasi data anu tangtu. Ieu ngandung harti yén modél IP sareng kaamanan data input dijaga salami komputasi - bahkan panyadia lingkungan palaksanaan anu dipercaya ngagaduhan aksés kana modél atanapi data di jerona. Hasil énkripsi lajeng dikirim deui pikeun review sarta log sadia pikeun review.

Aliran ieu muka konci data kualitas pangalusna euweuh urusan dimana éta atawa anu boga eta, nyieun jalur pikeun bias minimization jeung model-efficacy tinggi urang tiasa percanten. Aliran ieu ogé anu dijelaskeun ku EU AI Act dina syaratna pikeun kotak pasir pangaturan AI.

Facilitating Etika jeung Hukum minuhan

Acquiring kualitas alus, data nyata tangguh. Privasi data sareng syarat lokalisasi langsung ngabatesan set data anu tiasa diaksés ku organisasi. Pikeun inovasi sareng kamekaran lumangsung, data kedah ngalir ka jalma anu tiasa nimba nilaina.

Seni 54 UU AI EU nyayogikeun syarat pikeun jinis modél "resiko tinggi" dina hal anu kedah dibuktikeun sateuacan aranjeunna tiasa dibawa ka pasar. Pondokna, tim kedah nganggo data dunya nyata di jero hiji AI Regulasi Sandbox pikeun mintonkeun efficacy model cukup jeung patuh kana sagala kadali wincikan dina Judul III Bab 2. Kadali kaasup monitoring, transparansi, explainability, kaamanan data, panyalindungan data, minimization data, jeung panyalindungan model–pikir DevSecOps + Data Ops.

Tangtangan anu munggaran nyaéta milarian data dunya nyata anu bakal dianggo-sabab ieu mangrupikeun data anu sénsitip pikeun jinis modél sapertos kitu. Tanpa jaminan téknis, seueur organisasi tiasa ragu percanten ka panyadia modél datana atanapi moal diidinan ngalakukeunana. Salaku tambahan, cara polah ngahartikeun "Kotak Keusik Regulasi AI" mangrupikeun tantangan sorangan. Sababaraha sarat kalebet jaminan yén data dipiceun tina sistem saatos modél dijalankeun ogé kontrol pamaréntahan, penegak, sareng ngalaporkeun pikeun ngabuktikeunana.

Seueur organisasi anu nyobian nganggo kamar bersih data luar kotak (DCR) sareng lingkungan palaksanaan anu dipercaya (TEE). Tapi, sorangan, téknologi ieu butuh kaahlian anu penting sareng damel pikeun ngaoperasionalkeun sareng nyumponan data sareng syarat pangaturan AI.
DCR langkung gampang dianggo, tapi henteu acan kapaké pikeun kabutuhan AI / ML anu langkung kuat. TEEs mangrupikeun server anu aman sareng masih peryogi platform kolaborasi terpadu pikeun mangpaat, gancang. Nanging, ieu nunjukkeun kasempetan pikeun platform téknologi ningkatkeun privasi pikeun ngahijikeun sareng TEEs pikeun ngaleungitkeun padamelan éta, trivializing setelan sareng panggunaan kotak pasir pangaturan AI, sareng ku kituna, akuisisi sareng panggunaan data sénsitip.

Ku ngamungkinkeun pamakéan set data nu leuwih rupa-rupa tur komprehensif ku cara ngajaga privasi, téknologi ieu mantuan mastikeun yén prakték AI jeung ML luyu jeung standar etika jeung sarat hukum nu patali jeung privasi data (misalna GDPR jeung EU AI Act di Éropa). Kasimpulanana, samentawis syarat-syarat sering dicumponan ku grunts anu karungu sareng kerung, sarat ieu ngan saukur nungtun urang pikeun ngawangun modél anu langkung saé anu tiasa urang percanten sareng diandelkeun pikeun nyieun kaputusan anu didorong ku data anu penting bari ngajagaan privasi subjek data anu dianggo pikeun pamekaran modél. jeung kustomisasi.

Adi Hirschtein nyaéta VP produk di Duality Technologies. Adi nyangking pangalaman langkung ti 20 taun salaku eksekutif, manajer produk sareng gedong wirausaha sareng nyetir inovasi di perusahaan téknologi anu utamina difokuskeun kana ngamimitian B2B dina widang data sareng AI. Sateuacan Duality, Adi janten VP produk pikeun Iguazio (perusahaan MLOps) anu diaku ku McKinsey sareng sateuacanna anjeunna janten Diréktur produk di EMC saatos akuisisi ngamimitian anu sanés disebut Zettapoint (Pausahaan Database sareng Panyimpenan) dimana anjeunna dilayanan. salaku VP produk ngarah produk ti mimiti ka penetrasi pasar jeung tumuwuhna.