stuacach Meastachán Seasamh AI san Feidhmchlár Aclaíochta - Unite.AI
Ceangail le linn

Cúram Sláinte

Meastachán Suímh AI i bhFeidhm Aclaíochta

mm

foilsithe

 on

Le Maksym Tatariants, Innealtóir Eolaíochta Sonraí ag MobiDev.

Tagraíonn meastachán ar staid an duine do theicneolaíocht - measartha nua, ach ag forbairt go tapa - a bhfuil ról suntasach aici i bhfeidhmchláir folláine agus rince, a ligeann dúinn ábhar digiteach a chur ar fud an domhain fíor.

I mbeagán focal, is é an coincheap de mheastachán staid an duine ná teicneolaíocht fís-bhunaithe ríomhaire atá in ann staidiúir dhaonna a bhrath agus a phróiseáil. Is é an chuid is tábhachtaí agus lárnach den teicneolaíocht seo samhaltú gcorp an duine. Tá trí mhúnla coirp is suntasaí laistigh de na córais reatha meastacháin staidiúir – cnámharlach, comhrian-bhunaithe, agus toirt-bhunaithe.

Múnla atá bunaithe ar chnámharlach

Tá an tsamhail seo comhdhéanta de shraith hailt (eochairphointí), mar shampla glúine, rúitíní, chaol na láimhe, uillinn, guaillí, agus treoshuíomh géaga an chomhlachta. Tá an tsamhail seo suntasach mar gheall ar a solúbthacht, agus mar sin tá sé oiriúnach do mheastachán tríthoiseach agus 3thoiseach staidiúir an duine. Le samhaltú 2thoiseach, úsáideann an réiteach íomhá RGB agus aimsíonn sé comhordanáidí X, Y, agus Z na n-alt. Le samhaltú déthoiseach, is é an anailís chéanna ar íomhá RGB, ach na comhordanáidí X agus Y a úsáid.

Múnla comhrian-bhunaithe

Úsáideann an tsamhail seo comhrianta torso agus géaga an chomhlachta, chomh maith lena leithead garbh. Anseo, glacann an réiteach scáthchruth an fhráma coirp agus rindreálann sé páirteanna coirp mar dhronuilleoga agus teorainneacha laistigh den chreat sin.

Múnla Toir-bhunaithe

Go ginearálta úsáideann an tsamhail seo sraith de scanadh 3-tríthoiseach chun cruth an choirp a ghabháil agus a thiontú ina chreat de chruthanna agus de mhogalra geoiméadracha. Cruthaíonn na cruthanna seo sraith 3D de chásanna agus de léirithe coirp.

Conas a Oibríonn Meastachán Staid Daonna 3D

Is gnách go mbíonn feidhmchláir aclaíochta ag brath ar mheastachán tríthoiseach staidiúir an duine. I gcás na n-aipeanna seo, is amhlaidh is fearr an t-eolas ar staidiúir an duine. Leis an teicníc seo, taifeadfaidh úsáideoir na haipe iad féin a bheith rannpháirteach i ngnáthamh aclaíochta nó aclaíochta. Déanfaidh an app anailís ansin ar ghluaiseachtaí coirp an úsáideora, ag tairiscint ceartúcháin ar bhotúin nó míchruinneas.

Is gnách go leanann sreabhchairt den chineál seo aip an patrún seo:

  • Ar dtús, bailigh sonraí ar ghluaiseachtaí an úsáideora agus iad i mbun an chleachtaidh.
  • Ansin, cinntigh cé chomh cruinn nó mícheart a bhí gluaiseachtaí an úsáideora.
  • Ar deireadh, taispeáin don úsáideoir tríd an gcomhéadan cad iad na botúin a d'fhéadfadh a bheith déanta acu.

Faoi láthair, is é an caighdeán i dteicneolaíocht staidiúir an duine topology COCO. Tá topology COCO comhdhéanta de 17 sainchomhartha ar fud an choirp, ón aghaidh go dtí na lámha go dtí na cosa. Tabhair faoi deara nach é COCO an t-aon chreat staidiúir do chorp an duine, go díreach an ceann is coitianta a úsáidtear.

Go hiondúil baineann an cineál próisis seo úsáid as teicneolaíocht domhain meaisínfhoghlama chun hailt a bhaint amach chun staidiúir an úsáideora a mheas. Úsáideann sé halgartaim atá bunaithe ar chéimseata ansin chun ciall a bhaint as an méid a aimsítear é (anailís a dhéanamh ar shuíomhanna coibhneasta na n-alt braite). Agus físeán dinimiciúil á úsáid aige mar shonraí foinse, is féidir leis an gcóras sraith frámaí a úsáid, ní hamháin íomhá amháin, chun a eochairphointí a ghabháil. Is é an toradh ná rindreáil i bhfad níos cruinne ar ghluaiseachtaí fíor an úsáideora toisc gur féidir leis an gcóras faisnéis a úsáid ó na frámaí in aice láimhe chun aon neamhchinnteachtaí a réiteach maidir le seasamh an chorp daonna sa fhráma reatha.

As na teicníochtaí reatha chun meastachán staide 3D a úsáid in iarratais folláine, is é an cur chuige is cruinne múnla a chur i bhfeidhm ar dtús chun eochairphointí 2T a bhrath agus ina dhiaidh sin an braite 2T a phróiseáil le múnla eile chun iad a thiontú ina réamh-mheastacháin eochairphointí 3D. 

sa taighde postálamar le déanaí, baineadh úsáid as foinse físeán amháin, le líonraí néaracha convolutional le convolutions ama dilated a chur i bhfeidhm chun an 2D -> chomhshó eochairphointe 3D a dhéanamh.

Tar éis anailís a dhéanamh ar na samhlacha atá ann faoi láthair, chinneamar gurb é VideoPose3D an réiteach is fearr a oireann do riachtanais fhormhór na n-iarratas folláine atá faoi thiomáint ag AI. Ba cheart go gceadódh an t-ionchur a úsáideann an córas seo sraith eochairphointí 2T a bhrath, i gcás ina gcuirtear samhail, atá réamhoilte ar thacar sonraí COCO 2017, i bhfeidhm mar a Insamhlóir 2D. 

Chun suíomh reatha alt nó eochairphointe a thuar, is féidir le VideoPose3D frámaí iolracha a úsáid thar sheicheamh gearr ama chun faisnéis staidiúir 2T a ghiniúint. 

Chun cruinneas an mheastacháin staidiúir 3D a threisiú tuilleadh, is féidir le níos mó ná ceamara amháin dearcthaí malartacha an úsáideora a dhéanann an cleachtadh nó an gnáthamh céanna a bhailiú. Tabhair faoi deara, áfach, go dteastaíonn cumhacht próiseála níos mó mar aon le hailtireacht mhúnla speisialaithe chun déileáil le hionchuir sruthanna físeáin iolracha.

Le déanaí, Google nocht a gcóras BlazePose, samhail gléas-dhírithe chun staid an duine a mheas trí líon na n-eochairphointí a ndearnadh anailís orthu a mhéadú go 33, forshraith de thacar eochairphointí COCO agus dhá thipeolaíocht eile – BlazePalm agus BlazeFace. Mar thoradh air sin, is féidir leis an tsamhail BlazePose torthaí tuartha staide a tháirgeadh atá comhsheasmhach le samhlacha láimhe agus samhlacha aghaidhe trí shéimeantaic coirp a chur in iúl.

Ní mór do gach comhpháirt laistigh de chóras meastacháin staidiúir duine atá bunaithe ar mheaisín-fhoghlaim a bheith tapa, ag glacadh uasmhéid de chúpla milleasoicind in aghaidh an fhráma le haghaidh samhlacha braite agus rianaithe staidiúir. 

Toisc go gcaithfidh píblíne BlazePose (lena n-áirítear meastachán agus comhpháirteanna rianaithe) oibriú ar éagsúlacht gléasanna soghluaiste i bhfíor-am, tá gach cuid aonair den phíblíne deartha le bheith an-éifeachtach ó thaobh ríomha agus a reáchtáil ag 200-1000 CCT. .

Déan meastachán agus rianú san fhíseán nuair nach fios cé acu an bhfuil nó nach bhfuil an duine i láthair déanta in dhá chéim de ghnáth. 

Ag an gcéad chéim, reáchtáiltear múnla braite réad chun láithreacht duine a aimsiú nó chun a neamhláithreacht a aithint. Tar éis don duine a bheith faoi deara, is féidir leis an modúl meastacháin staidiúir an limistéar logánta ina bhfuil an duine a phróiseáil agus suíomh na n-eochairphointí a thuar.

Buntáiste eile a bhaineann leis an socrú seo ná go n-éilíonn sé modúil aimsithe réad agus meastacháin a dhéanamh le haghaidh gach fráma a ídíonn acmhainní ríomhaireachta breise. Cheap údair an BlazePose, áfach, bealach cliste chun dul timpeall ar an gceist seo agus é a úsáid go héifeachtach i modúil braite eochairphointí eile mar AghaidhMesh agus Láimhe MediaPipe.

Is é an smaoineamh nach féidir modúl braite réad (brathadóir aghaidhe i gcás BlazePose) a úsáid ach chun rianú staidiúir a thosú sa chéad fhráma agus is féidir an duine a rianú ina dhiaidh sin ag baint úsáide as na réamh-mheastacháin staidiúir go heisiach tar éis ailíniú éigin staidiúir, paraiméadair a bhfuiltear tuartha dóibh ag baint úsáide as an tsamhail meastacháin staidiúir.

Táirgeann an aghaidh an comhartha is láidre maidir le suíomh an torso don líonra néarúil, mar thoradh ar an éagsúlacht réasúnta beag i gcuma agus ardchodarsnacht ina ghnéithe. Mar thoradh air sin, is féidir córas tapa lastuas a chruthú chun staidiúir a bhrath trí shraith toimhdí inchosanta atá bunaithe ar an tuairim go mbeidh an cloigeann in-aimsithe i ngach cás úsáide pearsanta.

Ag Sárú Dúshláin Meastachán Staid an Duine

Tá dúshlán ag baint leis an méid ollmhór raon de chruthanna daonna, mar shampla, na céadta asanas sa chuid is mó de na réimeanna yoga a úsáid agus meastachán á dhéanamh ar staidiúir in aipeanna aclaíochta. 

Ina theannta sin, uaireanta cuirfidh an corp bac ar ghéaga áirithe mar a ghlactar le haon cheamara ar leith, is féidir le húsáideoirí éadaí éagsúla a chaitheamh a cheiltíonn gnéithe coirp agus cuma phearsanta.

Agus tú ag baint úsáide as aon mhúnlaí réamh-oilte, tabhair faoi deara go bhféadfadh gluaiseachtaí comhlacht neamhghnácha nó uillinneacha ceamara aisteach a bheith mar thoradh earráidí i meastachán staid an duine. Is féidir linn an fhadhb seo a mhaolú go pointe áirithe trí úsáid a bhaint as sonraí sintéiseacha ó rindreáil múnla 3D don chorp daonna, nó trí mhionchoigeartú a dhéanamh ar shonraí a bhaineann go sonrach leis an bhfearann ​​atá i gceist.

Is é an dea-scéal ná gur féidir linn tromlach na laigí a sheachaint nó a mhaolú. Is í an eochair chun é sin a dhéanamh ná na sonraí oiliúna cearta agus ailtireacht na samhla a phiocadh amach. Ina theannta sin, tugann an claonadh forbartha i réimse na teicneolaíochta meastacháin staidiúir le tuiscint nach mbeidh cuid de na saincheisteanna atá le sárú againn anois chomh hábhartha céanna sna blianta amach romhainn.

An focal deiridh

Tá éagsúlacht úsáidí féideartha amach anseo le meastachán ar staid an duine lasmuigh de réimse na n-aipeanna aclaíochta agus rianú gluaiseachtaí daonna, ó chearrbhachas go beochan go Réaltacht Mhéadaithe go róbataic. Ní liosta iomlán de na féidearthachtaí é sin ach leagann sé béim ar chuid de na réimsí is dóichí ina gcuirfidh meastachán ar staid an duine lenár dtírdhreach digiteach.

Tá fonn ar Maksym léargais agus taithí nua a fháil in Eolaíocht Sonraí agus i bhFoghlaim Meaisín. Tá suim ar leith aige i dteicneolaíochtaí Deep Learning-bhunaithe agus a gcur i bhfeidhm ar chásanna úsáide gnó.