stub Компьютерийн хараа гэж юу вэ? - Нэгдсэн.AI
бидэнтэй хамт холбоно
AI мастер анги:

AI 101

Компьютерийн хараа гэж юу вэ?

mm
шинэчлэгдсэн on

Компьютерийн хараа гэж юу вэ?

Компьютерийн харааны алгоритмууд нь одоогоор дэлхийн хамгийн хүчирхэг, хүчирхэг хиймэл оюун ухааны системүүдийн нэг юм. Компьютерийн харааны систем Автономит тээврийн хэрэгсэл, робот навигаци, царай таних систем болон бусад зүйлд ашиглахыг үзнэ үү. Гэсэн хэдий ч компьютерийн харааны алгоритм гэж юу вэ? Тэд хэрхэн ажилладаг вэ? Эдгээр асуултад хариулахын тулд бид компьютерийн харааны онол, компьютерийн харааны алгоритмууд болон компьютерийн харааны системд зориулсан программуудыг гүнзгийрүүлэн судлах болно.

Компьютерийн харааны систем хэрхэн ажилладаг вэ?

Компьютерийн харааны систем хэрхэн ажилладагийг бүрэн дүүрэн ойлгохын тулд эхлээд хүмүүс объектыг хэрхэн таних талаар ярилцъя. Бид объектыг хэрхэн таних талаар мэдрэлийн сэтгэл судлалд хамгийн сайн тайлбарладаг загвар бол түүний эхний үе шатыг дүрсэлсэн загвар юм. объект таних хэлбэр, өнгө, гүн зэрэг объектын үндсэн бүрэлдэхүүн хэсгүүдийг тархи хамгийн түрүүнд тайлбарладаг. Тархинд орж буй нүднээс ирж буй дохиог шинжилж, эхлээд объектын ирмэгийг сугалж, эдгээр ирмэгийг нэгтгэж, объектын хэлбэрийг бүрдүүлдэг илүү төвөгтэй дүрслэлд оруулдаг.

Компьютерийн харааны систем нь хүний ​​харааны системтэй маш төстэй ажилладаг бөгөөд эхлээд объектын ирмэгийг ялгаж, дараа нь эдгээр ирмэгүүдийг хооронд нь холбож объектын хэлбэрт оруулдаг. Том ялгаа нь компьютер дүрсийг тоо болгон тайлбарладаг тул компьютерийн харааны системд дүрсийг бүрдүүлсэн пикселүүдийг тайлбарлах арга хэрэгтэй болдог. Компьютерийн харааны систем нь зураг дээрх пикселүүдэд утгыг оноож, нэг пикселийн бүс ба пикселийн өөр муж хоорондын утгын зөрүүг судалснаар компьютер ирмэгийг ялгаж чаддаг. Жишээлбэл, хэрэв тухайн зураг саарал өнгөтэй байвал утгууд нь хар (0-ээр илэрхийлэгддэг) -аас цагаан (255-аар илэрхийлэгддэг) хүртэл хэлбэлзэнэ. Бие биенийхээ ойролцоох пикселийн утгын муж дахь гэнэтийн өөрчлөлт нь ирмэгийг илтгэнэ.

Пикселийн утгыг харьцуулах энэхүү үндсэн зарчмыг өөр өөр RGB өнгөний сувгуудын хоорондох ялгааг компьютерээр харьцуулах замаар өнгөт зургуудаар хийж болно. Тиймээс бид компьютерийн харааны систем нь дүрсийг тайлбарлахын тулд пикселийн утгыг хэрхэн шалгадгийг мэддэг гэдгийг мэдэж байгаа тул компьютерийн харааны системийн архитектурыг харцгаая.

Convolutional Neural Networks (CNNs)

Компьютерийн харааны ажилд ашигладаг хиймэл оюун ухааны үндсэн төрөл нь нэг юм эвхэгддэг мэдрэлийн сүлжээнд суурилсан. Хувиралт гэж яг юу вэ?

Convolutions нь сүлжээний пиксел хоорондын утгын зөрүүг тодорхойлоход ашигладаг математик процесс юм. Хэрэв та пикселийн утгуудын сүлжээг төсөөлж байгаа бол энэ үндсэн сүлжээн дээр зөөгдсөн жижиг сүлжээг төсөөл. Хоёр дахь сүлжээний доорх утгуудыг сүлжээгээр шинжилж байгаа тул сүлжээ нь нэг удаад хэдхэн пикселийг л шалгаж байна. Үүнийг ихэвчлэн "гүйдэг цонх" гэж нэрлэдэг. Гулсах цонхоор дүн шинжилгээ хийж буй утгуудыг сүлжээгээр нэгтгэн гаргадаг бөгөөд энэ нь зургийн нарийн төвөгтэй байдлыг багасгаж, сүлжээнд хэв маягийг задлахад хялбар болгодог.

Хувиралт мэдрэлийн сүлжээнүүд нь хоёр өөр хэсэгт хуваагдана, эргэлтийн хэсэг ба бүрэн холбогдсон хэсэг. Сүлжээний эвдрэлийн давхаргууд нь зураг дээрх пикселүүдийг задлан шинжилж, мэдрэлийн сүлжээний нягт холбогдсон давхаргууд загваруудыг сурах боломжтой дүрслэлийг бий болгох үүрэг гүйцэтгэдэг онцлог шинж чанарууд юм. Хувиралтын давхаргууд нь зөвхөн пикселүүдийг шалгаж, ирмэг гэх мэт зургийн доод түвшний шинж чанарыг задлах замаар эхэлдэг. Хожим нь эргэлтийн давхаргууд нь ирмэгийг нэгтгэж, илүү төвөгтэй хэлбэрт оруулдаг. Төгсгөлд нь сүлжээ нь зургийн ирмэг ба дэлгэрэнгүй мэдээллийг бүрэн холбосон давхаргууд руу дамжуулах боломжтой болно гэж найдаж байна.

Зургийн тайлбар

Гүйлгээний мэдрэлийн сүлжээ нь зургаас хэв маягийг өөрөө гаргаж авч чаддаг бол компьютерийн харааны системийн нарийвчлалыг зураг дээр тайлбар хийснээр ихээхэн сайжруулж болно. Зургийн тайлбар Энэ нь зурган дээрх чухал объектуудыг илрүүлэхэд ангилагчдад туслах мета өгөгдөл нэмэх үйл явц юм. Автономит машин эсвэл роботыг удирдах гэх мэт компьютерийн харааны систем өндөр нарийвчлалтай байх шаардлагатай үед зургийн тайлбарыг ашиглах нь чухал юм.

Компьютерийн харааны ангилагчийн гүйцэтгэлийг сайжруулахын тулд зурагт тайлбар хийх янз бүрийн арга байдаг. Зургийн тэмдэглэгээг ихэвчлэн зорилтот объектын ирмэгийг тойрон хүрээлж, компьютерт анхаарлаа хайрцаг дотор төвлөрүүлэхийг заадаг хайрцгаар хийдэг. Семантик сегментчилэл нь зургийн аннотацийн өөр нэг төрөл бөгөөд зургийн аннотаци нь зураг дээрх пиксел бүрт зургийн анги хуваарилах замаар ажилладаг. Өөрөөр хэлбэл, "өвс" эсвэл "мод" гэж үзэж болох пиксел бүрийг эдгээр ангилалд хамааруулах болно. Энэхүү техник нь пикселийн түвшний нарийвчлалыг өгдөг боловч семантик сегментчилсэн тэмдэглэгээг үүсгэх нь энгийн хязгаарлах хайрцаг үүсгэхээс илүү төвөгтэй бөгөөд цаг хугацаа их шаарддаг. Шугаман, цэг зэрэг бусад тэмдэглэгээний аргууд бас байдаг.

Мэргэшсэн блоггер, программист Машины сургалт болон Гүн сурах сэдвүүд. Даниел бусад хүмүүст хиймэл оюун ухааны хүчийг нийгмийн сайн сайхны төлөө ашиглахад тусална гэж найдаж байна.