stub Ковариац ба корреляци: Өгөгдлийн шинжлэх ухааны талаархи хоёр өөр ойлголтыг ойлгох нь - Unite.AI
бидэнтэй хамт холбоно

Хиймэл оюун

Ковариац ба корреляци: Өгөгдлийн шинжлэх ухааны талаархи хоёр өөр ойлголтыг ойлгох

mm
шинэчлэгдсэн on

Өгөгдлийн шинжлэх ухаанд сольж болох олон нэр томъёо байдаг. Энэ нь одоо байгаа асуудлыг илүү сайн шийдэхийн тулд өгөгдөлд дүн шинжилгээ хийх, ойлгох шинжлэх ухаан юм. Энэ нь ирээдүйн чиг хандлага, үйл ажиллагааны талаар үнэн зөв таамаглал өгч, өнөөгийн дэлхийн хамгийн алдартай, чиг хандлагатай талбар болгож чадна. Өгөгдлийн шинжлэх ухаан нь өгөгдлийн зан төлөвийг ойлгохын тулд алгоритм, хиймэл оюун ухаан, статистикийн хослолыг ашигладаг. Ирээдүйн үр дүнг урьдчилан таамаглах өгөгдлийг ойлгох нь мэдээллийн шинжлэх ухааны гол зорилго юм. Бүх алгоритмууд болон машин сургалтын хөтөлбөрүүд нь статистикийн харилцаанд суурилдаг. Статистикийг мэдээллийн шинжлэх ухааны үндэс суурь гэж үзэж болно.

Статистик

Статистик бол өгөгдөлд дүн шинжилгээ хийдэг математикийн салбар юм. Өгөгдлийн зан төлөвийг ойлгох, дүн шинжилгээ хийхэд стандарт тодорхойлолт, арга техникийг статистикт ашигладаг. Дэвшилтэт шатанд байгаа эдгээр техникүүд нь машин сургалтын алгоритмуудын блок болдог. Статистикийн хамгийн түгээмэл бөгөөд түгээмэл хэрэглэгддэг ойлголт бол дисперс юм. Вариац гэдэг нь өгөгдлийн багц дахь бичилт бүрийн өгөгдлийн багцын дунджаас өөрчлөгдөхийг хэлнэ. Вариац нь өгөгдлийн багцын дундаж эсвэл дундажтай холбоотой ялгаа, өргөн дэлгэцийг тодорхойлдог. Өгөгдөл дэх хэвийн бус байдлыг хэмжихийн тулд хэлбэлзлийг өргөн ашигладаг.

Статистикт ковариац болон корреляцийг харилцан адилгүй байдлаар ашигладаг. Бид статистикт энэ хоёр нэр томьёотой байнга тааралддаг. Хүмүүс хоёр өөр багц өгөгдлийн хоорондын хамаарлын талаар ярьдаг энэ салбарт ковариац ба корреляци гэсэн нэр томъёо нь симбиотик харилцаатай байдаг. Ковариац нь хоёр хувьсагчийн хоорондох хэлбэлзлийг тодорхойлдог бол корреляци нь бие даасан хоёр хувьсагчийн хоорондын хамаарлыг тодорхойлдог. Өгөгдлийн шинжлэх ухаан нь хоёр ойлголтыг тогтмол ашигладаг. Ковариац нь бие биентэйгээ холбоотой хувилбарт бие даасан хоёр хүчин зүйлийн өөрчлөлтийг ойлгоход хэрэглэгддэг. Корреляци нь бие биенийхээ өөрчлөлтийн хурдыг ярьдаг.

Ковариац:

Ковариац нь хоёр хувьсагчийн хоорондын харилцааны чиглэлийг тодорхойлдог. Энэ нь харилцааны бат бөх байдлын талаар боддоггүй. Энэ нь хоёр хувьсагчийн хоорондын пропорциональ байдлыг мэдэх боломжийг олгодог. Ковариац нь ямар ч бодит тоо байж болно. Энэ нь хувьсагчдын хэлбэлзэл болон зураглалын масштабаас хамаарна. Үүнийг хувьсагчийн олонлогоос дундажийн зөрүүний нийлбэрийг элементийн нийт тоонд хуваасан үржвэрээр тооцоолж болно. Өгөгдлийн шинжлэх ухаанд ковариацийг өнгөрсөн үйл явдлуудыг ойлгохын тулд өгөгдөлд дүн шинжилгээ хийхэд ашигладаг. Төрөл бүрийн хувьсагчийн зан төлөв нь хүчин зүйл өөрчлөгдөхөд өөрчлөгддөг. Үүнийг юу болж байгааг илүү сайн ойлгоход ашиглаж болно. Ковариац нь хувьсагчдын хоорондын хамаарлын талаарх үндсэн ойлголтыг өгч чадна. Хувьсагч нь шууд пропорциональ эсвэл урвуу пропорциональ байж болно. Пропорциональ бус хувьсагчдыг ойлгох, ажиглах, судлахад бусад дэвшилтэт статистикийн арга техник хэрэгтэй.

Хамаарал:

Корреляци нь хоёр хувьсагчийн хоорондын харилцааны хүчийг тайлбарладаг. Ковариац ба корреляци хоорондоо холбоотой. Хэрэв та ковариацийг хоёр хувьсагчийн стандарт хазайлтын үржвэрт хуваавал корреляцийг авна. Корреляци [-1,1] олонлогт холбогдсон байна. Энэ нь нэг хувьсагчийг нөгөөгөөсөө хамааран таамаглах боломжийг бидэнд олгодог. Ингэж өгөгдлийн шинжлэх ухаан ирээдүйн үйл явдлуудыг үнэн зөв урьдчилан таамагладаг. Энэ бол ковариацын зохиомол хувилбар юм. Энэ нь хувьсагчдын хоорондын хамаарал болон хувьсагчдын хүчийг хоёуланг нь харуулдаг. Шугаман регресс үүсгэхийн тулд корреляцийн коэффициентийг машин сурахад ашигладаг. Хэрэв хувьсагчид хоорондоо нягт холбоотой бол коэффициентийн утга нь 1 эсвэл -1-ийн аль нэгтэй ойр байх болно.

Хэрэв хувьсагчид шугаман хамааралгүй бол коэффициент нь тэг байх хандлагатай байна. Энэ нь коэффициентүүд нь огт хамааралгүй гэсэн үг биш юм. Тэд илүү дээд түвшний харилцаатай байж болно. Урьдчилан таамаглах өгөгдлийн шинжлэх ухааны загварын нарийвчлал нь коэффициентийн хүчин зүйлээс хамаарна. Хүчин зүйл нь туйлшралд ойртох тусам таамаглах загварын алгоритм илүү нарийвчлалтай ажилладаг.

Ковариац ба корреляци

Ковариац ба корреляцийн ач холбогдол, ач холбогдол нь одоогийн алгоритм, хэрэглээнд маш хатуу нотлогдсон. Өгөгдлийн шинжлэх ухаан нь том өгөгдөлд дүн шинжилгээ хийх, ойлгохын тулд эдгээр шугаман аргуудын аль алинд нь ихээхэн тулгуурладаг. Хоёулаа хоорондоо маш нягт холбоотой боловч бие биенээсээ эрс ялгаатай. Хоёр аргын харилцан хэрэглээ нь мэдээллийн шинжлэх ухаанд нарийвчлал, үр ашгийг өгдөг. Нарийн ялгаа нь онолын хувьд ойлгоход хэцүү боловч жишээгээр хялбархан ойлгож болно.

Өгөгдлийн шинжлэх ухаан нь өгөгдөлд дүн шинжилгээ хийх ковариац, корреляциас гадна олон арга техникийг санал болгодог. Энэ нь олон боломжуудыг олгодог бөгөөд байнгын өсөлттэй байдаг. Сүүлийн хэдэн сарын хугацаанд мэдээлэл судлаачдын эрэлт хэрэгцээ эрс нэмэгдсэн. Энэ нь хоорондын ялгааны талаар илүү тодорхой ойлголтыг өгдөг гэж найдаж байна Корреляци ба Ковариац.

Мэдээллийн технологийн салбарт 8-аас дээш жил ажилласан туршлагатай Data Scient-ийн ажилтнууд. Өгөгдлийн шинжлэх ухаан, дижитал маркетингийн чиглэлээр мэргэшсэн. Мэргэжлийн чиглэлээр судлагдсан техникийн агуулгын чиглэлээр мэргэшсэн.