Будинки Аудіо Чому зміщення та дисперсія важливі для машинного навчання?

Чому зміщення та дисперсія важливі для машинного навчання?

Anonim

Q:

Чому зміщення та дисперсія важливі для машинного навчання?

A:

Розуміння термінів "упередженість" та "дисперсія" в машинному навчанні допомагає інженерам більш повно відкалібрувати системи машинного навчання, щоб вони відповідали за призначенням. Зміщення проти відхилення важливо, оскільки воно допомагає керувати деякими компромісами в проектах машинного навчання, що визначають, наскільки ефективною може бути дана система для використання підприємством або для інших цілей.

Пояснюючи зміщення та відмінність, важливо зазначити, що обидва ці питання можуть компрометувати результати даних дуже різними способами.

Безкоштовне завантаження: машинне навчання і чому це важливо

Упередження можна охарактеризувати як проблему, що призводить до неточних кластерів - це ситуація, коли машинне навчання може повернути багато результатів з точністю, але пропустити позначку в точності. Навпаки, дисперсія - це "розповсюдження" інформації - це дикість, це дані, які показують цілий спектр результатів, деякі з яких можуть бути точними, але багато з них випадуть за межі певної зони точності, щоб загальний результат був меншим точний і набагато більше "галасливий".

Насправді, деякі експерти, що описують дисперсію, пояснюють, що результати варіанту мають тенденцію "слідувати за шумом", коли результати з високим ухилом не надто далеко вивчають набори даних. Це ще один спосіб порівняння проблеми зміщення з проблемою дисперсії - експерти пов'язують упередження з недостатнім обладнанням, коли система може бути недостатньо гнучкою, щоб включати набір оптимальних результатів. Навпаки, дисперсія була б певним протилежністю, коли надмірне оснащення робить систему занадто крихкою та делікатною, щоб витримати багато динамічних змін. Дивлячись на зміщення та дисперсію за допомогою цієї лінзи складності, інженери можуть подумати про те, як оптимізувати роботу системи, щоб зробити її не надто складною, не надто простою, але просто достатньо складною.

Це два шляхи, що філософія зміщення та відхилення корисна при проектуванні систем машинного навчання. Завжди важливо працювати з упередженнями машин, щоб спробувати отримати загальний набір результатів, які є точними для використання, до якого вони застосовуються. Також завжди важливо дивитися на дисперсію, намагаючись контролювати хаос або дикість сильно розсіяних або розсіяних результатів, а також боротися з шумом у будь-якій системі.

Чому зміщення та дисперсія важливі для машинного навчання?