Будинки Аудіо Чому мішковина в машинному навчанні зменшує дисперсію?

Чому мішковина в машинному навчанні зменшує дисперсію?

Anonim

Q:

Чому мішковина в машинному навчанні зменшує дисперсію?

A:

Агрегація завантажувальної завантажувальної машини або «мішковина» в машинному навчанні зменшує дисперсію за рахунок побудови більш досконалих моделей складних наборів даних. Зокрема, підхід до створення пакетів створює підмножини, які часто перекриваються для моделювання даних у більш задіяний спосіб.

Одне цікаве і зрозуміле поняття, як застосовувати мішок, - це взяти набір випадкових зразків і витягнути просту середню. Потім, використовуючи той самий набір зразків, створіть десятки підмножин, побудованих як дерева рішень для маніпулювання можливими результатами. Друга середня повинна відображати більш правдиву картину того, як ці окремі зразки співвідносяться один з одним за вартістю. Ця ж ідея може бути застосована до будь-якого властивості будь-якого набору точок даних.

Безкоштовне завантаження: машинне навчання і чому це важливо

Оскільки такий підхід консолідує відкриття на більш визначені межі, він зменшує дисперсію і допомагає при надмірній обробці. Подумайте про розсіювач з дещо розподіленими точками даних; використовуючи метод розфасовки, інженери «стискають» складність і орієнтують лінії виявлення на більш плавні параметри.

Деякі говорять про значення мішків як "розділити і перемогти" або про тип "допоміжної евристики". Ідея полягає в тому, що за допомогою ансамблевого моделювання, такого як використання випадкових лісів, ті, хто використовує мішковину як техніку, можуть отримати результати даних, які мають менші відмінності. Що стосується зменшення складності, мішок також може допомогти при надмірному оснащенні. Придумайте модель із занадто великою кількістю точок даних: скажімо, підключення до 100 крапок. Отримана лінія візуальних даних буде нерівною, динамічною, мінливою. Потім «випрасуйте» дисперсію, склавши набори оцінок. В ансамблевому навчанні це часто вважається об'єднанням декількох "слабких учнів", щоб забезпечити спільний результат "сильного навчання". Результат - плавніша, більш контурна лінія даних та менше дика дисперсія в моделі.

Неважко зрозуміти, як ідея розфасовки може бути застосована до ІТ-систем підприємства. Керівники бізнесу часто хочуть "переглянути з пташиного польоту" те, що відбувається з продуктами, клієнтами і т. Д. Переоснащена модель може повернути менш засвоювані дані та більше "розкидані" результати, коли мішок може "стабілізувати" модель і зробити її більш корисною для кінцевих користувачів.

Чому мішковина в машинному навчанні зменшує дисперсію?