Q:
Чому візуалізація даних корисна для алгоритмів машинного навчання?
A:Дисципліна візуалізації даних дає нам практично нескінченні способи показати, що відбувається з алгоритмами машинного навчання. Варто подумати саме про те, чому візуалізація даних настільки важлива, і чому вона звільняє стільки творчої сили для багатьох людей, які втягуються в процеси машинного навчання.
Щоб зрозуміти значення візуалізації даних для машинного навчання, просто подивіться на будь-який алгоритм, який використовується для створення цих новаторських та інноваційних програм.
Одне з найпростіших - це дерево рішень. Не потрапляючи в функції активації або приховані шари чи щось подібне, дерево рішень - це просто набір двійкових вузлів. Але навіть просте дерево рішень людям дуже важко описати чи написати. Це набагато простіше, коли його візуалізують на екрані чи на сторінці. Коли ви бачите кожен вузол та його з'єднання з іншими вузлами, все це стає легко очевидним.
Тепер візьмемо один із найбільш візантійських та найрозвинутіших типів алгоритму машинного навчання - нейронну мережу.
Певним чином нейронні мережі справді є набором алгоритмів машинного навчання. Основна установка складається з вхідного шару, прихованих шарів та вихідного шару. Функції активації допомагають окремим цифровим нейронам обробляти зважені входи.
Усі ці пункти та всі ці процеси набагато легше пояснюються за допомогою візуалізації даних, ніж через словесні чи письмові описи. Можна сказати, що нейронна мережа має зважені входи, що надходять у вхідний шар, і що вони зливаються в якийсь прихований шар і консолідуються в заданий вихід, але коли ви використовуєте візуальну фігуру, щоб показати, як це працює, людське око та людське мозок застібає на це набагато більш прямим і корисним способом.
У певному сенсі ви можете бачити силу візуалізації даних навіть без врахування машинного навчання. Ще в часи лінійного програмування компілятори та студії комп'ютерної мови давали програмістам можливість встановити покрокову програму тестування, де вони могли б перевіряти значення змінних у невеликих візуальних полях. Знову ж таки, це допомогло показати, що відбувається у виконанні набагато краще, ніж просто читання кодової бази.
Машинне навчання - це гіперінтенсивне програмування - це ймовірнісне програмування, і тому візуалізація даних насправді допомагає нам обернутися головою навколо того, що відбувається з будь-яким заданим алгоритмом чи процесом.