Q:
Чому машинне зміщення є проблемою в машинному навчанні?
A:На це питання можна відповісти двома різними способами. По-перше, чому проблема зсуву машин, як, чому вона існує в процесах машинного навчання?
Машинне навчання, хоч і складне і складне, але в деякій мірі обмежене на основі набору даних, які він використовує. Побудова набору даних передбачає властиві упередженості. Як і в засобах масової інформації, де упущення та обдуманий вибір включення можуть виявити певну упередженість, при машинному навчанні набори даних, які використовуються, повинні бути вивчені, щоб визначити, який тип упередженості існує.
Безкоштовне завантаження: машинне навчання і чому це важливо |
Наприклад, загальною проблемою для тестування технологій та процесів проектування є виявлення переваги одного типу користувачів над іншим. Одним з великих прикладів є гендерна нерівність у світі технологій.
Чому це має значення і чому це стосується машинного навчання?
Оскільки брак існуючих самок в тестовому середовищі може призвести до виробленої технології, менш зручної для жіночої аудиторії. Деякі експерти описують це тим, що без існуючих жіночих тестувань кінцевий продукт може не розпізнавати вкладення жінок-користувачів - він може не мати інструментів для розпізнавання жіночої ідентичності або адекватного поводження з даними жінок.
Те саме стосується різних етнічних груп, людей різних релігій або будь-якого іншого типу демографічного характеру. Без потрібних даних алгоритми машинного навчання не працюватимуть належним чином для заданого набору користувачів, так що дані інклюзії повинні бути свідомо додані в технологію. Замість того, щоб просто брати первинні набори даних та посилювати притаманні упередженості, обробникам людей потрібно реально розглянути проблему.
Інший приклад - це механізм машинного навчання, який приймає інформацію про роботу та зарплату та випльовує результати. Якщо цей притаманний набір даних не буде проаналізований, машина посилить упередженість. Якщо буде встановлено, що чоловіки займають переважну більшість керівних завдань, а процес машинного навчання передбачає фільтрацію через необроблений набір даних та повернення відповідних результатів, це поверне результати, які показують упередженість чоловіків.
Друга частина питання передбачає, чому такий ухил настільки шкідливий. Без належного нагляду та тестування нові технології можуть нашкодити, а не допомогти нашому почуттю включеності та рівності. Якщо буде впроваджено новий технологічний продукт, який розпізнає обличчя зі світлою шкірою, але не темнішими, це може призвести до посилення етнічної напруженості та відчуття того, що компанія, про яку йдеться, не чутлива до різноманітності. Якщо алгоритм машинного навчання відтворює та посилює упередженість у наборах даних, то штучний інтелект додасть свій голос людським голосам та людським тенденціям, які вже існують у соціальній системі, що надають перевагу одній групі людей над іншою.
Найкращий спосіб вирішити це - уважно ознайомитись з основними наборами даних, використовувати підбір функцій, додати змінний ввід і самі маніпулювати необробленими наборами даних, а також збільшити реальну силу машинного навчання за допомогою навмисного опрацювання даних людей, щоб отримати Результат, який забезпечує велику аналітичну силу, а також деякі людські уявлення, які комп'ютери ще не можуть копіювати.