Q:
Чому для науковців важливо домагатися прозорості?
A:Прозорість, по суті, важлива для науково-технічних проектів та програм машинного навчання, частково через складність та витонченість, що їх стимулює - тому що ці програми "навчаються" (генеруючи ймовірнісні результати), а не слідуючи заздалегідь визначеним інструкціям лінійного програмування, і тому, що, як результат, може бути важко зрозуміти, як технологія робить висновки. Проблема «чорної скриньки» алгоритмів машинного навчання, яка не є повністю зрозумілою для людей, які приймають рішення, є великою проблемою в цій галузі.
Зважаючи на це, можливість оволодіти поясненням машинного навчання або «пояснюваним ШІ», ймовірно, буде основним напрямком у тому, як компанії здійснюють здобуття талантів для науковця даних. Вже DARPA, установа, яка принесла нам Інтернет, фінансує багатомільйонне дослідження в поясненні AI, намагаючись просунути навички та ресурси, необхідні для створення технологій машинного навчання та штучного інтелекту, прозорих для людини.
Один із способів задуматися над тим, що часто існує "етап грамотності" розвитку талантів і "стадія гіперлітератури". Для науковця даних традиційним етапом грамотності буде знання про те, як складати програми машинного навчання та як будувати алгоритми з такими мовами, як Python; як будувати нейронні мережі та працювати з ними. Етап гіперлітератури - це здатність освоїти пояснюваний ШІ, забезпечити прозорість використання алгоритмів машинного навчання та зберегти прозорість, оскільки ці програми працюють на досягнення своїх цілей та цілей своїх обробників.
Ще один спосіб пояснити важливість прозорості в науці даних - це те, що використовувані набори даних стають все більш досконалими, а отже, і більш потенційно втручаються в життя людей. Ще одним головним рушієм пояснення машинного навчання та наукових даних є нещодавно введене в дію Європейське загальне положення про захист даних, яке намагається стримати неетичне використання персональних даних. Використовуючи GDPR як тестовий випадок, експерти можуть побачити, як необхідність пояснення проектів наукових даних вписується в проблеми конфіденційності та безпеки, а також у ділову етику.