Q:
Як нові можливості машинного навчання дозволяють видобувати запасні документи для отримання фінансових даних?
A:Однією з захоплюючих нових рубежів машинного навчання та ШІ є те, що вчені та інженери застосовують різні способи використання абсолютно нових видів ресурсів для прогнозування руху акцій та інвестиційних результатів. Це приголомшлива зміна ігор у фінансовому світі і дуже глибоко змінить інвестиційні стратегії.
Однією з базових ідей розширення цього виду біржових досліджень є обчислювальна лінгвістика, яка передбачає моделювання природної мови. Експерти досліджують, як використовувати текстові документи, починаючи з подання SEC до листів акціонерів до інших периферійних текстових ресурсів, щоб розширити або налагодити аналіз запасів або розробити абсолютно нові аналізи.
Безкоштовне завантаження: машинне навчання і чому це важливо |
Важливим застереженням є те, що все це стає можливим лише завдяки новим досягненням нейронних мереж, машинного навчання та аналізу природних мов. До появи ML / AI, обчислювальні технології в основному використовували лінійне програмування для "читання" входів. Текстові документи були надто неструктурованими, щоб бути корисними. Але з прогресом, досягнутим в аналізі природних мов протягом останніх кількох років, вчені виявляють, що можна «видобути» природну мову для кількісно оцінюваних результатів або, іншими словами, результатів, які можна певним чином обчислити.
Деякі найкращі докази та найбільш корисні приклади цього походять з різних дисертацій та докторських робіт, доступних в Інтернеті. У праці "Застосування машинного навчання та обчислювальної лінгвістики у фінансовій економіці", опублікованій у квітні 2016 року, Лілі Гао пояснює відповідні процеси, характерні для видобутку корпоративних заявок SEC, викликів акціонерів та соціальних медіа.
"Вилучення значущих сигналів з неструктурованих і високомірних текстових даних - непросте завдання", - пише Гао. "Однак, з розвитком машинного навчання та обчислювальної лінгвістичної техніки, обробка та статистичний аналіз завдань текстових документів може бути досягнута, і багато застосувань статистичного аналізу тексту в соціальних науках виявилися успішними". З обговорення Гао моделювання та калібрування в рефераті, весь розроблений документ показує, як деякі з цього типу аналізу детально працюють.
Інші джерела для активних проектів включають такі сторінки, як цей короткий проект GitHub, і цей ресурс IEEE говорить конкретно про отримання цінної фінансової інформації з "аналізу настроїв у Twitter".
Суть полягає в тому, що використання цих нових моделей NLP сприяє швидкому впровадженню у використанні всіляких текстових документів, не тільки для фінансового аналізу, але й для інших видів передового відкриття, розмиваючи традиційно встановлену лінію між "мовою" та "дані."