Будинки Аудіо Що таке неструктуровані дані? - визначення з техопедії

Що таке неструктуровані дані? - визначення з техопедії

Зміст:

Anonim

Визначення - Що означає неструктуровані дані?

Неструктуровані дані представляють будь-які дані, які не мають впізнаваної структури. Він неорганізований і сирий і може бути нетекстовим або текстовим. Наприклад, електронна пошта - це прекрасна ілюстрація неструктурованих текстових даних. Вона включає час, дату, дані одержувача та відправника, тему тощо, але тіло електронної пошти залишається неструктурованим. Неструктуровані дані також можуть бути ідентифіковані як слабко структуровані дані, де джерела даних включають структуру, але не всі дані в наборі даних відповідають одній структурі.

У компаніях, орієнтованих на клієнтів, дані, знайдені в неструктурованій формі, можуть бути вивчені для покращення маркетингу відносин та управління відносинами з клієнтами (CRM). Оскільки програми соціальних медіа, такі як Facebook та Twitter, переходять у мейнстрім, неструктурована розробка даних, ймовірно, випереджає хід структурованих даних.

Техопедія пояснює неструктуровані дані

Неструктуровані дані відносяться до даних, що слідують за формою, яка є менш упорядкованою, ніж елементи, такі як сторінки електронних таблиць, таблиці баз даних або інші лінійні або впорядковані набори даних. Насправді, термін "набір даних" є корисним, оскільки асоціюється з даними, які знаходяться в акуратних, доступних масивах, без зайвого вмісту, і які пов'язані або позначені у певній структурі.

Інші випадки неструктурованих текстових даних включають документи Word, презентації PowerPoint, миттєві повідомлення, програмне забезпечення для співпраці, документи, книги, повідомлення в соціальних медіа та медичні записи. Нетекстурні неструктуровані дані, як правило, створюються в засобах масової інформації, таких як MP3-аудіофайли, зображення JPEG та файли Flash Flash тощо.

Неструктуровані дані зазвичай не містять заздалегідь визначеної моделі даних, і вони можуть не узгоджуватися з реляційними таблицями. Неструктуровані дані зазвичай важкі. Однак він може включати цифри та дати, а також факти. Це призводить до неоднозначностей, які важко визначити за допомогою звичайних програмних програм.

Зберігання величезних обсягів неструктурованих даних, що генеруються в межах підприємства, за умови поганого управління ними може призвести до великих витрат. Дані в паперових документах або в електронному форматі повинні бути відскановані, щоб пошуковий додаток розбирав ідеї залежно від слів, які використовуються в певних контекстах. Це відомо як підприємство або семантичний пошук.

Що таке неструктуровані дані? - визначення з техопедії