На головну

Форми представлення даних

  1. b. при медичному обстеженні учнів шкіл району частина даних про зростання представлена ??в сантиметрах, а частина - в метрах
  2. I.3.4. Методи підготовки даних для перенесення проекту на місцевість.
  3. MIGRATE DATA (МИГРАЦИЯ ДАНИХ)
  4. Newpage {\ sf 41. Подання про "початок" і "кінець" людської історії.
  5. Quot; Відлига ": реформи Хрущова в другій половині 50-х - початку 60-х років. Викриття культу особи Сталіна
  6. V. Метод застосування банку даних про вартість раніше побудованих або запроектованих об'єктів
  7. VI етап. Робота зі створеною базою даних.

дані - Відомості, які характеризують систему, явище, процес або об'єкт, представлені в певній формі та призначені для подальшого використання.

За ступенем структурованості виділяють наступні форми представлення даних:

? неструктуровані;

? структуровані;

? слабоструктуровані.

К неструктурованих відносяться дані, довільні за формою, що включають тексти і графіку, мультимедіа (відео, мова, аудіо). Ця форма представлення даних широко використовується, наприклад, в Інтернеті, а самі дані представляються користувачеві у вигляді відгуку пошуковими системами.

структуровані дані відображають окремі факти предметної області. Структурованими називаються дані, певним чином впорядковані і організовані з метою забезпечення можливості застосування до них деяких дій (наприклад, візуального або машинного аналізу). Це основна форма подання відомостей в базах даних.

Організація того чи іншого виду зберігання даних (структурованих або неструктурованих) пов'язана із забезпеченням доступу до них.

під доступомрозуміється можливість виділення елемента даних (або безлічі елементів) серед інших елементів з яких-небудь ознаками з метою виконання деяких дій над елементом. Однією з найпоширеніших моделей зберігання структурованих даних є таблиця. У ній всі дані упорядковуються в двовимірну структуру, що складається із стовпців і рядків (рис.).

Мал. Структурований набір даних

В осередках такої таблиці містяться елементи даних: Символи, числа, логічні значення.

неструктуровані дані непридатні для обробки безпосередньо методами аналізу даних, Тому такі дані піддаються спеціальним прийомам структуризації, причому сам характер даних в процесі структурування може істотно змінитися. наприклад, В аналізі текстів (Text Mining) При структуруванні з вихідного тексту може бути сформована таблиця з частотами зустрічальності слів, і вже такий набір даних буде оброблятися методами, придатними для структурованих даних.

слабоструктуровані дані - Це дані, для яких визначені деякі правила і формати, але в найзагальнішому вигляді. Наприклад, рядок з адресою, рядок в прайс-листі, ПІБ і т. П.

На відміну від неструктурованих, такі дані з меншими зусиллями перетворюються до структурованої формі, проте без процедури перетворення вони теж непридатні для аналізу.

На рис. наведено приклад стандартизації рядки з адресою.

Мал. Стандартизація слабоструктурованих даних

Переважна більшість методів аналізу даних працює тільки з добре структурованими даними, представленими в табличному вигляді, Тому подальший виклад ведеться стосовно структурованих даних.



Пошук моделі. | типи даних

Стрілки (потоки даних) | сховища даних | Два підходи до побудови DFD-моделей | нумерація об'єктів | Знання та інформація стали головною рушійною і продуктивної суспільною силою. | Аналіз даних можна розглядати тільки як обробку інформації після її збору аналіз даних - це перш за все засіб перевірки гіпотез і вирішення завдань дослідника. | Інформаційний підхід до моделювання | Роль експерта і аналітика в процесі створення інформаційної моделі. Загальна схема аналізу. | Витяг і візуалізація даних | Загальна характеристика етапів моделювання на основі даних |

© um.co.ua - учбові матеріали та реферати