Головна

Електронних видань.

  1. Актуальні проблеми науки на сторінках сучасних періодичних видань. Функції наукової журналістики.
  2. Вступ. Класифікація електронних схем. Основні параметри і характеристики цифрових схем.
  3. Можливості динамічних (електронних) таблиць. Математична обробка числових даних.
  4. Газетна і журнальна періодика в системі засобів масової інформації. Типологія федеральних, регіональних і місцевих періодичних видань.
  5. Групи аналогових електронних пристроїв
  6. Групи, що захищається і їх склад. Методи захисту, три приклади електронних засобів захисту інформації.
  7. Журналістика країн Північної Європи в 90-і рр. 20 століття: право і саморегулювання преси, типологія періодичних видань.

Відомий математик Дж. Зіпф (С. К. Zipf) показав, що всі створені людиною тексти підкоряються загальним закономірностям, які він сформулював в 1946 р у вигляді декількох законів.

Якщо взяти будь-який текст, то можна підрахувати, які слова в ньому скільки разів зустрічаються. Кількість повторів слова в тексті можна назвати частотою. Найчастіше зустрічається слову можна приписати ранг 1, наступного за частотою - 2 і т. Д. Якщо кілька різних слів мають однакові частоти, то враховується тільки одне з цих кількох значень. Якщо розділити частоту повторення слова на загальну кількість значущих слів в тексті, то отримаємо його відносну частоту або ймовірність зустрічі цього слова в тексті.

Перший закон Зіпфа свідчить, що твір ймовірності зустрічі слова в тексті на його частоту приблизно постійно для будь-яких текстів певної мови.

Другий закон Зіпфа визначає співвідношення між частотою і кількістю слів, які з цією частотою зустрічаються в тексті. Якщо побудувати графік залежності кількості слів і частоти, то виявиться, що характеризує її крива залишається незмінною для будь-яких текстів в межах однієї мови. Сказане ілюструється та іншим і рис. 1, на якому показані криві для англійської (сама нижня), французької та російської мов (сама верхня).

 рис.1

Дані рис. 2 можуть успішно використовуватися на практиці для виділення значущих слів в тексті.

 рис.2

Всі важливі слова для даного тексту розміщуються в області середніх значень рангу (область виділена на рис. 2 штрихуванням). Дійсно, найчастіші слова зазвичай відносяться до допоміжних, а самі рідко зустрічаються зазвичай також не мають вирішального значення інформації для даного тексту. Від того, як буде поставлено діапазон значимих слів, залежить багато чого. Якщо зробити його занадто широким - потрібні терміни потонуть у морі допоміжних слів, встановивши надмірно вузький діапазон ми ризикуємо втратити смислові терміни.

Якщо розглядати сукупність видань, особливо, присвячених одній і тій же тематиці, то ймовірність випадкового потрапляння малозначних слів в виділену область для групи видань (див. Рис. 2) зменшується. Щоб врахувати таку можливість позбутися від випадкових слів вводять поняття инверсной частоти терміна. Інверсна частота визначається як логарифм відношення загальної кількості розглянутих документів n до числа документів, які містять даний термін m (під терміном можна розуміти не тільки окреме слово, а й єдине за змістом словосполучення), т. Е.

i = log2 (по підставі) (n / m).

З урахуванням инверсной частоти вага або значимість терміна в кожному документі визначиться як твір, z = f * i де z - вага або значимість терміна в виданні; f - частота повторення терміна в цьому виданні; i - інверсна частота цього терміна в групі виданні.

Процес визначення ваги або значущості терміна в виданні легко алгорітмізіруется.

На цьому принципі заснована робота всіх програм - екстракторів значущих слів. Треба сказати, що навіть широко поширений в нашій країні редактор Word, починаючи з версії 1997 року, як-то виконує функції вилучення термінів. Для цього використовується команда «Реферат» в секції меню «Сервис». Відповідне команді діалогове вікно.

Як випливає з даних, реферат можна помістити в початок реферованих документа або оформити у вигляді окремого файлу. Можна також регулювати розмір реферату, задаючи в процентах від основного тексту кількість пропозицій в ньому. На прикладі: В рефераті містяться дві пропозиції, в той час як в оригінальному документі їх було двадцять одне. Поряд зі складанням реферату з тексту документа витягується п'ять найбільш значущих слів. Для їх перегляду слід скористатися командою «Властивості» секції меню «Файл».

Для того щоб ключові слова були занесені в потрібне поле вкладки «Документ» вікна «Властивості», в діалоговому вікні, показаному на рис. 3, повинна бути задіяна опція

«Оновити відомості про документ»).

В поле «Ключові слова» в прикладі відібрано п'ять слів, а саме: «в», «видавництв»,

«Області», «передбачений», «повинен». Неважко за мітити, що з п'яти відібраних слів

тільки одне відповідає тематиці статті «Сучасні видавництва», причому одне з

відібраних слів - привід, який взагалі не може мати сенсу, коли він береться

окремо від основного слова. Таким чином, якість відбору ключових слів редактором

Word 97 вельми низька. До речі, реферування здійснюється тільки для роботи

назвою англійською (а не російською) мовою. Треба сказати, що редактор Word 2000

нічим істотним не відрізняється від свого попередника.

Метаінформація і її роль. | Застосування програм-екстракторів.


Відеоінформація. Композитний відео. | Черезстрочне і прогресивне уявлення відеоінформації. | Мультимедіа-компоненти. Способи створення мультимедійного застосування. | Опис роботи презентаційних програм. Приклади. | Методи організації зберігання електронних видань. Порівняльна характеристика | Методи організації пошуку в електронному виданні. Основні відмінності | Вимоги до інформаційного сховища видавництва. | Проектування структури сховища електронних видань. | Сучасні технології видавничого процесу. Основні компоненти інформаційної структури видавництва | Структурні особливості серверної частини мультимедійного інтернет-ресурсу. |

© 2016-2022  um.co.ua - учбові матеріали та реферати