загрузка...
загрузка...
На головну

Інструменти нелінійного пошуку і побудова зв'язків

Дивіться також:
  1. II. Побудова поздовжнього профілю по осі траси
  2. Аксіоматична побудова теорії ймовірностей
  3. Аксіоматична побудова теорії ймовірностей
  4. Алгебраїчний метод вирішення завдань на побудову.
  5. Алгоритм пошуку в глибину
  6. Алгоритм пошуку проміжних шляхів
  7. Алгоритми реалізації пошуку розрахункових температур.
  8. Аналіз інформації та побудова словників
  9. Аналітичні методи «випарювання» ідей: фокус група як інструмент пошуку і відбору.
  10. Апаратні засоби ПОШУКУ ІНФОРМАЦІЇ
  11. Бінарне дерево пошуку
  12. Бухгалтерські інструменти управлінського обліку.

Складання запитів для систем лінійного пошуку.

Робота з лінійними пошуковими системами передбачає певні навички в складанні запиту. Традиційні мови запитів на увазі вибір ключових слів, вказівка на їх обов'язкова наявність або відсутність в текстах, положення ключових слів щодо структури тексту (наприклад, в заголовку або в самому тілі документа) і відносно один одного (відстань між словами, послідовність вживання, жорсткість словосполучень, знаходження всередині одного пропозиції, одного документа та ін.).

У професійних системах лінійного, або універсального, пошуку можливості додаткових параметрів значно розширені. Наприклад, в системі «Гарант» реалізована унікальна технологія пошуку через «Енциклопедію ситуацій». Користувач формулює запит, використовуючи звичні йому терміни, система «переводить» запит і протягом декількох хвилин надає відповідь. У «Інтегрум» реалізовані наступні унікальні можливості - пошук з помилками або варіантами написання, пошук за прізвищем, ім'ям, по батькові, коли розумна система знаходить в текстах все форми вживання прізвища, імені, по батькові, які можуть відповідати заданим, навіть зменшувальні. Наприклад, якщо ви шукаєте людину з прізвищем Александров і ініціалами А. Ю., то, задавши ці параметри при пошуку з включенням потрібної функції, отримаєте документи, де згадується Шурик Александров, Олексій Юрійович Александров, Антон Александров, Александров Автанділ Юліанович, А. Александров і т.д.

В матеріалах проекту «Гардарика» пошуковикам рекомендується складати тезауруси в залежності від конкретних інтересів і поповнювати їх постійно, у міру виявлення нових термінів в ході роботи. Більш адекватною представляється структура тезауруса у вигляді семантичних зрізів, де для кожного основного терміну окремо будується таблиця супутніх слів і слів шумових (які не повинні зустрічатися в джерелі). Це дуже актуально для журналістів, які працюють по одній темі, але, перш за все ця порада відноситься до користувачів загальнодоступних пошукових систем. Професійні системи більш спеціалізовані і тому можуть запропонувати користувачеві готові тезауруси і типові запити.

Особливу цінність для професійних журналістів і пошукачів представляють системи, що дозволяють вибирати дані про зв'язки між об'єктами. Саме побудова зв'язків, систематизація фактів і є кінцевою метою пошукача. В деякій мірі це завдання можна автоматизувати. Так, наприклад, в «Інтегрум» розроблений інструмент, що дозволяє вибирати з текстів окремих документів інформацію виду людина - посада - організація (ФДО). Фактично ФДО - це база даних, в якій зберігаються об'єкти «людина» і «організація», пов'язані відношенням «займати посаду». Іншими словами, це база, з якої можна дізнатися, в яких організаціях (і на яких посадах) працював певна людина і які люди (і на яких посадах) працювали в певній організації. База дозволяє також отримати всі документи, з яких була почерпнута відповідна інформація.

Похідними від ФДО є сервіси «Колеги?» (Пошук загальних місць роботи для двох осіб) і «Пов'язані організації?» (Пошук спільних співробітників для двох компаній).

Подібні функції має розроблений компанією Xanalys інструмент аналізу зв'язків Quenza. Він дозволяє отримувати і накопичувати дані з текстів про людей, події та організаціях і ідентифікувати зв'язку в межах цих даних. Quenza працює з інформацією, що зберігається в MS Word, PDF, електронній пошті і форматі HTML. Безумовний інтерес для професіоналів представляє інструмент візуалізації аналізу інформації Watson, розроблений тією ж компанією Xanalys. Watson дозволяє в графічній формі виявляти зв'язки між зовні не пов'язаними наборами даних. Наприклад, Watson дає можливість накладати інформацію про транзакції з одного файлу на інформацію про телефонні переговори з іншого файлу. Отримана в результаті база даних дозволяє запитувати інформацію про відповідні зв'язки. Розвиток технологій і обсяги інформації, яку доводиться переробляти журналістам і професійним пошуковикам, вимагають появи нових і нових інструментів для її оптимальної обробки, тому тут ми наводимо лише окремі приклади найбільш оригінальних інструментів. До засобів нелінійного пошуку також можна віднести інструменти рейтингів і статистики. Так, наприклад, «Медіалогія» надає клієнтам інструмент розрахунку індексів відносини преси до персонами, компаніями або торговим маркам, «Інтегрум» дозволяє автоматично визначати персон, які є лідерами в інформаційному полі дня, не по заздалегідь заданому списку, а вибираючи зі ЗМІ все згадки про фізичних особах.

Найпродуктивніші результати, як уже говорилося на початку цього розділу, дає поєднання онлайнових і офлайнових методів та інструментів роботи з інформацією.

Інструменти лінійного пошуку. «-- попередня | наступна --» Онлайновий і офлайновий режими - єдині і неподільні.
загрузка...
© om.net.ua