Інформаційно-пошукова система
Розглянемо постановку завдання пошуку в загальному вигляді. Для цього нам необхідно відповісти на три питання: що шукати, то є, які джерела інформації, де шукати (місця розміщення цих джерел) і як шукати (які інструменти для цього використовувати).
Які основні джерела інформації, представлені в Інтернеті
Це документи WWW, статті в групах новин і списках розсилки, файли в бібліотеках файлів, довідники адресної інформації організацій і людей (електронна пошта, адреса, телефон), статті в тематичних базах даних, енциклопедіях.
Де ці джерела інформації розміщуються
Це такі популярні ресурси Інтернет, як WWW, групи новин, списки розсилки і FTP-сервери. Безумовно, можна шукати потрібні джерела інформації вручну, дізнаватися адреси з спеціалізованих журналів з інформатики та Інтернету, використовувати спеціальні паперові довідники з класифікованими по категоріях адресами. Однак для такого мінливого простору як Інтернет необхідно навчитися користуватися спеціальними інструментами, мета яких - збирати дані про інформаційних ресурсах і надавати користувачам послугу швидкого пошуку.
ІПС (Інформаційно-пошукова система) - це система, що забезпечує пошук і відбір необхідних даних у спеціальній базі з описами джерел інформації ( індексі ) на основі інформаційно-пошукової мови і відповідних правил пошуку.
Головним завданням будь ІПС є пошук інформації релевантної інформаційним потребам користувача. Дуже важливо в результаті проведеного пошуку нічого не втратити, тобто знайти всі документи, що відносяться до запиту, і не знайти нічого зайвого. Тому вводиться якісна характеристика процедури пошуку - релевантність.
Релевантність - це відповідність результатів пошуку сформульованому запиту. Далі ми будемо, в основному, розглядати ІПС для всесвітньої павутини (WWW). Основними показниками ІПС для WWW є просторовий масштаб і спеціалізація. За просторового масштабу ІПС можна розділити на локальні, глобальні, регіональні та спеціалізовані. Локальні пошукові системи можуть бути розроблені для швидкого пошуку сторінок в масштабі окремого сервера. Регіональні ІПС описують інформаційні ресурси певного регіону, наприклад, російськомовні сторінки в Інтернеті. Глобальні пошукові системи на відміну від локальних прагнуть осягнути неосяжне - По можливості найбільш повно описати ресурси всього інформаційного простору мережі Інтернет.
У загальному випадку, можна виділити наступні пошукові інструменти для WWW: каталоги, пошукові системи, метапоіскових системи.
Каталог
Каталог - пошукова система з класифікованих за темами списком анотацій з посиланнями на web-ресурси. Класифікація, як правило, проводиться людьми. Пошук в каталозі дуже зручний і проводиться за допомогою послідовного уточнення тем. Тим не менш, каталоги підтримують можливість швидкого пошуку певної категорії або сторінки по ключовими словами за допомогою локальної пошукової машини. База даних посилань (Індекс) каталогу звичайно має обмежений обсяг, заповнюється вручну персоналом каталогу. Деякі каталоги використовують автоматичне оновлення індексу. Результат пошуку в каталозі представляється у вигляді списку, що складається з короткого опису (анотації) документів з гіпертекстової посиланням на першоджерело.
Адреси популярних каталогів:
Зарубіжні каталоги:
Yahoo - www.yahoo.com Magellan - www.mckinley.com
Російські каталоги:
@ Rus - www . aport . ru Weblist - www . weblist . ru Равлик - www . ulitka . ru
Пошукова машина
Пошукова машина - пошукова система з формованої роботом базою даних, що містить інформацію про інформаційні ресурси. Відмінною рисою пошукових машин є той факт, що база даних, що містить інформацію про Web-сторінках, статтях Usenet і т.д., формується програмою-роботом. Пошук в такій системі проводиться за запитом, що складається користувачем, що складається з набору ключових слів або фрази, укладеної в лапки. Індекс формується і підтримується в актуальному стані роботами-індексіровщікамі. В описі документа найчастіше міститься кілька перших речень або витяги з тексту документа з виділенням ключових слів. Як правило, зазначена дата поновлення (перевірки) документа, його розмір у кілобайтах, деякі системи визначають мову документа і його кодування (для російськомовних документів). Що можна робити з отриманими результатами? Якщо назву та опис документа відповідає вашим вимогам, можна негайно перейти до його першоджерела по посиланню. Це зручніше робити в новому вікні, щоб мати можливість далі аналізувати результати видачі. Багато пошукові системи дозволяють проводити пошук у знайдених документах, причому ви можете уточнити ваш запит введенням додаткових термінів. Якщо інтелектуальність системи висока, вам можуть запропонувати послугу пошуку схожих документів. Для цього ви вибираєте особливо сподобався документ і вказуєте його системі як зразка для наслідування. Однак, автоматизація визначення схожості - вельми нетривіальне завдання, і часто ця функція працює неадекватно вашим надіям. Деякі пошуковики дозволяють провести пересортовування результатів. Для економії вашого часу можна зберегти результати пошуку у вигляді файлу на локальному диску для подальшого вивчення в автономному режимі.
Адреси найбільш популярних пошукових машин за кордоном і в Росії.
Зарубіжні пошукові машини :
Google - www.google.com Altavista - www.altavista.com Excite - www.excite.com HotBot - Www.hotbot.com Nothern Light - www.northernlight.com Go (Infoseek) - www.go.com ( infoseek.com ) Fast - www.alltheweb.com
Російські пошукові машини :
Яndex - www.yandex.ru (Або www.ya.ru ) Ремблер - www.rambler.ru Апарат - www.aport.ru
метапоіскових машина
метапоіскових система. Зверніть увагу на те, що різні пошукові системи описують різний кількість джерел інформації в Інтернет. Тому не можна обмежуватися пошуком тільки в одній із зазначених пошукових системах. Тепер познайомимося з інструментами пошуку, які не формують власний індекс, але вміють використовувати можливості інших пошукових систем. Це метапоіскових системи (Пошукові служби) - системи, здатні послати запити користувача одночасно декільком пошуковим серверам, потім об'єднати отримані результати і представити їх користувачеві у вигляді документа з посиланнями.
Адреси відомих метапоіскових систем:
MetaCrawler - www . metacrawler . com SavvySearch - www . savvysearch . com
Пошук джерел інформації
Обговоримо проблему пошуку такого джерела інформації, як статті в групах новин. Інструментами пошуку в даному випадку можуть бути розглянуті пошукові машини WWW, які індексують не тільки простір WWW, але й статті в телеконференціях і мають спеціальний режим пошуку саме в цьому ресурсі. Пошук в групах новостей підтримує, наприклад, пошуковий сервер Altavistа. Слід зазначити, що пошукові системи WWW вельми оперативно індексують групи новин і містять інформацію про статті, реально існуючих в мережі. Для пошуку в архівах новин існую спеціалізовані системи, найвідомішою з яких...