Реферат
на тему:
В«Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи В».
2010
Зміст
1. Основні методи пошуку інформації в Інтернеті ............................... 4
1.1 Безпосередній пошук з використанням гіпертекстових посилань ....... 4
1.2 Використання пошукових машин .................................................... 4
1.3 Пошук із застосуванням спеціальних засобів ........................................ 5
1.4 Аналіз нових ресурсів .................................................................. 5
2. Пошукові системи ....................................................................... 7
2.1 Використання пошукових систем на Заході ....................................... 7
2.2 Історія пошукових систем ............................................................. 8
3. Російськомовні пошукові системи ................................................. 10
Список використаних джерел ................................................... 12
Введення
У наш ХХI століття, володіння інформацією, говорить про те, що людина освічена і респектабелен.
Більш-менш серйозний підхід до будь-якій задачі починається з аналізу можливих методів її вирішення.
Пошук інформації в Інтернеті може бути проведений за кільком методам, значно розрізняються як по ефективності і якості пошуку, так і по типу витягуваної інформації.
У ряді випадків доводиться використовувати дуже трудомісткі методи - результат того вартий.
Пошукова система - програмно-апаратний комплекс з веб-інтерфейсом, що надає можливість пошуку інформації в Інтернеті.
У просторіччі під пошуковою системою подразумевают веб-сайт, на якій розміщений інтерфейс (фронт-енд) системи.
Програмною частиною пошукової системи є пошукова машина (пошуковий движок) - комплекс програм, що забезпечує функціональність пошукової системи і є комерційною таємницею компанії-розробника пошукової системи.
1. Основні методи пошуку інформації в Інтернеті
Можна виділити наступні основні методи пошуку інформації в Інтернеті, які, в залежності від цілей і завдань шукає, використовуються окремо або в комбінації один з одним:
1.1 Безпосередній пошук з використанням гіпертекстових посилань
Оскільки всі сайти в просторі WWW фактично виявляються пов'язаними між собою, пошук інформації може бути проведений шляхом послідовного перегляду пов'язаних сторінок за допомогою браузера.
Хоча цей повністю ручний метод пошуку виглядає повним анахронізмом у Мережі, що містить більше 60 млн. вузлів, "ручний" перегляд Web-сторінок часто виявляється єдино можливим на заключних етапах інформаційного пошуку, коли механічне "копання" поступається місцем більш глибокому аналізу.
Використання каталогів, класифікованих і тематичних списків і всіляких невеликих довідників також належить до цьому виду пошуку.
1.2 Використання пошукових машин
Сьогодні цей метод є одним з основних і фактично єдиним при проведенні попереднього пошуку. Результатом останнього може бути список ресурсів Мережі, що підлягають детальному розгляду.
Як правило, застосування пошукових машин засноване на використанні ключових слів, які передаються пошукових серверів у якості аргументів пошуку: що шукати.
Якщо робити все правильно, то формування списку ключових слів вимагає попередньої роботи по складанню тезауруса.
1.3 Пошук із застосуванням спеціальних засобів
Цей повністю автоматизований метод може виявитися досить ефективним для проведення первинного пошуку.
Одна з технологій цього методу заснована на застосуванні спеціалізованих програм - спайдеров, які в автоматичному режимі переглядають Web-сторінки, відшукуючи на них шукану інформацію.
Фактично це автоматизований варіант перегляду з допомогою гіпертекстових посилань, описаний вище (пошукові машини для побудови своїх індексних таблиць використовують схожі методи).
Немає потреби говорити, що результати автоматичного пошуку обов'язково вимагають подальшої обробки.
Застосування даного методу доцільно, якщо використання пошукових машин не може дати необхідних результатів (наприклад, в силу нестандартності запиту, який не може бути адекватно заданий існуючими засобами пошукових машин).
У ряді випадків цей метод може бути дуже ефективний.
Вибір між використанням спайдера або пошукових серверів являє собою варіант класичного вибору між застосуванням універсальних або спеціалізованих засобів.
1.4 Аналіз нових ресурсів
Пошук по новоствореним ресурсів може виявитися необхідним при проведенні повторних циклів пошуку, пошуку найбільш свіжої інформації або для аналізу тенденцій розвитку об'єкта дослідження в динаміці.
Іншою можливою причиною може з'явитися те, що більшість пошукових машин оновлює свої індекси зі значною затримкою, викликаної гігантськими обсягами оброблюваних даних, і ця затримка зазвичай тим більше, ніж менш популярна цікавить тема.
Це міркування може виявитися досить істотним при проведенні пошуку в вузькоспеціальної предметної області.
2. Пошукові системи
Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.
Основними критеріями якості роботи пошукової машини є релевантність (ступінь відповідності запиту і знайденого, тобто доречність результату), повнота бази, врахування морфології мови.
Індексація інформації здійснюється спеціальними пошуковими роботами.
Останнім часом з'явився новий тип пошукових движків, заснованих на технології RSS, а також серед XML-даних різного типу.
Поліпшення пошуку - це одне з пріоритетних завдань сьогоднішнього Інтернету.
2.1 Використання пошукових систем на Заході
За даними компанії Net Applications в грудні 2007 року використання пошукових систем на Заході розподілялося таким чином:
Google - 77,04%
Yahoo - 12,46%
MSN - 3,33%
Microsoft Live Search - 2,57%
AOL - 2,12%
Ask - 1,38%
AltaVista - 0,13%
Excite - 0,07%
Lycos - 0,02%
All the Web - 0,02%
У вищенаведений звіт не входять російські пошуковики, такі як, наприклад, Яндекс, Рамблер або Nigma.
За даними аналітичної компанії comScore всі пошукові сайти в грудні 2007 року обробили 66 млрд 221 млн пошукових запитів.
Яндекс потрапив в статистику і знаходиться на 9-му місці.
2.2 Історія пошукових систем
Одним з перших інструментів пошуку в інтернеті (до WWW) був Archie.
Першої пошуковою системою для Всесвітньої павутини був В«WandexВ», вже не існуючий індекс, який створював В«World Wide Web Wanderer В»- бот, розроблений Метью Греєм (англ. Matthew Gray) з Массачусетського технологічного інституту в 1993.
Також в 1993 році з'явилася пошукова система В«AliwebВ», працююча досі.
Першої повнотекстової, тобто індексуються ресурси за допомогою робота, пошуковою системою стала В«WebCrawlerВ», запущена в 1994.
На відміну від своїх попередників, вона дозволяла користувачам шукати по будь ключовими словами на будь-який веб-сторінці - з тих пір це стало стандартом у всіх основних пошукових системах.
Крім того, це був перший пошуковик, про який було відомо в широких колах.
У 1994 був запущений В«LycosВ», розроблений в університеті Карнегі Мелона.
Незабаром з'явилася безліч інших конкуруючих пошукових машин, таких як В«ExciteВ», В«InfoseekВ», В«InktomiВ», В«Northern LightВ» і В«AltaVistaВ».
У певному сенсі вони конкурували з популярними інтернет-каталогами, та...