Главная > Информатика, программирование > Всесвітня павутина www: гіпертекст, пошукові машини
Всесвітня павутина www: гіпертекст, пошукові машини25-01-2012, 11:08. Разместил: tester9 |
Реферат виконала: студентка 238 групи Мельник О. Н. Санкт-петербурзький державний університет економіки та фінансів Санкт - Петербург 2009 Всесвітня Павутина - це сукупність інформаційних ресурсів, зв'язаних засобами телекомунікацій і заснованих на гіпертекстовому поданні даних, розкиданих по всьому світу. Всесвітня Павутина також позначається як WWW (World Wide Web), W3 або просто Web. Одиницею гіпертекстових даних Всесвітньої Павутини є Web-сторінка - мінімальний фрагмент гіпертексту, який можна завантажити і прочитати за один раз. Web-сторінка містить текст, графіку і посилання на інші Web-сторінки. Для ідентифікації гіпертекстової сторінки в Мережі використовується так званий URL - Universal Resource Locator - Універсальний Локатор Ресурсів. В ньому міститься інформація про спосіб передачі даних між клієнтом і сервером (Протоколі), імені сервера, на якому знаходиться сторінка, шляхи в дереві каталогів сервера, за якою знаходиться сторінка і імені сторінки. Для представлення Web-сторінок використовується спеціальна мова розмітки гіпертексту - HTML (Hypertext Markup Language). Конструкції цього мови - теги - дозволяють управляти шрифтом, кольором тексту і фону, визначати посилання, вставляти графіку, аудіо і відео і т.п. Самі теги при читанні сторінки не видно, а видно тільки результати їхньої дії. Якщо порівняти, як виглядає сторінка в початковому тексті і вона ж на екрані браузера, то часом дивно, наскільки великі відмінності. Клієнта для WWW називають браузером. Браузер - це програма, яка завантажує і, інтерпретуючи теги HTML, показує в своєму вікні WWW-сторінки. Браузер відображає картинки в тілі сторінки, програє аудіо і відео, завантажує наступну сторінку, коли користувач клацає мишею по посиланню і пр. і пр. для того, щоб зробити подорож по Всесвітній Павутині якомога більш комфортним. Гіпертекст і web-сторінки Гіпертекст (Hypertext) - це документ (у першу чергу текстовий), що містить гіперпосилання. Гіперпосилання - це зв'язок слова або міститься в документі зображення з іншим ресурсом, яким може бути як ще один документ, так і розділ поточного документа. Подібні "пов'язані" слова або картинки документа, як правило, виділяються з оформлення із загального тексту. Загальноприйнятою є практика підкреслення слова або пропозиції, пов'язаного гіперпосиланням. Сам термін "гіпертекст" з'явився з виникненням електронних документів, задовго до появи служби WWW. Оскільки сучасні електронні документи містять не тільки текст, але і мультимедіа-інформацію, поняття гіпертексту було розширено до поняття гіпермедіа. Гіпермедіа - це метод організації мультимедіа-інформації на основі посилань на різні типи даних. Гіпермедіа-документи можуть використовуватися не тільки в WWW, але і, наприклад, в електронної енциклопедії на CD-ROM, де посилання в тексті часто веде на аудіо- або відеоролик. Особливо продуктивної ідея гіпертексту виявилася стосовно до об'єднання цифровий інформації, розподіленої на серверах у всьому світі. Документ, доступний через Web, називають Web-сторінкою, а групи сторінок, пов'язаних загальним ім'ям, темою та об'єднаних навігаційно, - Web-сайтами. Першу сторінку, яку бачить користувач при зверненні на той чи інший ресурс, називають стартовою, домашньої або індексного сторінкою (home page). Система гіперпосилань визначає структуру Web-сайту. Сторінки на сайті можуть мати лінійну деревоподібну структуру, але частіше на кожній сторінці є декілька посилань, що і дозволяє говорити про структурі "павутина" (див. рис. 1)
Малюнок 1 Пошук інформації в Internet Як правило, послідовність пошуку інформації в Internet виглядає наступним чином: Конкретизується область пошуку, виділяються ключові слова, характерні для цікавить області. Рекомендується по можливості підбирати такі слова, які не використовуються ні в яких інших областях діяльності або знання. На пошуковий сервер надсилається запит, сформований з ключових слів. На багатьох пошукачах є можливість конкретизувати область пошуку шляхом вибору відповідних пунктів пропонованих меню. Так чи інакше, від сервера приходить список посилань на WWW-сторінки, в яких виявлені запитані слова з коротким описом кожної з них або просто з невеликим початковим фрагментом сторінки. Далі слід дослідження підходящих (судячи по заголовку або опису) сторінок. Тут починається "вільне плавання", тобто перехід по посиланнях з текстом, який обіцяє щось цікаве. Збереження на диску цікавить матеріалу. Відшукати потрібну інформацію в Сьомому океані - океані інформації було б просто неможливо якби не існувало пошукових серверів. Такі сервери надають можливість пошуку сторінок за ключовим словом або в ієрархічному дереві каталогу. Існують як чисто англомовні і російськомовні, так і змішані сервери. Документів на англійській мові в Internet набагато більше, ніж російською, тому має сенс відвідати також і західні пошуковики. Для пошуку інформації за ключовим словом на пошуковий сервер надсилається запит. Запит формується автоматично - потрібно тільки ввести слова в полі введення, вибрати потрібні опції пошуку і натиснути кнопку. Назад приходить Web-сторінка зі звітом про результатах пошуку. Так як список знайдених документів може бути дуже великим, він розбивається на фрагменти по 10-100 елементів (на кожному сервері по-різному), а в кінці звіту наводяться посилання на такі фрагменти списку. Кожен елемент звіту формується таким чином: - на початку йде заголовок документа є також і посиланням на цей документ (Якщо у документа немає заголовка - може бути і таке - то тут поміщається напис 'No title'); - далі йде невеликий фрагмент самого документа за яким практично завжди можна зрозуміти, про що йде мова в документі і, отже, підходить він вам чи ні; - і, нарешті, список URL даного документа (один і той же документ може бути продубльований за різними адресами). Щоб перейти до документа, досить клацнути або по посиланню з текстом заголовка, або по одній з посилань з URL. До речі, єдиний пошуковик, який видає користувачеві не фрагмент документа, а справжню анотацію (англійською мовою), написану людьми - це Yahoo. Другий метод відшукання документів, наданий пошуковими серверами - пошук по каталогами. Практично на всіх пошукових машинах є такі каталоги (Виняток - Altavista, Rambler). У таких каталогах вся область знань розбивається на кілька великих підобластей, наприклад, мистецтво, бізнес, комп'ютери, освіта, спорт, політика, подорожі, здоров'я і т.д. і т.п. Дале кожна така підобласть розбивається на більш дрібні розділи і підрозділи. Таким чином в процесі пошуку ви на кожному кроці будете уточнювати шукане поняття, звужуючи область пошуку, поки не отримаєте список посилань на документи, вже більше відповідних потрібної вам теми. Найбільш популярними англомовними пошуковими є: Yahoo, Magellan, Infoseek, Excite, WebCrawler, російськомовними: Rambler, Російська Машина Пошуку, всеязичним - Altavista, Altavista Telia. Класифікація пошукових машин Перша таблиця включає в себе провідні світові пошукові машини, які були першими пошуковими службами в мережі Інтернет. З їх допомогою користувачі можуть вести пошук, використовуючи ключові слова або логічні конструкції. Більшість служб використовує спеціальні мови запитів. Крім того, можна скористатися вже існуючої ієрархією каталогів. Наприклад, якщо ви шукаєте сайт певної газети, то потрібно слідувати по каталогу Yahoo! наступним чином: News and Media>> Newspapers> The New York Times Altavista і Yahoo! лідирують у цьому списку. На цих сайтах є велика база даних і добре структурована ієрархія. Euroseek незамінний при пошуку окремих європейських ресурсів. Гло...бальні пошукові машини Altavista - .altavista.com Yahoo! - Http://www.yahoo.com Lycos - .lycos.com/ HotBot - .hotbot.com EuroSeek - .euroseek.net/page?ifl=uk Excite - .excite.com Infoseek - .infoseek.com/Оскільки всі вищеперелічені пошукові системи використовують різні бази даних, то використовуючи одні й ті ж ключові слова, можна отримати абсолютно різні результати. Іноді краще звернеться до так званих системам "Мета-пошуку". Такі пошукові машини посилають ваш запит на величезну кількість різних пошукових систем. Потім обробляють отримані результати, видаляють повторювані адреси ресурсів і представляють більш широкий спектр того, що представлено в мережі Інтернет. Системи мета-пошуку Inference Find - .inference.com/infind/ Meta Find - .metafind.com/ Metacrawler - .metacrawler.com/ Webcrawler - .webcrawler.com/ Dogpile - .dogpile.com/Іноді з певної тематики пошукова система видає така величезна кількість посилань, що користувач просто не в змозі переглянути їх усіх і знайти найкраще. Northern Light і About.com (раннє відомий як The Mining Company) використовують послуги експертів, які вносять у базу даних найкращі ресурси. Ці сайти дуже інформативні та представляють дуже цінну інформацію. Спеціальні пошукові системи Northern Light - .nlsearch.com/ About.com - about.comІноді вам необхідна сама загальна інформація. Для цього можна скористатися онлайновими енциклопедіями. У деяких випадках статті енциклопедії містять посилання на необхідні ресурси. Енциклопедії Енциклопедія Британіка - .britannica.com/ Кирило і Мефодій - .km.ruЧерез неймовірного збільшення інформаційних ресурсів Інтернет в останні роки деякі старі пошукові системи перестали бути ефективними. Тому з'явилися такі пошукові машини, як Google і Direct Hit, які сортують посилання по принципом популярності. Використовуючи математичний алгоритм, вони видають адреси тих ресурсів, на які найчастіше вказують інші сайти. Пошукові системи другого покоління Google - .google.com/ Direct Hit - .directhit.com/Висновок Інтернет, міцно увійшовши у наше життя, зміг за дуже короткий час істотно змінити її. Зараз інтернет - найбільш швидке, надійне засіб спілкування та обміну інформацією між людьми. З його допомогою з'явилася можливість знаходження будь інформації, що цікавить, без урахування її місця розташування, з'явилося таке властивість інформації, як загальнодоступність у світовому масштабі. Список літератури Галанін С. В«WWW - всесвітня павутинаВ». /Http://iatp.ulstu.ru/edu/internet/www/ Прохоров А.Н. В«Всесвітня павутина (www)В». /Http://www.intuit.ru/department/office/od/7/ Пошукові машини Інтернет. /Http://www.pskov.org.ru/engines.html Пошукова система. Вікіпедія. / Всесвітня павутина. /Http://dic.academic.ru/dic.nsf/ruwiki/18318 Для підготовки даної роботи були використані матеріали з сайту referat.ru |