Санкт-Петербурзький державний
ІНЖЕНЕРНО-ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ
РЕФЕРАТ
Бази знань як сучасні інтелектуальні інформаційні системи
Санкт-Петербург
2009
Зміст
Введення
1 Загальні положення
1.1 Класифікація баз знань
1.2 Застосування баз знань
2 Інтелектуальна інформаційна система
2.1 Класифікація завдань, розв'язуваних ІВС
3 Бази знань в інтелектуальній системі
3.1 Машинне навчання
3.1.1 Загальна постановка задачі навчання по прецедентів
3.1.2 Способи машинного навчання
3.1.3 Класичні задачі вирішуються за допомогою машинного навчання
3.1.4 Типи вхідних даних при навчанні
3.1.5 Типи функціоналів якості
3.1.6 Практичні сфери застосування
3.2 Автоматичне доказ
Введення
База знань, БЗ (англ. Knowledge base, KB) - це особливого роду база даних, розроблена для управління знаннями (метаданими), тобто збиранням, зберіганням, пошуком і видачею знань. Розділ штучного інтелекту, що вивчає бази знань і методи роботи зі знаннями, називається інженерією знань.
Під базами знань розуміється сукупність фактів і правил виводу, що допускають логічний висновок і осмислену обробку інформація. Наприклад, у мові Пролог бази знань описуються у формі конкретних фактів і правил логічного висновку над базами даних і процедурами обробки інформації, які представляють відомості та знання про людей, предмети, факти події і процеси в логічній формі.
Найбільш важливою властивістю інформації, що зберігається в базах знань, є достовірність конкретних і узагальнених відомостей у базі даних і релевантності інформації, одержуваної з використанням правил виводу, закладених в базу знань. У відповідях на найпростіші запити до баз знань системи логічного програмування Пролог, видає значення В«істинаВ» і В«брехняВ» в залежності від наявності відповідних фактів.
Узагальнені відомості в мові Пролог задаються за допомогою правил логічного висновку, виконують роль визначення понять, а також логічних процедур, що складаються з наборів правил логічного висновку. Достовірність узагальнених відомостей залежить від наявності необхідних фактів та достовірності даних у базах знань.
Найбільш важливий параметр БЗ - якість містяться знань. Кращі БЗ включають саму релевантну, достовірну і свіжу інформацію, мають досконаліші системи пошуку інформації і ретельно продуману структуру і формат знань.
1. Загальні положення
1.1 Класифікація баз знань
В Залежно від рівня складності систем, в яких застосовуються бази знань, розрізняють:
1) БЗ всесвітнього масштабу - наприклад, Інтернет або Вікіпедія
2) БЗ національні - наприклад, Вікіпедія
3) БЗ галузеві-наприклад, Автомобільна енциклопедія
4) БЗ організацій
5) БЗ експертних систем
6) БЗ фахівців
1.2 Застосування баз знань
Прості бази знань можуть використовуватися для створення експертних систем та зберігання даних про організацію: документації, керівництв, статей технічного забезпечення. Головна мета створення таких баз - допомогти менш досвідченим людям знайти існуюче опис способу вирішення якої-небудь проблеми предметної області.
Онтологія може служити для представлення в базі знань ієрархії понять і їх відносин. Онтологія, що містить ще й екземпляри об'єктів не що інше, як база знань.
База знань - важливий компонент інтелектуальної системи. Найбільш відомий клас таких програм - експертні системи. Вони призначені для побудови способу рішення спеціалізованих проблем, грунтуючись на записах БЗ і на користувальницькому описі ситуації.
Створення і використання систем штучного інтелекту потребуватиме величезних баз знань.
2. Інтелектуальна інформаційна система
Інтелектуальна інформаційна система (ІІС) - це один з видів автоматизованих інформаційних систем, іноді ІІС називають системою, заснованих на знаннях. ІВС являє собою комплекс програмних, лінгвістичних і логіко-математичних засобів для реалізації основного завдання: здійснення підтримки діяльності людини і пошуку інформації в режимі просунутого діалогу на природній мові.
ІІС можуть розміщуватися на якому-небудь сайті, де користувач задає системі запитання на природній мові (Якщо це питально-відповідна система) або, відповідаючи на питання системи, знаходить необхідну інформацію (якщо це експертна система). Але, як правило, ЕС в інтернеті виконують рекламно-інформаційні функції (інтерактивні банери), а серйозні системи (такі, як, наприклад, ЕС діагностики обладнання) використовуються локально, оскільки виконують конкретні специфічні завдання.
Інтелектуальні пошуковики відрізняються від віртуальних співбесідників тим, що вони досить безликі і у відповідь на питання видають деяку вичавлювання з джерел знань (інколи досить великого обсягу), а співбесідники володіють В«характеромВ», особливою манерою спілкування (можуть використовувати сленг, ненормативну лексику), і їхні відповіді повинні бути гранично лаконічними (інколи навіть просто у формі смайликів, якщо це відповідає контексту :-)).
Для розробки ІІС раніше використовувалися логічні мови (Пролог, Лісп і т. д.), а зараз використовуються різні процедурні мови. Логіко-математичне забезпечення розробляється як для самих модулів систем, так і для стикування цих модулів. Однак на сьогоднішній день не існує універсальної логіко-математичної системи, яка могла б задовольнити потреби будь-якого розробника ІІС, тому доводиться або комбінувати накопичений досвід, або розробляти логіку системи самостійно. В області лінгвістики теж існує безліч проблем, наприклад, для забезпечення роботи системи в режимі діалогу з користувачем на природній мові необхідно закласти в систему алгоритми формалізації природної мови, а ця задача виявилася куди складнішою, ніж передбачалося на зорі розвитку інтелектуальних систем. Ще одна проблема - Постійна мінливість мови, яка обов'язково повинна бути відображена в системах штучного інтелекту.
2.1 Класифікація завдань, що вирішуються ІВС
1) Інтерпретація даних. Це одна з традиційних завдань для експертних систем. Під інтерпретацією розуміється процес визначення змісту даних, результати якого мають бути погодженими і коректними. Зазвичай передбачається багатоваріантний аналіз даних.
2) Діагностика. Під діагностикою розуміється процес співвідношення об'єкту з деяким класом об'єктів і/або виявлення несправності в деякій системі. Несправність - це відхилення від норми. Таке трактування дозволяє з єдиних теоретичних позицій розглядати і несправність устаткування в технічних системах, і захворювання живих організмів, і всілякі природні аномалії. Важливою специфікою є тут необхідність розуміння функціональної структури (В«анатоміїВ») диагностирующей системи.
3) Моніторинг. Основне завдання моніторингу - безперервна інтерпретація даних в реальному масштабі часу і сигналізація про вихід тих або інших параметрів за допустимі межі. Головні проблеми - В«пропускВ» тривожної ситуації і інверсна задача В«помилковогоВ» спрацьовування. Складність цих проблем в розмитості симптомів тривожних ситуацій і необхідність обліку тимчасового контексту.
4) Проектування. Проектування полягає в підготовці специфікацій на створення В«об'єктівВ» із заздалегідь визначеними властивостями. Під специфікацією розуміється весь набір необхідних документів - креслення, пояснювальна записка і т.д. Основні проблеми тут - здобуття чіткого структурного опису знань про об'єкт і проблема В«слідуВ». Для організації ефективного проектування і в ще більшій ступеня перепроектування необхідно формувати не лише самі проектні рішення, але і мотиви їх прийняття. Таким чином, в завдання...