Методы извлечения знаний из предметного эксперта
|
Описание
|
Наблюдение на рабочем месте
|
Наблюдать за экспертом, решающим реальные задачи на своем
рабочем месте.
|
Обсуждение задач
|
Выявить виды данных, знаний и процедур, необходимых для
решения конкретных задач.
|
Описание задач
|
Попросить эксперта описать прототипную задачу для каждой
категории возможных ответов.
|
Анализ задачи
|
Представить эксперту ряд реалистических задач для решения
вслух с целью выявить логические основания конкретных шагов рассуждения.
|
Доводка системы
|
Попросить эксперта предоставить вам несколько задач для
решения и с использованием правил, выявленных во время интервью.
|
Оценивание системы
|
Попросить эксперта проверить работу системы и подвергнуть
критике правила и структуру управления прототипной системой.
|
Проверка системы
|
Предоставить примеры, решенные экспертом и прототипом
системы, другим независимым экспертам для сравнения и оценки.
|
Технику извлечения знаний можно разделить на шесть основных классов:
опрос с наводящими вопросами, структурированный опрос, самонаблюдение,
самоотчет, диалог, критический обзор. Каждый класс, в свою очередь, состоит из
нескольких технических методов. Подробную информацию мы рассматривать не будем,
укажем только, что цель извлечения знаний может быть достигнута различными
способами в зависимости оттого, как эти знания будут анализироваться.
Эксперт, способный работать с вычислительной техникой, может также
взаимодействовать с интеллектуальной системой непосредственно через
редактирующую программу. Эта программа должна обладать развитым диалоговым
интерфейсом и знаниями о структуре БЗ. Однако возникает проблема эффективности
взаимодействия эксперта с программой.
Еще одним способом приобретения знаний системой является автоматизация
извлечения знаний и запись их в БЗ. Неавтоматизированный сбор знаний
специалистов - трудоемкий процесс. В связи с этим в развитых интеллектуальных
системах предусматриваются вспомогательные средства для приобретения знаний.
Интернет или Интранет также могут использоваться для облегчения процесса
извлечения знаний. Электронное интервьюирование может проводиться, если инженер
знаний и эксперты находятся в различных местах. Также, эксперты могут
утверждать и сопровождать базы знаний на расстоянии. Посредством Интернет могут
быть достигнуты документированные знания. Проблемой является идентификация
знаний: задача, которая может быть облечена интеллектуальными агентами.
Актуальной является также задача автоматической структуризации
неформальных знаний, доступных в Интернет через распределенную гипермедиа
систему - Web. Технология гипермедиа через Web обеспечивает идеальный подход
для развития систем, основанных на знаниях путем расширения возможностей
каналов человеко-машинного взаимодействия. Этот новый подход к интеграции
технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как
они будут формализованы.
Многие Web-механизмы поиска включают интеллектуальных агентов для
идентификации и поставки требуемой информации по индивидуальным потребностям и
запросам.
Причина экспоненциального роста количества информации, обеспечиваемого
через Web-механизмы, вызывает развитие методов структуризации информации в
распределенных гипермедиа системах.
Такая интеграция между технологией гипермедиа и методами извлечения
знаний может обеспечить мощный инструмент для извлечения знаний.
Практический опыт решения задачи приобретения знаний привел к развитию
методов и программных средств, призванных упростить процесс приобретения
знаний. Эти средства и методы для приобретения знаний могут быть разделены на
три категории: редакторы и интерфейсы для формирования баз знаний, средства для
объяснения различных аспектов работы, средства для модификации баз знаний.
Рассмотрим процесс автоматизации извлечения знаний, формирования модели и
заполнения БЗ в интеллектуальной системе прогнозирования для решения задач
оперативного планирования и диспетчерского управления многостадийной системы
дискретного производства.
Краткая характеристика проблемной области.
Многостадийная производственная система состоит из подсистемы
механической обработки деталей, сборки агрегатов и окончательной сборки
готового изделия.
Подсистема механической обработки представляет собой производственную
линию, построенную как поточная. Каждому центру обработки такой линии
предоставляются станки с одними и теми же рабочими характеристиками. Работа
подсистемы организуется таким образом, что сначала производятся установка и
настройка, а затем детали подвергаются механической обработке,
В подсистеме сборки полуфабрикаты не могут храниться на линии сборки, а
некоторые виды деталей собираются с помощью операций установки.
Составление оперативного плана, эффективно координирующего работу
подсистем многостадийной производственной системы, связано с рядом проблем;
. Проблема распределения: какие типы деталей или изделий будут назначены
для обработки на каждой производственной линии, если каждая подсистема состоит
из одной или более линий?
. Проблема принятия решений относительно размера партии: какое следует
принять решение относительно размера партии изделий, для которой составляется
план?
. Проблема диспетчеризации: в какой последовательности следует обрабатывать
изделия на каждой производственной линии; возможность возникновения
непредвиденных и аварийных ситуаций, и т. д.
Целевыми показателями данной многостадийной производственной системы
являются: загрузка каждой линии; уровень запасов, имеющийся между подсистемами;
среднее запаздывание в выполнении заказов; общие издержки производства,
включающие в себя эксплуатационные расходы, издержки на наладочные работы,
текущие издержки на поддержание запасов и убытки, связанные с просрочкой
заказов.
Решение в системе принимает управленческий персонал, связанный с разными
сторонами производственного цикла.
Характеристика интеллектуальной системы прогнозирования.
Эта система предназначена для прогнозирования ситуаций и их развития,
объяснения и обоснования прогноза, а также выдачи рекомендации по устранению
возникающих «узких мест» и нежелательных ситуаций при решении задач
диспетчеризации и оперативного планирования производства.
В системе знания экспертов о производственном процессе представлены в
виде правил «Если ...Тогда ...» . При решении задачи система имитирует
рассуждения человека-эксперта. Знания эксперта о процессе и его основных
закономерностях расположены в двух БЗ, в которых сосредоточены как знания,
связанные с прогнозированием развития ситуаций на производстве, так и
рекомендации по устранению «узких мест».
Концептуальная модель (КМ) производства.
Модель является базисом для построения прогнозирующей модели. В состав ее
входит: совокупность эвристических правил на множестве факторов, оказывающих
непосредственное или опосредованное влияние как на условия протекания процесса,
так и на сам процесс. Факторы условно делятся на описатели и действия.
Описателями названа группа факторов, характеризующих различные аспекты
процесса. Действиями названы факторы, способные изменить состояние процесса.
Однако следует отметить, что существует целый ряд факторов, однозначно не
классифицируемых.
Каждое правило в общем случае представляет совой эвристическую
зависимость следующего вида:
Если <фактор-1> = <значение-1> И <фактор-2> =
<значение-2> И..
Тогда <фактор - следствие) = (увеличивается/уменьшается)
ДОСТОВЕРНОСТЬ (число из диапазона 0...100>
Каждому такому правилу приписывается некоторый вес (число в диапазоне
0... 100), означающий степень уверенности экспертов в реальном существовании и
действенности данного правила. Конкретные веса всех правил в модели
определяются методом опроса экспертов и уточняются в процессе отладки модели и
эксплуатации системы.
Последними из рассматриваемых компонентов КМ производства являются показатели
стабильности факторов-описателей, измеряемые числом из диапазона 0 ... 100 и
показывающие, какой процент от начального уровня будет составлять уровень
данного фактора в конце периода прогнозирования при отсутствии всех влияющих
воздействий. Так, значение стабильности 80% означает, что уровень данного
фактора к концу прогнозируемого периода будет составлять 80% уровня в начале
периода при отсутствии всех влияющих воздействий.
Для формализации знаний о процессе за основу взята модель, описанная
выше. Все правила делятся на два типа: повышающие и понижающие уровень
фактора-следствия. Если правила сгруппировать по факторам-следствиям, то
получим пакеты правил, являющиеся подмоделями исходной модели и описывающие
динамику одного конкретного фактора в зависимости от других факторов. Примером
пакета правил может служить совокупность правил, влияющих на ритмичность работы
подсистемы сборки агрегатов.
Для выполнения операций увеличения и уменьшения необходимо каждому
фактору поставить в соответствие непрерывное или дискретное множество значений.
В системе в качестве метрики для всех факторов выбран непрерывный интервал 0
... 100. Такое шкалирование легко воспринимается экспертами как естественная
(процентная) шкала. Однако экспертам-авторам знаний и экспертам-пользователям
(поставщикам исходной информации) зачастую бывает удобно пользоваться
лингвистическими значениями типа «мало», «много», «около...» и т. д. Для
манипулирования подобными значениями предложено строить функции принадлежности
на том же универсальном множестве [0, 100].
При прогнозировании развития ситуации по одному из факторов (т. е. при
учете одного пакета правил), как уже было сказано выше, существуют причины,
повышающие уровень данного фактора, и причины, понижающие его уровень. В связи
с этим в системе использован механизм порождения гипотез двух типов: гипотезы о
повышении уровня данного фактора и гипотезы о понижении его уровня. Каждая
гипотеза во время своего возникновения (при условии наличия причин, порождающих
эту гипотезу) имеет степень своей истинности, зависящую от степени выполнения
порождающих причин, т. е. степени «срабатывания» данных правил. Значения
истинности вырабатываются на непрерывной шкале [0, 1]; 0 - абсолютно ложно, 1 -
абсолютно истинно.
Например, существует правило, что выход из строя линии механической
обработки (без наличия резервных мощностей) уменьшает выход собранных агрегатов
в подсистеме сборки агрегатов, причем достоверность этого правила равна 60%.
Пусть далее в качестве исходной информации задано, что уровень выхода из строя
одной из линий механической обработки равен 70. Тогда будет порождена гипотеза
об увеличении уровня ситуации, связанной с уменьшением выхода собранных
агрегатов со степенью истинности 60*70/100 (%)=42%=0,42.
Для вычисления итогового прогнозируемого уровня в системе используются
две формулы учета гипотез. Первая формула эквивалентна формуле условной
вероятности Шортлиффа, с ее помощью осуществляется пересчет итогового
прогнозируемого уровня для гипотез, повышающих уровень данного фактора:
С=С0+е*(100-С0) (1)
Здесь Со - текущий уровень (из интервала [0, 100]); е - степень
истинности очередной гипотезы (из интервала [0, 1]); С - результирующий уровень
(из интервала [0, 100]).
Аналогично для гипотез, понижающих уровень данного фактора, используется
формула
С=С0*(1-е) (2)
Как видно из приведенных выше формул, они не взаимно симметричны в том
смысле, что в зависимости от порядка, в котором эти две формулы применяются,
результат будет различным. Для учета этой асимметрии все связи из пакета правил,
повышающие уровень данного фактора, «активизируются» раньше связей, понижающих
его уровень. Таким образом, в начале порождаются все гипотезы о повышении (и
действует формула (1)), затем - все гипотезы о понижении (и действует формула
(2)).
Итак, каждый пакет правил имеет четыре компонента: 1) правило, отражающее
самодинамику фактора-следствия (стабильность); 2) группу правил, порождающих
гипотезы об увеличении уровня фактора-следствия; 3) группу правил, порождающих
гипотезы об уменьшении уровня фактора-следствия; 4) два правила, содержащих
формулы учета гипотез (1) и (2).
Как известно, в экспертных системах знания, описывающие предметную
область, как правило, вынесены за пределы основного программного текста и
составляют качественно самостоятельный элемент - базу знаний. Если содержимое
БЗ поддается единообразной структуризации и может быть унифицировано, то
появляется возможность автоматизировать процесс извлечения знаний и
формирования модели, что очень важно при БЗ с большим числом правил.
Так как все правила описанной модели имеют неизменную и переменную части,
задача автоматизации заключается в том, чтобы избавить пользователя от
избыточного ввода повторяющихся частей, исключить ошибки и упростить процесс
ввода переменных частей правил.
Специальная программа с помощью запросов позволяет вводить переменные
части правил. Чтобы процесс ответа на запросы не был трудоемким и во избежание
ошибок при вводе компонентов, имеющих фиксированный список значений, на экране
высвечивается набор возможных ответов («меню»). При этом пользователь имеет
возможность посредством клавиш управления курсором выбрать из них нужный и
нажатием клавиши «ВВОД» подтвердить его. При запросах, на которые требуется
ответ в цифрах, программа проверяет значение по граничным условиям и предупреждает
ошибки звуковым сигналом. На верхней строке экрана всегда высвечивается полное
название рассматриваемого фактора, для которого генерируется пакет правил.
Следует отметить, что для удобства все факторы пронумерованы числами
натурального ряда.
4.
Теоретические аспекты получения знаний
Существует несколько стратегий получения знаний. Наиболее
распространенные:
∙ приобретение;
∙ извлечение;
∙ формирование.
Под приобретением знаний понимается способ автоматизированного построения
базы знаний посредством диалога эксперта и специальной программы (при этом
структура знаний заранее закладывается в программу). Эта стратегия требует
существенной предварительной проработки предметной области. Системы
приобретения знаний действительно приобретают готовые фрагменты знаний в
соответствии со структурами, заложенными разработчиками систем. Большинство
этих инструментальных средств специально ориентировано на конкретные экспертные
системы с жестко обозначенной предметной областью и моделью представления
знаний, т.е. не являются универсальными. Например, система TEIRESIAS, ставшая
прародительницей всех инструментариев для приобретения знаний, предназначена
для пополнения базы знаний системы MYCIN или ее дочерних ветвей, построенных на
"оболочке" EMYCIN в области медицинской диагностики с использованием
продукционной модели представления знаний.
Термин извлечение знаний касается непосредственного живого контакта
инженера по знаниям и источника знаний. Авторы склонны использовать этот термин
как более емкий и более точно выражающий смысл процедуры переноса
компетентности эксперта через инженера по знаниям в базу знаний экспертной
системы.
Термин формирование знаний традиционно закрепился за чрезвычайно
перспективной и активно развивающейся областью инженерии знаний, которая
занимается разработкой моделей, методов и алгоритмов анализа данных для
получения знаний и обучения. Эта область включает индуктивные модели
формирования гипотез на основе обучающих выборок, обучение по аналогии и другие
методы.
Таким образом, можно выделить три стратегии проведения стадии получения
знаний при разработке экспертных систем (рисунок 4).
На современном этапе разработки экспертных систем в нашей стране
стратегия извлечения знаний, по-видимому, является наиболее актуальной,
поскольку промышленных систем приобретения и формирования знаний на
отечественном рынке программных средств практически нет.
Извлечение знаний - то процедура взаимодействия эксперта с источником
знаний, в результате которой становятся явными процесс рассуждений специалистов
при принятии решения и структура их представлений о предметной области.
Рисунок 4 - Три стратегии получения знаний
В настоящее время большинство разработчиков экспертных систем отмечают,
что процесс извлечения знаний остается самым "узким" местом при
построении промышленных систем.
Процесс извлечения знаний - это длительная и трудоемкая процедура, в
которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной
психологии, системному анализу, математической логике и пр., необходимо
воссоздать модель предметной области, которой пользуются эксперты для принятия
решения. Часто начинающие разработчики экспертных систем, желая избежать этой
мучительной процедуры, задают вопрос: может ли эксперт сам извлечь из себя
знания? По многим причинам это нежелательно.
Во-первых, большая часть знаний эксперта - это результат многочисленных
наслоений, ступеней опыта. И часто зная, что из А следует В, эксперт не дает
себе отчета, что цепочка его рассуждении была гораздо длиннее, например С ≈>D,
D ≈> А, А ≈> В, или А ≈> Q,,═ Q->R,═R->B.
Во-вторых, как было известно еще древним (вспомним "Диалоги"
Платона), мышление диалогично. И поэтому диалог инженера по знаниям и эксперта
- наиболее естественная форма "раскручивания" лабиринтов памяти
эксперта, в которых хранятся знания, частью носящие невербальный характер, т.е.
выраженные не в форме слов, в форме наглядных образов, например. Именно в
процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные
образы надевает четкие словесные ярлыки, т.е. вербализует знания.
В-третьих, эксперту гораздо труднее создать модель предметной области
вследствие той глубины и необозримости информации, которой он обладает.
Многочисленные причинно-следственные связи реальной предметной области образуют
сложную систему, из которой выделить "скелет", или главную структуру,
иногда доступнее аналитику, владеющему к тому же системной методологией. Любая
модель - это упрощение, а упрощать легче с меньшим знанием деталей.
Чтобы разобраться в природе извлечения знаний, выделим три основных
аспекта этой процедуры (рисунок 5): психологический, лингвистический,
гносеологический.
Рисунок 5 - Основные аспекты извлечения знаний
.1 Психологический аспект
Из трех выделенных аспектов извлечения знаний психологический является,
по-видимому, главным, поскольку он определяет успешность и эффективность
взаимодействия инженера по знаниям (аналитика) с основным источником знаний -
экспертом - профессионалом. Мы выделяем психологический аспект еще и потому,
что извлечение знаний происходит чаше всего в процессе непосредственного
общения разработчиков системы.
Стремление и умение общаться могут характеризовать степень
профессионализма инженера по знаниям.
Известно, что потери информации при разговорном общении велики (рисунок
6). В связи с этим рассмотрим проблему увеличения информативности общения
аналитика и эксперта за счет использования психологических знаний.
Инженер по знаниям Эксперт
Рисунок 6 - Потери информации при общении
Рисунок 7 - Структура психологического аспекта извлечения знаний
Мы можем предложить такую структурную модель общения при извлечении
знаний:
∙ участники общения (партнеры);
∙ средства общения (процедура);
∙ предмет общения (знания).
Контактный слой
Практически все психологи отмечают, что на любой коллективный процесс
влияет атмосфера, возникающая в группе участников. Существуют эксперименты,
результаты которых неоспоримо говорят, что дружеская атмосфера в коллективе
больше влияет на результат, чем индивидуальные способности отдельных членов
группы. Особенно важно, чтобы в коллективе разработчиков складывались
кооперативные, а не конкурентные отношения. Для кооперации характерна атмосфера
сотрудничества, взаимопомощи, заинтересованности в успехах друг друга, т.е. уровень
нравственного общения, а для отношений конкурентного типа - атмосфера
индивидуализма и межличностного соперничества (более низкий уровень общения).
К сожалению, прогнозировать совместимость в общении со 100%-ной гарантией
невозможно. Однако можно выделить ряд черт личности, характера и других
особенностей участников общения, несомненно, оказывающих влияние на
эффективность процедуры. Знание этих психологических закономерностей составляет
часть багажа психологической культуры, которым должен обладать инженер по
знаниям для успешного проведения стадии извлечения знаний:
· доброжелательность и дружелюбие;
· чувство юмора;
· хорошая память и внимание;
· наблюдательность;
· воображение и впечатлительность;
· большая собранность и настойчивость;
· общительность и находчивость;
· аналитичность;
· располагающая внешность и манера одеваться;
· уверенность в себе.
Процедурный слой
Инженер по знаниям, успешно овладевший наукой доверия и взаимопонимания с
экспертом (контактный слой), должен еще уметь воспользоваться благоприятным
воздействием этой атмосферы. Проблемы процедурного слоя касаются проведения
самой процедуры извлечения знаний. Здесь мало проницательности и обаяния,
полезного для решения проблемы контакта, тут необходимы профессиональные
знания.
Остановимся на общих закономерностях проведения процедуры.
Беседу с экспертом лучше всего проводить в небольшом помещении
tete-a-tete. Освещение, тепло, уют влияют непосредственно на настроение. Чай
или кофе создадут дружескую атмосферу. Американский психолог И. Атватер
считает, что для делового общения наиболее благоприятная дистанция от 1,2 до 3
м. Минимальным "комфортным" расстоянием можно считать 0,7 - 0,8 м.
Реконструкция собственных рассуждений - нелегкий труд, и поэтому
длительность одного сеанса обычно не превышает 1,5 - 2ч. Эти два часа лучше
выбрать в первой половине дня (например, с 10 до 12 ч). Известно, что взаимная
утомляемость партнеров при беседе наступает обычно через 20 - 25 мин, поэтому в
сеансе нужны паузы. Любой инженер по знаниям имеет свою уникальную манеру
разговора. Одни говорят быстро, другие медленно; одни громко, другие тихо и
т.д. Стиль разговора изменить практически невозможно - он закладывается в
человеке в раннем детстве. Однако извлечение знаний - это профессиональный
разговор, и на его успешность влияет также длина фраз, которые произносит
инженер по знаниям. Этот факт был установлен американскими учеными - лингвистом
Ингве и психологом Миллером. Оказалось, что человек лучше всего воспринимает
предложения глубиной (или длиной) 7 плюс-минус 2 слова. Это число (7╠2)
получило название число Ингве-Миллера. Можно считать его мерой
"разговорности" речи. Необходимость фиксации процедуры извлечения
знаний ни у кого не вызывает сомнений. Встает вопрос: в какой форме это делать?
Можно предложить три способа протоколирования результатов:
∙ запись, на бумагу непосредственно по ходу беседы (недостатки -
это часто мешает беседе, кроме того, трудно успеть записать все, даже при
наличии навыков стенографии);
∙ магнитофонная запись, помогающая аналитику проанализировать весь
ход сеанса и свои ошибки (недостаток - может сковывать эксперта);
∙ запоминание с последующей записью после беседы (недостаток -
годится только для аналитиков с блестящей памятью).
Когнитивный слой
Когнитивная психология (англ. cognition - познание) изучает механизмы,
при помощи которых человек познает окружающий мир.
Предложим несколько советов инженеру по знаниям с позиций когнитивной
психологии:
∙ не навязывать эксперту ту модель представления, которая ему
(аналитику) более понятна и естественна;
∙ использовать различные методы работы с экспертом исходя из
условия, что метод должен подходить к эксперту, как "ключ к замку";
∙ четко осознавать цель процедуры извлечения или ее главную
стратегию, которая может быть определена как выявление основных понятий
предметной области и связывающих их отношений;
∙ чаще рисовать схемы, отображающие рассуждения эксперта. Это
связано с образной репрезентацией информации в памяти человека.
Материал, изложенный выше, тесно связан с азами психологической культуры,
которая включает понимание и знание себя и других людей; адекватную самооценку
и оценку других людей; саморегулирование психического состояния. Овладеть этой
культурой легче с помощью специалистов - психологов, психотерапевтов, но можно
самостоятельно с помощью книг, хотя бы популярных. Кроме этого успешному
преодолению психологических неудач способствует овладение основами актерского
мастерства и участие в специальных занятиях по социально-психологическому
видеотренингу.
В заключение приведем ряд традиционных психологических неудач начинающего
аналитика:
· отсутствие контакта между экспертом и инженером по знаниям
(из-за психологических особенностей того или другого; ошибок в процедуре;
возникновения эффекта "фасада", т.е. желания эксперта "показать
себя");
· отсутствие понимания (из-за эффекта "проекции",
т.е. переноса взгляда аналитика на взгляды эксперта; или эффекта
"порядка", т.е. концентрации внимания в первую очередь на том, что
высказывается вначале, и др.);
· низкая эффективность бесед (слабая мотивация эксперта, т.е.
отсутствие у него интереса; или неудачный темп беседы; или неподходящая форма
вопросов; или неудовлетворительные ответы эксперта).
.2
Лингвистический аспект
Поскольку процесс общения инженера по знаниям и эксперта - это языковое
общение, рассмотрим лингвистический аспект инженерии знаний. Выделим три слоя
важных для инженерии, знаний лингвистических проблем (рисунок 8).
Рисунок 8 - Структура лингвистического аспекта извлечения знаний
Проблема общего кода
Большинство психологов и лингвистов считают, что язык - это основное
средство мышления наряду с другими знаковыми системами "внутреннего
пользования". Языки, на которых говорят и размышляют аналитик и эксперт,
могут существенно отличаться.
Итак, нас интересуют два языка - язык аналитика, состоящий из трех
компонентов:
∙ терминов предметной области, которые он почерпнул из специальной
литературы в период подготовки;
∙ общенаучной терминологии из его "теоретического
багажа";
∙ бытового разговорного языка, которым пользуется аналитик; и язык
эксперта, состоящий:
∙ из специальной терминологии, принятой в предметной области;
∙ общенаучной терминологии; бытового языка;
∙ неологизмов, созданных экспертом за время работы (его
профессиональный жаргон).
Если считать, что бытовой и общенаучный языки у двух участников общения
примерно совпадают, то некоторый общий язык, или код, который необходимо
выработать партнерам для успешного взаимодействия, будет складываться из
потоков (рисунок 9). В дальнейшем этот общий код преобразуется в некоторую
понятийную (семантическую) сеть, которая является прообразом поля знаний
предметной области.
Рисунок 9 - Схема получения общего кода
Выработка общего кода начинается с выписывания аналитиком всех терминов,
употребляемых экспертом, и уточнения их смысла. Фактически это составление
словаря предметной области. Затем следуют группировка терминов и выбор
синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается
составлением словаря терминов предметной области с предварительной группировкой
их по смыслу, т.е. по понятийной близости (это уже первый шаг структурирования
знаний).
Рисунок 10 дает представление о неоднозначности интерпретации терминов
двумя специалистами. В семиотике, науке о знаковых системах, проблема
интерпретации является одной из центральных. Интерпретация связывает
"знак" и "означаемый предмет". Только в интерпретации знак
получает смысл. Так, слова "прибор X" для эксперта означают некоторую
конкретную схему, которая соответствует схеме оригинала прибора, а в голове
начинающего аналитика слова "прибор X" вызывают пустой образ или
некоторый "черный ящик" с ручками.
Рисунок 10 - Неоднозначность проблемы интерпретации
Понятийная структура
Большинство специалистов по искусственному интеллекту и когнитивной
психологии считают, что основная особенность естественного интеллекта и памяти
в частности - это связанность всех понятий в некоторую сеть. Поэтому для
разработки базы знаний нужен не словарь, а энциклопедия, в которой все термины
объяснены в словарных статьях со ссылками на другие термины.
Таким образом, лингвистическая работа инженера по знаниям на данном слое
проблем заключается в построении таких связанных фрагментов с помощью
"сшивания" терминов. При тщательной работе аналитика и эксперта в
понятийных структурах начинает проглядывать иерархия понятий, что в общем
согласуется с результатами когнитивной психологии. Иерархия понятий - это
глобальная схема, которая может быть в основе концептуального анализа структуры
знаний любой предметной области. Следует подчеркнуть, что работа по составлению
словаря и понятийной структуры требует лингвистического "чутья",
легкости манипулирования терминами и богатого словарного запаса инженера по
знаниям, так как зачастую аналитик вынужден самостоятельно разрабатывать
словарь признаков. Чем богаче и выразительнее общий код, тем полнее база
знаний. Аналитик вынужден все время помнить о трудности передачи образов и
представлений в вербальной форме. Часто инженеру по знаниям приходится
подсказывать слова и выражения эксперту.
Словарь пользователя
Лингвистические результаты, соотнесенные со слоями общего кода и
понятийной структуры, направлены на создание адекватной базы знаний. Однако не
следует забывать, что профессиональный уровень конечного пользователя может не
позволить ему применить специальный язык предметной области в полном объеме.
Для разработки пользовательского интерфейса необходима дополнительная доработка
словаря общего кода с поправкой на доступность и "прозрачность"
системы.
В заключение перечислим характерные лингвистические неудачи,
подстерегающие начинающего инженера по знаниям:
∙ разговор на разных языках (из-за слабой подготовки инженера по
знаниям);
∙ несоотнесение с контекстом и неадекватная интерпретация терминов
(из-за отсутствия обратной связи, т.е. слишком независимой работы инженера по
знаниям);
∙ отсутствие отличий между общим кодом и языком пользователя (не
учтены различия в уровне знаний эксперта и пользователя).
.3
Гносеологический аспект
Гносеология - это раздел философии, связанный с теорией познания, или
теорией отражения действительности в сознании человека.
Инженерия знаний как наука, если можно так выразиться, дважды
гносеологична - действительность (О) сначала отражается в сознании эксперта
(М1), а затем деятельность и опыт эксперта интерпретируются сознанием инженера
по знаниям (M2), что служит уже основой для построения третьей интерпретации
(Pz) - поля знаний экспертной системы (рисунок 11). Процесс познания в сущности
направлен на создание внутреннего представления окружающего мира в сознании
человека.
Рисунок 11 - Гносеологический аспект извлечения знаний
В процессе извлечения знаний аналитика в основном интересует компонент
знания, связанный с неканоническими индивидуальными знаниями экспертов,
поскольку предметные области именно с таким типом знаний считаются наиболее
восприимчивыми к внедрению экспертных систем. Эти области обычно называют
эмпирическими, так как в них накоплен большой объем отдельных эмпирических
фактов и наблюдений, в то время как их теоретическое обобщение - вопрос
будущего.
Познание всегда связано с созданием новых понятий и теории. Интересно,
что часто эксперт как бы "на ходу" порождает новые знания, прямо в
контексте беседы с аналитиком. Такая генерация знаний может быть полезна и
самому эксперту, который до того момента мог не осознавать ряд соотношений и
закономерностей предметной области. Аналитику, который является "повитухой"
при рождении нового знания, может помочь тут и инструментарий системной
методологии, позволяющий использовать известные принципы логики научных
исследований, понятийной иерархии науки. Эта методология заставляет его за
частным увидеть общее, т.е. строить цепочки:
ФАКТ═ - >═ ОБОБЩЕННЫЙ ФАКТ═ - > ЭМПИРИЧЕСКИЙ
ЗАКОН═ - > ТЕОРЕТИЧЕСКИЙ ЗАКОН.
. эмпирический (наблюдения, явления);
. теоретический (законы, абстракции, обобщения).
Критерии научного знания
Теория - это не только стройная система обобщения научного знания, это
также некоторый способ производства новых знаний. Основными методологическими
критериями научности, позволяющими считать научным и само новое знание, и
способ его получения являются:
· внутренняя согласованность и непротиворечивость;
· системность;
· объективность;
· историзм.
Внутренняя согласованность. Этот критерий в эмпирических областях на
первый взгляд просто не работает: в них факты часто не согласуются друг с
другом, определения противоречивы, диффузны и.т.д. Аналитику, знающему
особенности эмпирического знания, его модальность, противоречивость и
неполноту, приходится сглаживать эти "шероховатости" эмпирики.
Модальность знания означает возможность его существования в различных
категориях, т.е. в конструкциях существования и долженствования. Таким образом,
часть закономерностей возможна, другая обязательна и т.д. Кроме того,
приходится различать такие оттенки модальности, как: эксперт знает, что ...;
эксперт думает, что ...; эксперт хочет, чтобы...; эксперт считает, что ...
Возможная противоречивость эмпирического знания - естественное следствие
из основных законов диалектики, и противоречия эти невсегда должны разрешаться
в поле знаний, а напротив, именно противоречия служат чаще всего отправной
точкой в рассуждениях экспертов.
Неполнота знания связана с невозможностью полного описания предметной
области. Задача аналитика эту неполноту ограничить определенными рамками
"полноты", т.е. сузить границы предметной области, либо ввести ряд
ограничений и допущений, упрощающих проблему.
Системность. Системно-структурный подход к познанию (восходящий еще к
Гегелю) ориентирует аналитика на рассмотрение любой предметной области с
позиций закономерностей системного целого и взаимодействия составляющих его
частей. Современный структурализм исходит из многоуровневой иерархической организации
любого объекта, т.е. все процессы и явления можно рассматривать как множество
более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно
(и нужно) рассматривать как элементы более высоких классов обобщений.
Объективность. Процесс познания глубоко субъективен, т.е. он существенно
зависит oт особенностей самого познающего субъекта. Субъективность начинается
уже с описания фактов и увеличивается по мере углубления идеализации объектов.
Следовательно, более корректно говорить о глубине понимания, чем об
объективности знания. Понимание - это сотворчество, процесс истолкования
объекта с точки зрения субъекта. Это сложный и неоднозначный процесс,
совершающийся в глубинах человеческого сознания и требующий мобилизации всех
интеллектуальных и эмоциональных способностей человека. Все свои усилия
аналитик должен сосредоточить на понимании проблемы. В психологии
подтверждается факт, что люди, быстро и успешно решающие интеллектуальные
задачи, большую часть времени тратят на понимание ее, в то время как быстро
приступающие к поискам решения, чаще всего не могут его найти.
Историзм. Этот критерий связан с развитием. Познание настоящего есть
познание породившего его прошлого. И хотя большинство экспертных систем дают
"горизонтальный" срез знаний - без учета времени (в статике), инженер
по знаниям должен всегда рассматривать процессы с учетом временных изменений -
как связь с прошлым, так и связь с будущим. Например, структура поля знаний и
база знаний должны допускать подстройку и коррекцию, как в период разработки,
так и во время эксплуатации экспертной системы.
Структура познания
Рассмотрев основные критерии научности познания, попытаемся теперь
описать его структуру. Методологическая структура познания может быть
представлена как последовательность этапов (рисунок 12), которые рассмотрим с
позиций инженера по знаниям.
Описание и обобщение фактов. Это как бы "сухой остаток" бесед
аналитика с экспертом. Тщательность и полнота ведения протоколов во время
процесса извлечения и пунктуальная "домашняя работа" над ними - вот
залог продуктивного первого этапа познания.
На практике оказывается трудным придерживаться принципов объективности и
системности, описанных выше. Чаще всего на этом этапе факты просто собирают и
как бы бросают в "общий мешок"; опытный инженер по знаниям часто
сразу пытается найти "полочку" или "ящичек" для каждого
факта, тем самым подспудно готовясь к этапу концептуализации.
Рисунок 12 - Структура познания
Установление связей и закономерностей. В голове эксперта связи
установлены, хотя часто и неявно; задача инженера - выявить каркас
умозаключений эксперта. Реконструируя рассуждения эксперта, инженер по знаниям
может опираться на две наиболее популярные теории мышления - логическую и
ассоциативную. При этом, если логическая теория благодаря горячим поклонникам в
лице математиков широко цитируется и всячески эксплуатируется в работах по
искусственному интеллекту, то вторая, ассоциативная, менее известна и
популярна, хотя имеет также древние корни. Красота и стройность логической
теории не должны заслонять печального факта, что человек редко мыслит в
категориях математической логики.
Ассоциативная теория представляет мышление как цепочку идей, связанных
общими понятиями. Основными операциями такого мышления являются ассоциации,
приобретенные на основе различных связей; припоминание прошлого опыта; пробы и
ошибки со случайными успехами; привычные ("автоматические") реакции и
пр.
Построение идеализированной модели. Для построения модели, отражающей представление
субъекта о предметной области, необходим специализированный язык, с помощью
которого можно описывать и конструировать те идеализированные модели мира,
которые возникают в процессе мышления. Язык этот создается постепенно с помощью
категориального аппарата, принятого в соответствующей предметной области, а
также формально-знаковых средств математики и логики. Для эмпирических,
предметных областей такой язык пока не разработан, и поле знаний, которое
полуформализованным способом опишет аналитик, может быть первым шагом к
созданию такого языка.
Объяснение и предсказание моделей. Этот завершающий этап структуры
познания является одновременно и частичным критерием истинности полученного
знания. Если выявленная система знаний эксперта полна и объективна, то на ее
основании можно делать прогнозы и объяснять любые явления из данной предметной
области. Обычно базы знаний экспертных систем страдают фрагментарностью и
модульностью (несвязанностью) компонентов. Все это не позволяет создавать
действительно интеллектуальные системы, которые, равняясь на человека, могли бы
предсказывать новые закономерности и объяснять случаи, не указанные в явном
виде в базе. Исключением тут являются системы формирования знаний, которые
ориентированы на генерацию новых знаний и "предсказание".
В заключение перечислим наиболее часто встречающиеся неудачи, связанные с
гносеологическими проблемами инженерии знаний:
· обрывочность, фрагментарность знаний (из-за нарушений
принципа системности или ошибок в выборе фокуса внимания);
· противоречивость знаний (из-за естественной противоречивости
природы и общества неполноты извлеченных знаний, некомпетентности эксперта);
· ошибочная классификация (из-за неправильного определения
числа классов или неточного описания класса);
· ошибочный уровень обобщения (из-за чрезмерной детализации или
обобщенности классов объектов).
Заключение
В настоящее время большинство разработчиков экспертных систем отмечает,
что процесс извлечения знаний остается самым «узким» местом при построении
промышленных экспертных систем. При этом приходится самостоятельно
разрабатывать методы извлечения, сталкиваясь со следующими трудностями:
· Организационные неувязки;
· Неудачный метод извлечения, не совпадающий со структурой
знаний в данной области;
· Неадекватная модель (язык) для представления знаний;
· Неумение наладить контакт с экспертом;
· Терминологический разнобой;
· Отсутствие целостной системы знаний в результате извлечения
только «фрагментов»;
· Упрощение «картины мира» эксперта и др.
Процесс извлечения знаний - это длительная и трудоемкая процедура, в
которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной
психологии, системному анализу, математической логике и прочие, необходимо
воссоздать модель предметной области, которой пользуются эксперты для принятия
решений.
Список
литературы
знание информация
алгоритм программный
1. Глухих, И.Н. Интеллектуальные информационные
системы: учеб. пособие для студентов учреждений высш. проф. образования / И.Н.
Глухих; М-во образования и науки Рос. Федерации, Тюм. гос. ун-т. - М. :
Академия, 2010. - 110 с.
2. Ефимов, Е.Н. Информационные системы и технологии в
экономике : учеб. пособие для студентов, обучающихся по специальностям
"Мировая экономика", "Бухгалт. учет, анализ и аудит" и
"Финансы и кредит" / Е.Н. Ефимов, Е.В. Ефимова, Г.М. Лапицкая; под
ред. Г.М. Лапицкой. - Ростов н/Д : МарТ: Феникс, 2010. - 296 с.
. Ясницкий, Л.Н. Введение в искусственный интеллект :
учеб. пособие для студентов вузов, обучающихся по мат. направлениям и
специальностям / Л.Н. Ясницкий. - 3-е изд., стер. - М. : Академия, 2010. - 175
с.
. Боженюк, А.В. Интеллектуальные интернет-технологии :
учеб. для студентов вузов, обучающихся по специальности "Прикладная
информатика (по обл.)" и др. специальностям / А.В. Боженюк, Э. М. Котов,
А.А. Целых. - Ростов н/Д : Феникс, 2009. - 382 с.
. Абдикеев, Н.М. Проектирование интеллектуальных
систем в экономике: учеб. для студентов вузов, обучающихся по специальности
351400 "Приклад. информатика (по обл.)"... / Н.М. Абдикеев; под ред
Н.П. Тихомирова; Рос. экон. акад. им. Г.В. Плеханова. - М. : Экзамен, 2004. -
526 с.
. Иванов Владимир Михайлович. Интеллектуальные
информационные системы : Учеб. пособие. - Екатеринбург : Издательство УрГЭУ,
2003. - 177 с.
. Аверкин А.Н., Гаазе-Рапопорт М.Г., Поспелов Д.А.
Толковый словарь по искусственному интеллекту.- М.: Радио и связь, 1992.
. Искусственный интеллект: В 3 кн. Кн 1. Системы
общения и экспертные системы: Справочник / Под ред. Э.В. Попова. - М.: Радио и
связь, 1990.
. Осипов Г.С. Приобретение знаний интеллектуальными
системами. - М.: Наука, 1997.
. Осуга С. Обработка знаний: Пер. с яп. - М.: Мир,
1989.
. Попов Э.В. Экспертные системы.- М: Наука, 1987. -
288 с.
. Построение экспертных систем: Пер. с англ. / Под
ред. Ф. Хейес-Рота, Д. Уотермена, Д. Лената. - М.: Мир, 1987.
. Представление и использование знаний: Пер. с яп. /
Под ред. Х.Уэно, М. Исидзука. - М.: Мир, 1989.
. Приобретение знаний: Пер. с япон. / Под ред. С.
Осуга, Ю. Саэки. - М.: Мир, 1990.