Оперативное управление в органах внутренних дел

  • Вид работы:
    Контрольная работа
  • Предмет:
    Основы права
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    67,82 Кб
  • Опубликовано:
    2015-07-11
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Оперативное управление в органах внутренних дел















Контрольная работа

Оперативное управление в органах внутренних дел


1. Место оперативного управления в системе управления ОВД

Общая структура системы управления Министерства внутренних дел (МВД) Российской Федерации состоит из трех уровней - федерального, регионального и территориального (муниципального). Введение главных управлений МВД России по федеральным округам формально позволяет обосновать наличие четырех уровней управления, приведенных в таблице 1, однако на практике роль окружных управлений не существенна.

Таблица 1 Современная структура системы управления органами внутренних дел.

Уровни управления

Органы управления

1-й уровень (стратегический)

Министерство внутренних дел Российской Федерации, его Главные управления и Департаменты

2-й уровень

Главные управления МВД России по федеральным округам

3-й уровень (оперативный)

МВД республик; ГУМВД (УМВД) краев, областей, городов федерального значения (Москва и Санкт-Петербург), автономной области, автономных округов; управления министерства внутренних дел на железнодорожном, воздушном и водном транспорте; управления на особо важных и режимных объектах; территориальные органы управления учреждениями с особыми условиями хозяйственной деятельности; окружные управления материально-технического и военного снабжения: образовательные, научно-исследовательские учреждения и иные подразделения

4-й уровень (тактический)

Управления и отделы внутренних дел районов в областях, городов, районов в городах, закрытых административно-территориальных образований: линейные отделы, отделения на железнодорожном, воздушном и водном транспорте; отделы на особо важных и режимных объектах: предприятия, учреждения и организации, созданные для осуществления задач, возложенных на органы внутренних дел и внутренние войска


Для определения понятия и задач оперативного управления необходимо проанализировать его с позиций системного подхода. Помимо оперативного управления выделяют еще два вида управления: стратегическое и тактическое.

Под стратегическим управлением понимается деятельность по определению и достижению крупномасштабных целей в соответствии с правоохранительной политикой государства.

Процесс тактического управления направлен на обеспечение стабилизации, организационной устойчивости служб и подразделений органов внутренних дел.

Стратегическое, тактическое и оперативное управление находятся в диалектическом единстве и дополняют друг друга. При этом имеется ряд признаков, их отличающих.

Во-первых, это временной интервал. Для оперативного управления необходим более короткий промежуток времени, чем тактического и стратегического. Условно можно выделить следующие характерные временные диапазоны:

оперативное - дни; тактическое - месяцы; стратегическое - годы.

Во-вторых, это масштабность целей. Стратегическое управление характеризуется крупномасштабными целями, которые позволяют обеспечивать существенные преобразования в деятельности органов внутренних дел; цели оперативного управления локальны и определяются отклонениями в оперативной обстановке.

Условно для различных уровней управления ОВД можно выделить следующие характерные цели:

стратегическое - реагирование в соответствии с правоохранительной политикой государства и долгосрочными прогнозами;

тактическое - организационно-правовая работа, направленная на создание условий для обеспечения повседневной деятельности ОВД;

оперативное - непосредственное реагирование на изменения оперативной обстановки, а также обеспечение повседневной деятельности ОВД.

В-третьих, это используемые силы и средства.

На стратегическом уровне, как правило, задействуются силы и средства федерального подчинения, на тактическом - регионального, на оперативном - территориального.

Кроме того, выделяют такие признаки, как плановость, характер осуществляемых мероприятий и другие.

Исходя из анализа сложившейся в ведомственной науке терминологии, будем использовать следующее определение: оперативное управление - управление текущими событиями, включающее оперативное планирование, оперативный учет, оперативный контроль, координацию.

Компонентами организационной структуры системы управления органами внутренних дел, отражающими ее строение и внутреннюю форму, являются подсистемы различных уровней управления и входящие в их состав службы и подразделения.

Информационные связи между подсистемами различных уровней являются вертикальными, а между подсистемами одного уровня - горизонтальными1, что является отображением базиса функциональной взаимосвязи в виде иерархической структуры родовидовых отношений. Для каждой подсистемы связи со своими подчиненными подсистемами считаются внутренними (род - вид), а остальные - внешними (ассоциативные и сочетативные связи).

В структуре этих отношений можно выделить различные элементы, например, в горрайоргане внутренних дел: начальник - заместители по линиям работы - начальники служб и подразделений - руководители функциональных групп (дежурных смен, оперативных групп и т.д.). Одновременно данный орган внутренних дел входит в состав структуры (системы) более высокого уровня, в которой он является низовым звеном от муниципального до регионального, межрегионального и федерального. Ведомственным высшим уровнем управления является Министерство внутренних дел, которое, в свою очередь, входит в состав системы органов исполнительной власти России.

Оперативное управление принято рассматривать в двух традиционных аспектах:

как непрерывное управление текущими событиями;

как ситуационное управление, или управление по ситуации, т.е. управление, заключающееся в принятии управленческих решений по мере возникновения проблем в соответствии со складывающейся ситуацией, включающее в себя совокупность мер, позволяющих воздействовать на конкретные отклонения от нормального режима функционирования

Оперативное управление органами внутренних дел включает в себя

управление текущими событиями и управление при возникновении чрезвычайных ситуаций и осложнении оперативной обстановки. Управление текущими событиями подразумевает организацию повседневной деятельности органа внутренних дел любого уровня: слежение за оперативной обстановкой; реагирование на поступление сообщений о совершаемых преступлениях и правонарушениях; расстановку сил и средств для обеспечения охраны общественного порядка на вверенной территории и раскрытия преступлений по

«горячим следам»; организацию работы следственно-оперативной группы; доставление в ОВД лиц, подозреваемых в совершении преступлений и правонарушений, и надлежащее разбирательство с ними; взаимодействие с органами исполнительной власти и органами местного самоуправления; с медучреждениями и другими учреждениями и т.д.

При возникновении чрезвычайных ситуаций и осложнении оперативной обстановки деятельность субъектов оперативного управления органами внутренних дел приобретает несколько иной характер. Появляется необходимость принятия адекватных ситуации управленческих решений, немедленного реагирования на любые изменения оперативной обстановки, действий по сбору оперативного штаба, мобилизации и расстановки сил и средств в соответствии со складывающейся ситуацией и координации их действий, непрерывного взаимодействия с членами оперативного штаба, отдача приказов и распоряжений в соответствии с имеющимися планами действий при ЧС и решениями оперативного штаба.

Высокая степень насыщенности нормативно-руководящими, нормативно- правовыми и оперативными документами информационной базы поддержки принятия управленческих решений ставит перед лицом, принимающим решение (ЛПР), достаточно сложные задачи по отбору релевантных источников информации, отражающих состояние оперативной обстановки и возможных альтернативных вариантов принятия решений. Многоаспектность и разнородность решаемых задач оперативного управления приводит к необходимости координации многих функциональных звеньев органов внутренних дел, что должно в обязательном порядке привести к построению сложной структуры управления, определяемой в контуре решаемых задач как структуры фасетной классификации с устойчивыми, гибкими и чувствительными связями, например:

1.   Фасета принятия решений по службе штабов

2.   Фасета принятия решения по линии дежурных служб

3.   Фасета принятия решения по линии оперативного реагирования в случае возникновения чрезвычайных обстоятельств -

Установление межфасетного взаимодействия приводит к организации эффективного управления приданными силами и средствами по реагированию на оперативную обстановку. Временной дефицит приводит, в свою очередь, к необходимости такой организации системы оперативного информационного обеспечения, при которой за минимальный временной интервал необходимо получить данные с достаточной степенью полноты и точности и малым информационным шумом для ввода в систему поддержки принятия решений и выработки ЛПР альтернативных вариантов поведения для управляемых подразделений и служб. Следовательно, на выработку рациональных вариантов управления необходимо обеспечить структуру ЛПР своевременной, полной и достоверной информацией. Эту задачу надо решать, учитывая как современные особенности управления, так и особенности его информационного обеспечения

Внутри любой организационной системы принято рассматривать управляющую систему - систему, реализующую функцию управления (в системе оперативного управления органами внутренних дел - начальник, его управленческий аппарат, штаб, дежурная часть, методы принятия управленческих решений) и управляемую систему - (функциональные подразделения, ресурсы, в том числе и кадровые, методы обработки информации).

Управленческая и исполнительская деятельность в организованных социальных структурах, к которым относятся органы внутренних дел, протекает циклически, с соответствующими фазами и стадиями.1

В основе выделения управленческого цикла лежит отображение процесса управления в виде последовательности действий, совершаемых субъектом управления для решения управленческой задачи, которое включает в себя как поиск и выбор адекватных решений, так и их непосредственную реализацию.

Классический подход цикла системы управления позволяет сформировать основные этапы оперативного управления как единой структуры взаимосвязанных элементов, объединенных единством цели. Такие этапы в отображении к системе оперативного управления ОВД могут быть агрегированы по следующим направлениям:

1.   Процедура сбора и обработки информации с целью оценки оперативной обстановки с учетом территориальной и функциональной направленности ( ; );

2.      Процедура оценки релевантных источников информации и на ее основе принятие альтернативных решений о наиболее целесообразных действиях вверенных сил и средств ( ; );

3.      Отдача распоряжений, формирование и реализация управляющих команд по исполнению принятого решения ( );

4.      Контроль исполнения принятых управленческих решений и коррегирование управляющих воздействий в процессе управления силами и средствами ОВД по решению поставленных задач.

Эффективность решения задач оперативного управления подразделениями и службами ОВД во многом определяется эффективностью функционирования механизма сбора и обработки информации. Этот этап является определяющим для формирования и реализации последующих трех этапов единого управленческого цикла. Разделение задач оперативного управления можно дифференцировать на одноэтапные или одношаговые задачи и задачи многошаговых процессов управления ( ; ). Формирование независимых одношаговых задач оперативного управления ОВД практически невозможно из-за распределенности функциональной нагрузки и появления логически связей межфасетного и внутрифасетного взаимодействия. Поэтому целесообразно рассматривать процесс оперативного управления ОВД как многошаговый процесс, т.е. оценка оперативной ситуации и формирование управляющих воздействий должны проводиться, сообразуясь с изменениями оперативной обстановки и ситуации, ориентировать систему оперативного управления ОВД на структуру с непрерывными динамическими процессами управления. Эффективность системы управления во многом зависит от надежного функционирования системы информационного обеспечения. Недостаточная полнота и достоверность поступающей информации не устраняет ЛПР от необходимости выработки управляющих воздействий, в связи с чем возникает целый комплекс задач управления по принятию решений в условиях неопределенности. Следовательно, весьма важным фактором в контуре оперативного управления является уменьшение или устранение такой неопределенности за счет обеспечения соответствующей полноты и точности информации об объектах оперативного интереса, т.е. от эффективности информационного обеспечения процесса управления.

Таким образом, система оперативного управления органами внутренних дел может быть представлена в виде следующего функционала:

→{( , ); ,

(1)

где - постоянные управляющие воздействия;

- переменные воздействия (по обстановке);

–         основные методы (способы) воздействия;

–         дополнительные (вспомогательные) методы;

–          административные методы управления.

С позиций выбранной нами для исследования методологии системного анализа информацию, используемую при управлении органами внутренних дел, будем рассматривать в единстве кибернетического и социального аспектов.

В теории управления существует множество моделей управленческого цикла, их трактовка теоретиками не всегда однозначна. Одни авторы рассматривают управленческий цикл, подробно детализируя его этапы, другие предлагают рассматривать этапы управления интегрировано, объединяя несколько функций управления на одном этапе. Большинство авторов при построении модели управленческого цикла выделяют цикл руководителя (непосредственно управленческий цикл) и цикл исполнителей (исполнительский цикл).

Цикл руководителя включает в себя такие функции, как выработка цели, планирование, принятие решения, доведение до исполнителей, контроль исполнения, сбор информации, анализ, управляющее воздействие.

Соответственно цикл исполнителя состоит из следующих этапов: получение задания (указания, распоряжения), подготовка к исполнению (анализ, сбор данных), исполнение, получение дополнительных указаний и распоряжений, отчет об исполнении (окончательный или промежуточный).

Взаимодействие субъекта и объекта управления осуществляется посредством движения потоков информации, которая выступает связующим звеном между ними, характеризуя состояние объекта управления в статике и динамике, и обеспечивая подготовку управляющего воздействия в виде управленческого решения и характеристику результата его реализации. Чем полнее и объективнее информация, тем эффективней принимаемые управленческие решения и, следовательно, результаты их реализации. В результате такого взаимодействия управляемая система изменяет свое состояние, что фиксируется управляющей системой и используется для генерации нового управляющего воздействия и т.д.

С кибернетической точки зрения под информацией принято понимать совокупность сведений (данных) о состоянии системы и внешней среды, которые помогают решить ту или иную задачу Как правило, различают два основных вида информации: элементарную (первичную) и обработанную.

Элементарная информация - это совокупность данных, которые характеризуют определенное событие, ситуацию, некоторый факт за достаточно короткий интервал времени. В исследуемой предметной области к такой информации относятся данные о моментном состоянии оперативной обстановки, расстановке сил и средств в определенный момент времени и т.д.

Основной характеристикой элементарной информации является то, что она живет очень непродолжительное время, постоянно обновляясь новыми значениями, и, следовательно, не может быть непосредственно использована в качестве управляющего воздействия. Для этого ее необходимо собрать и определенным образом обработать. Под «обработанной» информацией будем рассматривать всю элементарную информацию, воспринятую человеком, преломленную в его сознании и реализуемую в конкретных действиях.

Обладание информацией необходимо субъекту управления для успешного осуществления своих управленческих функций, следовательно, информационное обеспечение процесса управления органами внутренних дел должно охватывать все этапы управленческого цикла: от подготовки и принятия решения до анализа и контроля исполнения.

На рисунке 1 отображена схема прохождения информации в структуре управления. Источниками возникновения (и одновременно приемниками) информации являются структурные подразделения органа внутренних дел или органа управления (различные службы, отделы, отделения и т.д.) и различные внешние связанные с ним организации.

Информационное обеспечение является базой, на которой строится управленческая деятельность организационной системы и включает в себя следующие компоненты:

состав информации, т.е. перечень информационных единиц или информационных совокупностей (показателей, различных сообщений, документов и т.д.), необходимых для решения комплекса задач системы управления;

характеристики движения информации, включающие в себя количественные оценки потоков информации (объем, интенсивность), маршруты движения документов, различные временные характеристики функционирования источников информации, получения первичных данных, старения и обновления данных;

характеристики качества информации, такие как оценки полезности, значимости, полноты, своевременности, достоверности и других качеств информации;

способы преобразования информации, т.е. методы сбора, распределения информации, методики расчета показателей, схемы обеспечения информацией подразделений системы управления, подготовки информационных массивов для решения задач.

Следуя мнению авторов,1 рассмотрим подробнее некоторые характеристики информационных потоков,

Информация подразделяется на исходную и управляющую. Исходная информация всегда направлена от объекта управления к управляющей системе, от низшего к более высокому уровню системы управления, управляющая информация имеет противоположное направление.

По степени постоянства, определяемой как время, в течение которого информация сохраняет свое значение и актуальность, в свою очередь, информация подразделяется на постоянную, условно-постоянную и переменную.

Постоянная информация не изменяет своего значения в течение длительного периода (наименование органа внутренних дел, названия структурных подразделений, название документов, квалификация преступлений и т.д.).

Условно-постоянная информация сохраняет свое значение на определенный период времени (название специальных операций, вводимых на определенный срок и т.п.).

Переменная информация характеризуется случайностью своего возникновения по времени.

По структуре информация подразделяется на призначную (основную и вспомогательную) и количественную.

Основная призначная информация указывает время и место события, источник и направление информации, отличительные особенности объекта управления, например, сообщение в оперативной сводке о совершении преступления.

Вспомогательная призначная информация служит для структуризации использования и обработки информации (номер документа, его реквизиты и т.д.).

Количественными характеристиками информации являются объем, плотность информационного потока, информационная емкость.

Периодичность возникновения и передачи информации характерна для систематизированных видов информации, при этом должна быть обеспечена возможность оперативного вмешательства субъекта управления для устранения отклонений от запланированного хода развития действий. Сокращение периодичности информации резко увеличивает объемы информационных потоков и работ по их аналитико-семантической переработке, передаче и приему.

Степень взаимосвязи характеризуется количеством видов информации, взаимосвязанных с данным видом информации. Взаимосвязанными видами являются, например, исходная и производная информации.

Многие виды информации имеют вероятностный характер возникновения и передачи.

Как научная категория информация в управленческих структурах характеризуется рядом свойств, к числу которых относится самостоятельность данных; возможность их многократного использования, сохранения у передающего или получающего субъекта; пригодность к обработке, интеграции и

«сжатию» объема за счет изживания дублирующей, повторной и параллельной информации; допустимость математического анализа; системность; коммуникативность.

Управляемый объект и управляющий орган связаны между собой прямым и обратным каналами передачи информации. По прямому каналу передаются команды, приказы, планы действий и задачи исполнителям (субъекту), входящему в объект управления и подчиненному управляющему органу. По каналу обратной связи в управляющий орган поступает информация о состоянии объекта управления и о выполнении задач, поставленных им при оперативном управлении. Управляющий орган, наблюдая за ходом операции по информации, поступающей по каналу обратной связи, противопоставляет возмущениям и внешним противодействиям своими решениями такое перераспределение ресурсов, при котором обеспечивается достижение цели. Обычно в процессе управления кроме информации, поступающей по каналу обратной связи, имеется возможность получать некоторую информацию о внешней среде. Также необходимо учитывать, что на оба канала передачи информации (об объекте и среде) всегда будут оказывать воздействие различного рода пассивные и активные помехи, поэтому информация у управляющего органа никогда не может быть полной. Из-за случаев больших перерывов в поступлении информации, дезинформации или предоставления недостоверной в силу различных причин информации, у лица, принимающего решение, может сложиться ложное представление о происходящем. Источником дезинформации могут, например, являться органы управления низших рангов, входящие в объект управления, которые иногда стремятся скрыть от управляющего органа (старшей инстанции) истинное положение дел или преувеличить влияние некоторых факторов.

В результате, решения принимаются не на основе истинного знания об объекте управления и среде, а на основе некоторого представления о них, иногда далекого от действительности.

В процессе исполнения решения органа управления для достижения цели в результате внешних возмущений (воздействий) и неточного, а иногда и неверного поведения исполнителей (внутренних возмущений) неизбежно происходят отклонения от запланированной деятельности, которые приводят к необходимости контролировать текущее состояние системы и осуществлять такое управление, при котором запланированная деятельность была бы реализована. А это означает, что в процессе осуществления управляющей деятельности органу управления (руководству) приходится при появлении отклонений ставить частные задачи по ликвидации отклонений, принимать решения, добиваться их исполнения, оценивать результаты решения частных задач и делать выводы на будущее. Таким образом, в процессе деятельности системы из-за внешних (внутренних) возмущений постоянно возникают циклы: задача - решение - исполнение - оценка - рекомендации на будущее. Совокупность таких циклов, неизбежных при функционировании системы, образует процесс оперативного управления.

Система оперативного управления органами внутренних дел может быть отображена двумя структурными составляющими:

функциональная часть; обеспечивающая часть.

Функциональная часть представляет собой совокупность сил и средств

управления для решения поставленных задач и достижения определенных целей.

Обеспечивающая часть предназначена для информационного обеспечения управления и может включать в себя инструментальный набор логико- математических средств и методов прогнозирования развития оперативных ситуаций, принятия решений и планирования операций, контроля исполнения принятых решений и их коррегирования на всех этапах единого управленческого цикла.

Другими словами, для обеспечения процесса управления требуется определенная организация информационных потоков.

В этих целях создаются информационные системы - системы сбора, хранения, обработки и передачи информации, необходимой для удовлетворения потребностей управления для того, чтобы субъект управления мог в нужный момент получить из определенных источников систематизированную и должным образом обработанную информацию.

На основе анализа функциональных воздействий всех структурных подразделений системы оперативного управления, обобщенную структуру единого управленческого цикла можно представить рисунком 2., из которого следует, что система информационного обеспечения процесса управления является важным составляющим элементом для принятия управленческого решения.

Система информационного обеспечения

Сбор и аналитико- семантическая обработка информации об объектах оперативного управления

Систематизация информации и построение единого тезауруса системы оперативного управления

Отбор релевантных источников для принятия управленческого решения

Сбор информации об объекте ОУ

Прогнозирование

Формирование альтернатив

Выбор рационального решения

Формирование команды управления

Контроль

Рис.2. Система информационного обеспечения в управленческом цикле.

Таким образом, с точки зрения информационного обеспечения, для осуществления управленческого процесса необходимо:

•          собирать информацию о состоянии системы органов внутренних дел, преступности и внешней среды;

•        осуществлять переработку информации с целью формулирования управляющего воздействия;

•        сформировать управляющее воздействие на объект управления;

•        обеспечить контроль реализации этого воздействия.

Рассматривая процесс оперативного управления объектами как процесс достижения поставленной цели наилучшим образом, необходимо производить оценку выбираемых воздействий на объект управления и принимаемых решений на основе детерминированного критерия качества, который в полной мере характеризует степень различных затрат (технических, экономических, материальных, технологических, физических, интеллектуальных и др.) на достижение поставленной цели. В этом случае, формальное отображение объекта управления можно представить в виде n-мерного вектора:

. (2)

Координаты задаваемого вектора определяют траекторию объекта управления, которая представляет собой фазовую траекторию, однозначно определяющую состояние объекта управления в заданный момент времени.

Например, если объектом оперативного управления является наряд патрульно-постовой службы, его состояние может быть описано следующими переменными:

–                  местоположение;

–                  текущее состояние (текущий режим функционирования);

–             экипировка (наличие вооружения, специальных средств и т.д.);

–             физическое состояние;

–             время работы и др.

В этом случае на траекторию системы накладывается ряд ограничений, из которых следует, что выбранная траектория должна относиться к множеству допустимых траекторий. В этом случае под такими ограничениями в системе оперативного управления органами внутренних дел понимают:

время оперативного реагирования; ресурсное обеспечение (силы и средства); территориальные ограничения; нормативно-правовое обеспечение;

своевременность и полнота поступления информации о состоянии объекта оперативного управления.

Система оперативного управления органами внутренних дел функционирует, охватывая большую область правоохранительной деятельности. Но, помимо знаний в области юриспруденции, управления, социологии и других общественных наук, сотрудникам дежурных частей необходимо обладать знаниями ведомственных нормативных актов, инструкций, иметь определенную компетенцию в области технических наук, уметь обращаться с оружием, спецсредствами и боевой техникой, обладать основами компьютерных знаний. Все эти особенности деятельности определяют широкую предметную область исследования, с разнообразной терминологией из разных областей знания.

Сложность и многоплановость процессов переходного периода в нашем обществе, приводят к тому, что на вход системы органов внутренних дел поступает многочисленная и, зачастую, противоречивая информация. Информацию, циркулирующую в самой системе управления можно также охарактеризовать как неполную, недостаточную и неоднозначную вследствие многочисленных структурных реорганизаций, кадровых перестановок, нечеткости приоритетов политики в борьбе с преступностью и т.п.

Говоря о качестве информационного обеспечения процесса управления следует подчеркнуть, что оно, во многом зависит от информированности субъекта управления о влиянии того или иного фактора на преступность и деятельность ОВД.

Важно отметить, что процесс управления ОВД содержит формальную и неформальную информационную компоненту. Формальный элемент заключается в использовании при управлении четко сформулированных приказов, инструкций, правил, регламентирующих деятельность сотрудников ОВД. Неформальные компоненты проявляются, например, в толковании формальных инструкций, во взаимоотношения между людьми. Интересы человека, предрассудки, предубеждения ведут к нарушению информационных потоков. Даже в условиях стабильно развивающихся процессов, они привносят в процесс информационного обеспечения достаточный элемент субъективизма. Следовательно, увеличение неформальной компоненты ухудшает качество информационного обеспечения.

Привлечение экспертов для решения конкретных задач увеличивает неформальную часть используемой информации. Очевидно, что работа с такой информацией значительно усложняет процессы управления, поскольку требует применения специальных методов формализации существующей неопределенности.

Необходимо отметить постоянное увеличение объемов обрабатываемой информации как фактор, влияющий на деятельность субъекта управления. В последние годы эти потоки усиливались в связи со значительным осложнением социально-политической и экономической обстановки.

Таким образом, с точки зрения информационной обеспеченности, управление органами внутренних дел в современных условиях охарактеризуем как управление при неполных, неточных исходных данных, недостаток которых восполняется знаниями экспертов, носящих, как правило, качественный характер.

Важным фактором эффективности процедуры выработки обоснованных управленческих решений является применение современных методов обработки качественной информации, которая, наряду с количественной, используется при формировании управленческого воздействия.

Одним из элементов инструментального обеспечения является построение надежной и достоверной системы обработки информации, которая определяет полноту, точность и своевременность формирования поля информативных признаков логико-семантического преобразования необходимых данных для принятия управленческих решений.

1.   Множество лингвистических переменных - ;

2.   Множество групп условной эквивалентности терминов предметной области - ;

3.   Множество типичных представителей групп условной эквивалентности, дескрипторов - ;

4.   Множество родовидовых отношений дескрипторов предметной области - ;

5.   Множество ассоциативных отношений на множестве дескрипторов предметной области - ;

6.   Множество сочетативных отношений на множестве дескрипторов предметной области - .

Следовательно, обобщенная модель структуры информационного обеспечения может быть определена как:

→{  . (3)

Таким логико-семантическим инструментарием является построение единого тезауруса предметной области оперативного управления на основе фасетной классификации, формирование логики отбора релевантных источников информации, их структуризация и на их основе составление прогноза развития оперативных ситуаций для адекватного построения информационного комплекса поддержки принятия решений.

2.      Обеспечение эффективности функционирования системы оперативного управления ОВД


Федеральный закон Российской Федерации от 27 июля 2006г. № 149-ФЗ «Об информации, информационных технологиях и о защите информации» даѐт следующее определение: «информационная система - совокупность содержащейся в базах данных <#"893264.files/image003.gif">

Рис.3. Схема информационно-поисковой системы с инверсным принципом реализации.

Документу, поступающему на вход информационно-поисковой системы, присваивается уникальный порядковый номер в информационном массиве системы. Средствами информационно-поискового языка ИПС документ индексируется, образуя свой поисковый образ (ПОД). Поисковый образ каждого документа является частью массива ПОД, или индекса ИПС.

Процедура поиска релевантных документов начинается с выражения информационной потребности пользователя в виде запроса. При поступлении запроса в ИПС средствами ИПЯ происходит его индексирование, образуется поисковый образ запроса - ПОЗ. Результатом проведения операции сравнении ПОЗ и массива ПОД является определение номеров релевантных документов, находящихся в информационном массиве ИПС, а затем - их последующая выдача.

Для оценки информационного поиска чаще всего используются два показателя: точность и полнота, или коэффициент точности и коэффициент полноты соответственно. Они определяются для случая, когда информационно- поисковая система возвращает набор документов, соответствующий запросу. Точность - это доля релевантных документов среди найденных, полнота - доля найденных релевантных документов среди всех релевантных.

Точность P= ;

Полнота R= .

Эти понятия можно проиллюстрировать дополнительной таблицей 3.1:1

Таблица 3. Сопряженность признаков.


Релевантные

Нерелевантные

Найденные

Истинно положительные (tp)

Ложно положительные (fp)

Ненайденные

Ложно отрицательные (fn)

Истинно отрицательные (tn)


Из приведенной таблицы видно, что

P= ; (3.1)

R = . (3.2)

Также удобно оценивать правильность поиска S:

= (3.3)

В государственном стандарте2 определены критерии эффективности поиска, такие как коэффициент точности - P, коэффициент полноты - R, коэффициент информационного шума - N, коэффициент ложной выдачи - F и коэффициент молчания - S. Существует дополнительная табличная форма представления соответствия пользовательских запросов и выданных документов, которая может быть охарактеризована как матрица сопряженности «релевантность - выдача».

Таблица 3.2. Матрица сопряженности «релевантность - выдача».


Релевантные

Нерелевантные

Выданные документы

A

B

Невыданные документы

C

D


Тогда коэффициент точности определяется как доля истинно релевантных документов в общем числе всех найденных по запросу документов:

P = .      (3.4)

Коэффициент полноты определяется как доля найденных истинно

релевантных документов от общего числа всех истинно релевантных документов:

= .                (3.5)

Коэффициент шума - это доля нерелевантных документов в общем числе всех найденных по запросу документов:

= .             (3.6)

Коэффициент ложной выдачи - это доля найденных нерелевантных документов в общем числе всех нерелевантных документов:

= .                   (3.7)

Коэффициент молчания - доля ненайденных нерелевантных документов в общем числе всех релевантных документов:

S = .                     (3.8)

Для оценки эффективности с помощью этих критериев экспертами определенной предметной области создаются специальные наборы документов, для которых определяются запросы и отбираются истинно релевантные этим запросам документы. Для повышения объективности оценки также создаются стандартные текстовые наборы, например для ежегодной конференции TREC (Text Retrieval Conference). Обычно набор TREC содержит несколько сотен тысяч различных документов, среднего размера примерно 350 слов, а также таблицы соответствия запросов и истинно релевантных им документов

Информационные потребности могут изменяться от потребителя к потребителю; некоторые потребители требуют высокую полноту, т.е. выдачу почти всех документов, которые представляют интерес, тогда как другие предпочитают высокую точность, т.е. исключение из выдачи всех бесполезных документов. В случае, если важны и полнота и точность, идеальной считается система, обеспечивающая одновременно оба этих требования2.

Традиционно существует два направления совершенствования поисковых систем: разработка новых систем и разработка дополнительных компонентов к имеющимся. Использование поисковых систем в различных предметно- ориентированных областях позволяет повысить эффективность поиска в целом, но разработка новой системы намного дороже, чем разработка дополнительного компонента. На сегодняшний день в Интернете существует большое количество глобальных поисковых систем, поддерживающих огромные индексы и не ориентированных на какую-либо определенную тематику. Доказано, что существует зависимость между релевантностью результатов поиска и классом терминов, используемых в запросе: чем более общеупотребительные термины используются в запросе, тем релевантность результатов ниже, и наоборот, использование в запросе специальных терминов приводит к более высокой релевантности выдачи. Однако пользователь не всегда может сформулировать запрос в специальных терминах из малознакомой ему области, что негативно сказывается на результате поиска.

Принципиальным отличием поисковых систем дескрипторного типа от классических документальных информационно-поисковых систем является то, что при обработке запроса пользователя не происходит реального доступа к данным, связанного с большими временными затратами и невозможностью хранения постоянно обновляемой копии всех ресурсов. Таким примером поисковых систем является Интернет, который содержит свои индексы, достигающие в настоящее время огромных размеров, обновляемые и пополняемые с помощью мощных поисковых роботов. При этом невысокая релевантность результатов автоматизированного поиска является следствием сложностей формализации смыслового содержания документа и запроса и установления соответствия между ними.

Современные средства математического моделирования позволяют различным образом описать процесс документального поиска и оценить его эффективность. Условно модели документального поиска можно разбить на три группы:

1.        теоретико-множественные модели, математический аппарат которых основан на использовании теории множеств. К этой группе относятся булевы модели и модели нечетких множеств;

2.        вероятностные модели, базирующиеся на теории вероятности;

3.        алгебраические модели, основанные на использовании алгебраических методов. К этой группе относятся векторные, латентно- семантические и нейросетевые модели.

Рассмотрим обзорно данные модели.

Булева модель.

Документы представляются набором терминов, которые интерпретируются как булевы переменные. В зависимости от присутствия (отсутствия) термина в документе или запросе соответствующая ему переменная принимает значение Истина (Ложь). Запросы представляются в виде логических выражений, состоящих из булевых переменных, соответствующих терминам и связанных стандартными логическими операциями И, ИЛИ, НЕ.

Соответствие документа запросу определяется вычислением логического выражения запроса для данного документа. Если результатом вычисления является логическая единица (Истина) - документ признается релевантным, если логический ноль (Ложь) - нерелевантным.

Модель такого поиска характеризуется простотой реализации, возможностью задания сложных выражений, но отсутствием возможности ранжировать результаты.

Модель нечетких множеств.

Документы и запросы представляются аналогично булевой модели, за исключением того, что логические операции переопределены согласно теории нечетких множеств с учетом условия неполной принадлежности элемента множеству. Соответствие документа запросу также определяется вычислением выражения запроса, аналогично булевой модели.

Векторная модель.

В векторной модели документы и запросы представляются в виде векторов терминов. Векторы, составляющие основу векторного пространства ортогональны, термины независимы между собой:

d = (d1, d2,…,dNt); (3.3.1)= (q1, q2,…,qNt), (3.3.2)

d - вектор документа;- вектор запроса;, k = 1,…,Nt - значение k-го термина в документе d, qk, k = 1,…,Nt - значение k-го термина в запросе q.

Допускается, что значение термина равно единице, если термин присутствует в документе (коэффициент присутствия = 1), нулю - в случае отсутствия. Значения коэффициентов возможно задавать также пропорционально важности данного термина в терминологическом множестве.

Документы и запросы рассматриваются в некотором векторном пространстве, которое определяется Nt различными терминами, представляемыми как линейно-независимые векторы, исходя из предположения независимости всех терминов.

Соответствие между векторами документа и запроса может быть представлено как скалярное произведение. Также используется рассмотрение косинусной меры сходства (cosine similarity) или коэффициента косинуса, равного отношению скалярного произведения этих векторов к произведению их длин:

sim(d,q) = , (3.3.3)

где sim(d,q) - схожесть векторов документа и запроса.

Достоинствами данной модели являются простота и возможность динамической корректировки векторов документов и запросов.

Вероятностная модель.

Данная модель позволяет учитывать как зависимости и связи между различными терминами, так и некоторые параметры, например веса терминов. документы и запросы представляются в виде векторов терминов.

Для установления соответствия документа и запроса вводятся следующие параметры: вероятность релевантности P(rel d) и вероятность нерелевантности P(norel d) документа d и некоторые параметры и , характеризующие потери, связанные с получением нерелевантных документов и неполучением релевантных документов. Для определения релевантности вводится понятие поисковой функции следующего вида:

g - (3.4.1)

Значение функции для документа d определяет его релевантность или нерелевантность.

Релевантность документа зависит от свойств релевантности множества терминов, содержащихся в этом документе. Существующие способы выражения вероятности релевантности документа в целом через вероятности релевантности отдельных терминов, например, через нормальное, биномиальное, пуассоновское или экспоненциальное распределения, предполагают наличие информации о вероятности вхождения либо всех отдельных терминов, либо всех пар терминов, либо любых подмножеств терминов. Так как практически получить такую информацию довольно сложно, для вычислений оставляют наиболее важные зависимости терминов, например, предполагают, что каждый термин зависит только от какого-либо одного другого термина, или, наоборот, пренебрегают всеми зависимостями терминов.

Недостатками данной модели являются сложность получения достоверных значений необходимых параметров. Вероятности вхождения терминов в релевантные и нерелевантные документы оцениваются с помощью документов, полученных в результате предыдущих операций поиска, и не всегда имеется возможность оценки необходимых параметров с достаточной точностью.

Латентно-семантическая модель.

Аналогично векторной модели, документы и запросы рассматриваются как векторы терминов. Однако, пространство, где рассматриваются документы, формируется в соответствии с теорией латентно-семантического анализа, с помощью методов которой имеется возможность определять контекстно- зависимые значения слов по результатам статистической обработки больших наборов текстовых данных и выявлять схожесть отдельных терминов и групп терминов. Исходными данными при латентно-семантическом анализе служит матрица сопряженности «термины - документы», элементами которой являются величины частот терминов в документах. Данная матрица разлагается на некоторое количество ортогональных матриц, от нескольких десятков до нескольких сотен с использованием методов разложения матрицы по сингулярным значениям. Использование такого разложения позволяет сократить размерность матрицы, сохраняя при этом основную структуру ассоциативных зависимостей терминов в документах и избавиться от шума.

Степень соответствия между документами и запросами также определяется с помощью скалярного произведения соответствующих векторов. К недостаткам этой модели можно отнести сложность определения оптимальной размерности конечной матрицы. При слишком большой размерности в матрицу могут попасть некоторые случайные и незначимые зависимости, при слишком маленькой - наоборот, реально существующая структура данных может быть отражена неправильно, и конечная матрица не будет содержать важных зависимостей.

Энтропийная модель.

Для описания данной модели используется статистический математический аппарат, разработанный К. Шенноном, позволяющий рассматривать работу поисковой системы по аналогии «черного ящика», где входной документ аналогичен поступающему входному символу, а выходной документ - выходному символу. Таким образом, применив метод аналогии к матрицам сопряженности

«релевантность-выдача» и «вход-выход» можно определить, что:

1)     входной единичный символ - поданный на вход системы релевантный документ;

2)      входной нулевой символ - поданный на вход системы нерелевантный документ;

3)     выходной единичный символ - документ, признанный системой релевантным;

4)     выходной нулевой символ - документ, признанный системой релевантным.

Матрица сопряженности может быть представлена таблицей 3.3.

Таблица 3.3. Матрица сопряженности «вход-выход» канала связи.


ВХОД


1

0

ВЫХОД

1

a

b


0

c

d

a - поданные на вход единичные символы, воспринятые как единичные символы на выходе;

b    - поданные на вход нулевые символы, воспринятые на выходе как единичные символы;

c    - поданные на вход единичные символы, воспринятые на выходе как нулевые;

d    - поданные на вход нулевые символы, воспринятые на выходе как нулевые символы.

Тогда о работе поисковой системы можно судить по матрице сопряженности «релевантность - выдача», при этом существуют следующие вероятности:

1)   вероятность релевантности случайно поданного на вход документа;

2)      вероятность признания поисковой системой релевантным документа, случайно поданного на вход;

3)      вероятность признания поисковой системой релевантным поданного на вход релевантного документа;

4)      вероятность признания поисковой системой нерелевантным поданного на вход нерелевантного документа;

5)      вероятность релевантности документа, признанного поисковой системой релевантным;

6)   вероятность нерелевантности документа, признанного поисковой системой нерелевантным.

На основе полученных вероятностей определяют различные энтропии, которые могут быть использованы для оценки качества работы поисковой системы.

Корреляционная модель.

Данная модель рассматривает систему информационного поиска как «черный ящик», который на каждый поданный на вход вектор отвечает соответствующим выходным вектором той же размерности, соответствующей количеству документов в наборе. Каждый элемент входного вектора соответствует мере истинной релевантности одного документа набора, а соответствующий элемент выходного вектора соответствует мере релевантности, определенной поисковой системой (т.н. автоматной релевантности). При этом проводится аналогия между мерами истинной и автоматной релевантности, значениями случайных величин релевантности и выдачи.

Данная модель использует допущение, что выражения для вычисления коэффициента линейной корреляции двух случайных величин и вычисления скалярного произведения нормированных и центрированных векторов совпадают, и в качестве степени связности истинной и автоматной релевантности используется коэффициент линейной корреляции, который может быть вычислен по формуле скалярного произведения соответствующих векторов в выбранной метрике семантического преобразования.

Теоретико-множественные модели получили распространение из-за простоты реализации, в отличие от вероятностных моделей, которые описывают процедуру документального поиска наиболее естественным способом. Но наибольшее распространение получили алгебраические модели, потому что эффективность их работы оказывается на практике намного выше остальных.

В данном исследовании рассмотрена модель документального поиска, основанная на применении теории множеств. Основным обстоятельством, обусловливающим представление информационно-поисковых систем в форме теоретико-множественных моделей, является тот факт, что в процессе документального поиска операции осуществляются над множествами элементов: множествами ключевых слов или дескрипторов с одной стороны, и множествами документов с другой. Существующие отношения между множествами документов и их поисковыми описаниями служат основой построения теории информационного поиска.

управление орган внутренний дело

4. Методы формирования словаря предметной области на основе логико-лингвистического моделирования


Процесс перевода текста документа с естественного на искусственный язык, предназначенный для формализации представления смыслового содержания текста документа с целью последующего хранения и поиска, является процессом индексирования.

Существует множество различных методов индексирования. В основу многочисленных классификаций положены алгоритмы индексирования; статистические параметры текстов; разнообразные синтаксические, семантические критерии и ряд других факторов. Процесс индексирования может быть ручным (индексированием занимаются специалисты-индексаторы) и автоматическим (ИПС сама формирует индекс). Алгоритмы индексирования подробно описаны во многих работах

В процессе индексирования в тексте документа выделяют термины, которые обычно выражены словами или словосочетаниями, приведенными к канонической форме, при этом все термины принято делить на функциональные (союзы, предлоги и т.п.) и нефункциональные, имеющие отношение к смыслу документа. Функциональные термины не представляют интереса для индексирования, они заносятся в списки исключений и удаляются. Оставшиеся нефункциональные термины также обладают недостатками. Существуют термины, значение которых или слишком обще, или слишком специфично. Между словами могут существовать отношения, которые не явно содержатся в тексте, но могут быть выведены из контекста или из других, ранее проанализированных текстов. Значения многих слов могут изменяться со временем или могут быть созданы новые слова, обозначающие сущность, ранее обозначавшуюся другими терминами. Для выражения одного или нескольких близких значений могут использоваться многие слова (синонимия). Также существует проблема омонимии и полисемии. Такие термины на следующем этапе индексирования заменяются на более подходящие, что увеличивает однозначность смысловых понятий и полноту индексирования.

Для определения классов терминов существуют различные методы, среди которых статистические, вероятностные и лингвистические.

Статистические методы для выделения классов терминов используют статистическую информацию о вхождении терминов в документ. Например, если использовать двумерный массив, каждая строка которого соответствует документу, а столбец - термину, то каждая ячейка данной матрицы будет соответствовать величине, характеризующей ценность этого термина в данном документе, например единица, если термин присутствует в документе, и ноль - если отсутствует. При анализе столбцов матрицы определяются термины со схожими распределениями в документах и объединяются в классы

Вероятностные методы формируют классы терминов на основе вероятности вхождения комбинаций терминов в подмножества релевантных и нерелевантных документов и выделения зависимостей терминов. Модель зависимости терминов обычно представляет собой граф, в вершинах которого находятся термины, а ребра графа характеризуют зависимость между терминами.

Лингвистические методы группируют термины на основе их принадлежности к тому или иному синтаксическому классу, чтобы выделить словосочетания, которые могут быть полезны для индексирования.

Для замены специфических терминов практикуется использование тезаурусов. Тезаурус объединяет группы связанных специфических терминов в классы, после чего такие термины могут быть заменены специальным идентификатором этого класса. Общие термины можно заменить сочетаниями терминов или группами связанных терминов, так называемыми «группами условной эквивалентности», типичными представителями которых будут являться множество дескрипторов. Такие множества строго детерминированы и лишены признаков синонимии и полисемии, так как имеют более определенные значения для установления однозначности смысловых понятий. При формировании словарей поисковых терминов предметных областей дополнительно могут вводиться базисные отношения в виде родовидовых отношений, отношений ассоциации и сочетания.

Завершением индексирования является присвоение простым терминам, сочетаниям терминов и тезаурусным классам весов, определяющих их важность в документе и используемых в дальнейшем при ранжировании документов выдачи. Важную роль играют посещаемость, авторитетность источника, частота обновления, цитируемость страницы и др.1

Большое значение в функционировании ИПС имеет лингвистическое обеспечение. Именно лингвистическое обеспечение отвечает за такие процессы, как индексирование документов и запросов, эффективный поиск в базах данных по тематическим запросам и межсистемное информационное взаимодействие. Лингвистическое обеспечение в автоматизированных информационных системах позволяет наиболее эффективным образом реализовывать функции поиска и отбора релевантных источников информации.

В классической лингвистике язык понимается как основное средство отображения и передачи информации об окружающем мире.

Существуют следующие подходы к исследованию языка:

4.  Традиционные, ограничивающиеся изучением обыденного языка; 2.Семиотические, рассматривающие язык как знаковую (семиотическую) систему;

3.Экстралингвистические, которые анализируют нестандартные естественные и искусственные языки.

Естественный язык (ЕЯ), формируемый путем постоянного обогащения в процессе жизнедеятельности его носителей, характеризуется таким явлением, как полисемия (многозначность). Как правило, существует объективная трудность или невозможность его полной формализации.

В противоположность ЕЯ, искусственный язык (ИЯ) создается путем формализации с использованием определяемых аксиом и правил построения. Символы ИЯ могут не иметь первоначального смысла, а определяться посредством методов интерпретации формальных систем, из чего следует, что каждому предложению естественного языка могут быть определены одна или несколько интерпретаций в языке искусственном.

Согласно 1 , существуют три основные, так называемые, «языковые»

функции логики:

а) логика как язык представления знаний и формализации рассуждений; б) логика как язык программирования;

в) логика как инструмент исследования языка.

Последняя функция включает синтаксический и семантический анализ лингвистических моделей, определение правил преобразования зафиксированной в них информации.

Использование логических средств в процессе формализации языка позволяет приводить языковые конструкции к понятиям логического суждения и рассуждения, которые считаются адекватными естественным. Формальные рассуждения строятся с помощью правил, не зависимых от предметной области, что делает процесс рассуждений понятным и проверяемым.

Кроме того, результаты формальных рассуждений могут быть переведены в определенное математическое исчисление. В свою очередь, логические суждения представляют собой такие конструкции языка, о которых можно судить: истинны они или нет.

Применение логико-лингвистических моделей и экстралингвистического метода в представленном диссертационном исследовании обоснованы тем, что поведение объекта - системы оперативного управления органами внутренних дел, выражается в терминах ограниченного естественного языка и может быть представлено с помощью лингвистических переменных (ЛП).

Лингвистические средства являются интерфейсом между естественным языком и формальными поисковыми механизмами ИПС. Лингвистическое обеспечение включает в себя:

языки представления данных в ИПС, которые определяют архитектуру, синтаксис и семантику представлении информации в базах данных ИПС;

информационно-поисковый язык (ИПЯ), то есть язык, на котором обращается пользователь к системе, чтобы получить интересующий его отклик.

Информационно-поисковый язык - это формализованная семантическая система, предназначенная для выражения смыслового содержания документов и информационных запросов с целью отыскания в массиве таких документов, которые отвечают на поставленный информационный запрос. Он является абстрактным языком и состоит из «списка элементарных символов (знаков), правил образования (устанавливающих, какие комбинации знаков допускаются), правил преобразования (устанавливающих, какие допускаются преобразования выражений с целью получения логического вывода) и правил интерпретации (устанавливающих, какой смысл надлежит приписывать выражениям,

составленным по правилам образования)»

Для целей информационного поиска используются три типа ИПЯ: классификационный, словарного типа, дескрипторного типа. В настоящее время дескрипторные языки получили наибольшее распространение.

Дескрипторные ИПЯ реализуют идею координатного или ассоциативного индексирования. Смысловое содержание документа можно достаточно полно выразить некоторым списком так называемых ключевых слов, в качестве которых выступают слова, явно или в скрытом виде содержащиеся в индексируемом тексте. Существенной проблемой при этом является однозначность понимания ключевых слов. ИПС считается эффективной в том случае, если обеспечено единообразное индексирование одинаковых по содержанию информационных запросов и документов. Особенно это касается координатного индексирования с использованием слов и словосочетаний естественного языка, которому свойственны такие явления, как синонимия, омонимия и полисемия. Единообразным координатное индексирование будет лишь в том случае, если установлен определенный контроль употребления слов и словосочетаний естественного языка, выступающих в качестве ключевых для устранения явлений синонимии, омонимии и полисемии

Одним из вариантов координатного индексирования является так называемое «глубокое индексирование», при котором проводится анализ индексируемого документа специалистом данной конкретной предметной области, способным выделить наиболее важные, редко встречающиеся ключевые слова. Таким образом, глубина координатного индексирования определяется не количеством ключевых слов, включенных в поисковый образ документа (ПОД), а зависит от наличия в нем специфических ключевых слов.2

Основными проблемами координатного индексирования являются: ложная координация, неполная координация, синонимия, полисемия, омонимия, неоднозначность родовидовых связей между ключевыми словами, ложные синтагматические связи, невыдача документов, близких по смыслу информационному запросу.

На рисунке 4 представлены отношения синонимов, омонимов и полисемантических слов обозначаемым ими предметам или выражаемым ими понятиям.

Большое внимание в современных полнотекстовых ИПС уделяется морфологическому анализу, т.е. автоматическим средствам обработки отдельных слов, как в текстах исходных документов, так и в запросах пользователей. При построении базы данных из массива документов формируется индекс из всех слов, входящих в эти документы, иногда за исключением так называемой «незначащей лексики» - предлогов, артиклей, частиц и т.д., представляющий собой стоп-словарь системы. Построенный словарный индекс системы во многих ИПС лемматизируется, т.е. все слова приводятся к каноническим формам, например, существительные - к именительному падежу, глаголы - к инфинитивной форме и т.д. Запросы пользователей также проходят лемматизацию.

Любая система анализа содержания документа, входящая в информационную систему, должна включать методы последовательной нормализации естественного языка, связанных с построением словарей определенного типа, к которым относятся:

словарь отрицаний, содержащий термины, использование которых запрещено для целей анализа содержания;

тезаурус или словарь синонимов, который для каждого входа (статьи) словаря определяет одну или больше синонимичных категорий или классов понятий;

словарь словосочетаний, используемых для определения наиболее часто встречающихся комбинаций слов;

иерархическая (древоподобная) организация терминов или понятий, подобная стандартной схеме библиотечной классификации, позволяющая найти для определенного термина как более широкие, так и более узкие понятия, двигаясь вверх или вниз по данной структуре.

Иной способ индексирования документов в информационно-поисковых системах обеспечивается при использовании специальных словарей- справочников, называемых тезаурусами или информационно-поисковыми тезаурусами (ИПТ). Термин «тезаурус» (от греческого «thesaurus» - сокровищница, запас, клад) в широком смысле используется для обозначения книги, содержащей собрание наименований понятий из определенных областей знаний.

Тезаурус используется как при вводе документов в информационно- поисковую систему, так и при формировании предписаний на поиск документов. Но прежде всего, тезаурус используется как средство контроля единообразного употребления слов и словосочетаний естественного языка, используемых для координатного индексирования документов и информационных запросов, поскольку является нормативным словарем ключевых слов по определенной тематике.

К тезаурусу предъявляется ряд требований: устранение синонимии и многозначности ключевых слов, указание базисных отношений между ключевыми словами, то есть отношений, существующих между этими словами независимо от контекста, в котором они употребляются.

В работе1 дается следующее определение: «Тезаурус - словарь, отображающий тематические связи между словами данного языка. Обычно тезаурус состоит из двух частей: совокупности рубрик и ключа. Каждая рубрика имеет заглавное слово и содержит все слова, непосредственно связанные по смыслу с заглавным словом. Это могут быть все слова, имеющие с заглавным почти одинаковое значение, или, кроме того, все слова с более широким или более узким значением, или слова, входящие в типичные сочетания с заглавным словом. Ключ - это список всех слов в алфавитном порядке с указанием номеров рубрик, в которые эти слова входят. Целесообразно рассматривать и более общее понятие тезауруса как списка объектов, предикатов и связей между ними в определенной семантической системе».

Автор работы1 считает, что «назначение ИПТ заключается в следующем:

1)   дать лицу, производящему индексирование документов, …возможность индексировать (т.е. описывать содержащуюся в этих документах информацию более полно, на разных уровнях общения и в техническом смысле - с многих точек зрения);

2)   позволять лицу, ведущему поиск информации, формулировать поисковое предписание в соответствии с объемом и степенью его непосредственных интересов, т.е. так, чтобы поисковое предписание содержало все термины словарного состава информационно-поискового языка, которые обладают нужным значением и специфичностью».

Использование тезауруса обладает также таким преимуществом, как то, что оно не требует дополнительного ввода информации от пользователя для уточнения или расширения запроса.

В настоящее время существуют различные методы построения тезаурусов. Рассмотрим их обзорно2:

Использование контролируемого словаря, поддерживаемого редакторами. Для каждого понятия в этом словаре есть канонический термин.

Построение тезауруса по словникам предметных указателей применяется тогда, когда имеется хорошо отработанный предметный словник, и надо провести координатное индексирование массива документов, ранее проиндексированных предметными заголовками. Примерами являются тематические рубрики в каталогах традиционных библиотек, таких как Библиотека Конгресса США (Library of Congress Subject Headings), десятичная система классификации Дьюи (в России - УДК). Метод характерен для предметных областей с большим количеством источников информации, например для областей медицины и биологии существует система UMLS(Unified Medical Language System).

Тезаурус, создаваемый вручную. Канонический термин не назначается, редакторы создают множества синонимов для понятий. Эмпирическое построение тезауруса проводится методом свободного индексирования, то есть путем описания предметного содержания документов списками слов и выражений, которые составитель тезауруса считает наиболее подходящими. При этом выбираемые для индексирования документа слова могут и не содержаться в тексте этого документа. После накопления необходимого лексического минимума проводится его лексикографическая обработка. Затем описываются ассоциативные отношения терминов и их сочетания для расширения базисных отношений. Примером может являться система Statistics Canada, которая поддерживает словарь предпочтительных терминов и синонимов по различным отраслям, подлежащим обязательной статистической обработке. Этот тезаурус поддерживает два языка - английский и французский.

Автоматически создаваемый тезаурус. Для такого тезауруса используются статистические данные о совместной встречаемости слов в документах предметной области.

При формировании тезауруса важно знать, в каком примерно массиве документов будет осуществляться информационный поиск, кто и в каких целях будет пользоваться тезаурусом, каковы требования к точности, полноте и скорости информационного поиска.

Ряд авторов 1 2 , рассматривая операции с запросами к сетевым ИПС на основе тезауруса, предлагают следующие подходы:

1.        Тезаурус является компонентой автономной метапоисковой машины, т.е. не привязан к конкретной ИПС;

2.      Тезаурус описывает терминологию узкой предметной области;

3.      Основной элемент тезауруса - концепция (а не отдельный термин);

4.      Концепции тезауруса связаны отношениями, семантика которых может быть различной (набор типов отношений не фиксируется).

При создании тезаурусов возникает проблема устранения синонимии ключевых слов. Синонимия присуща любому естественному языку и выражается в том, что для обозначения одного и того же предмета, понятия или действия может употребляться не одно, а два и более разных имен. Для устранения синонимии в ИПЯ используется принцип условной эквивалентности, если они обозначают близкие понятия и предметы. Типичным представителем группы условной эквивалентности определен дескриптор, с помощью которого в дальнейшем формируется поисковый образ документа (ПОД), поисковый массив и поисковый образ запроса пользователя (ПОЗ).

Устранение омонимии в ИПЯ производится при построении тезауруса лексикографически, т.е. при помощи системы указательных меток. Кроме того, омонимия частично устраняется в процессе группировки отобранных для тезауруса ключевых слов. Полисемия также устраняется лексикографически.

При построении тезаурусов необходимо учитывать и наличие родовидовых и ассоциативных отношений между дескрипторами. В ИПЯ всегда есть дескрипторы, которые полностью включают в себя один или несколько других дескрипторов, выражающих более узкие понятия. При формировании тезаурусов родовидовые отношения изображают в виде графических схем - деревьев. Классификационное дерево строится для каждого дескриптора ИПЯ, это помогает устранить неоднозначность отдельных дескрипторов, улучшить словарный состав ИПЯ.

Парадигматические отношения между словами в основном проявляются в виде ассоциаций, вызываемых этими словами. Считается полезным дополнить поисковый образ документа не только родовыми и видовыми дескрипторами, но и дескрипторами, которые связаны с основными дескрипторами ассоциативными отношениями, для чего к основному дескриптору «привязываются» несколько добавочных дескрипторов, связанных с ними ассоциативными отношениями. В каждом языке слово окружено сетью сложных ассоциаций, образуя так называемое ассоциативное поле. При построении тезауруса из множества ассоциативных отношений выбираются наиболее существенные, затем из этого множества выбирается подмножество отношений, принадлежащих к категории парадигматических. Парадигматическим отношениям соответствуют лишь такие виды ассоциаций, члены которых связаны между собой семантическими (смысловыми) отношениями. В тезаурусе парадигматические отношения между дескрипторами выражаются лексикографически, при помощи таблиц, аналитически и графически.

Парадигматические связи, существующие между дескрипторами, так называемые, аналитические или базисные, обеспечивают наибольшую эффективность информационного поиска.

Важной процедурой контроля правильности установления тезаурусных связей может оказаться рубрицирование текстов по некоторому рубрикатору. Рубрицирование можно производить по любому рубрикатору, относящемуся к предметной области. Рубрикатор не является составной частью тезауруса, однако его рубрики можно описать посредством дескрипторов тезауруса, и наоборот, дескрипторам тезауруса можно поставить в соответствие рубрики рубрикатора или их числовые обозначения. Иерархическая организованность тезауруса позволяет не собирать для каждой рубрики все ее дескрипторы, а найти в тезаурусе куст дескрипторов, соответствующий данной рубрике, и установить связь между рубрикой и наивысшим дескриптором в иерархии дескрипторного куста. Такой дескриптор называется опорным дескриптором рубрики. Одной рубрике может соответствовать несколько опорных дескрипторов. В результате для каждого дескриптора создается список соответствующих ему рубрик. Дескриптор может не иметь рубрик. Просмотр результатов такого рубрицирования дает возможность увидеть как ошибки привязки опорных дескрипторов к рубрикам, так и ошибки в тезаурусных связях.1

Структура заполнения тезауруса регламентируется стандартами ISO 2788, ISO 5964, ГОСТ 7.25-2001 (для одноязычных тезаурусов) и ГОСТ 7.24-2007 (для многоязычных тезаурусов) 2 3.

Основными документами, регламентирующим формат представления тезауруса, являются стандарты ISO 2788:1986 для описания одноязычных тезаурусов, и ISO 5964:1985 - для многоязычных. Стандарт ISO 2788:1986 определяет тезаурус, как набор терминов, связанных между собой соответствующими связями (отношениями). Структура многоязычных тезаурусов регламентируется стандартом ISO 5964:1985. В нем определены связи между эквивалентными терминами на разных языках. Американский стандарт ANSI/NISO Z39.19-1993 расширяет и уточняет стандарт ISO 2788:1986 для одноязычных тезаурусов, а также накладывает ряд дополнительных ограничений на структуру тезауруса. Стандарт ANSI/NISO Z39.19-1993 помимо структуры регламентирует также и другие аспекты создания, представления и поддержки тезаурусов.

Российские стандарты по подготовке тезаурусов ГОСТ 7.25-2001 и ГОСТ 7.24-2007 созданы на базе стандартов ISO и ANSI.

ГОСТ 7.25-2001 «Тезаурус информационно-поисковый одноязычный» устанавливает правила разработки, структуру, состав и форму представления информационных тезаурусов, ориентированных на использование лексики русского языка и разрабатываемых в рамках автоматизированных информационных систем и сетей научно-технической информации. ГОСТ 7.25- 2001 также как и ANSI/NISO Z39.19-1993, расширяет и уточняет стандарт ISO 2788:1986 для одноязычных тезаурусов.

Стандарт опирается на имеющиеся российские стандарты в области информационной деятельности 1 2 3 4 5 6 . В стандарте информационно-поисковый тезаурус (ИПТ) по своему построению подразделяют на два типа: тезаурусы, выделяющие среди своих лексических единиц дескрипторы и аскрипторы; тезаурусы, все лексические единицы которых являются дескрипторами. Стандарт определяет следующие этапы построения тезауруса:

определение тематического охвата ИПТ; сбор массива лексических единиц; формирование словаря ИПТ;

построение словарных статей и указателей; оформление ИПТ;

экспертиза и регистрация ИПТ.

В стандарте подчеркивается, что определение тематического охвата ИПТ осуществляется путем анализа информационной потребности абонентов (потребителей). В словарь ИПТ могут быть включены такие лексические единицы, как одиночные слова (существительные, прилагательные, глаголы, наречия) именные словосочетания; лексически значимые компоненты сложных слов; сокращения слов и словосочетаний.

При построении словарных статей лексическим единицам (ЛЕ) приписывают определенные ссылки. Ссылки отмечают связи данной лексической единицы с другими и являются результатом выполнения следующих операций: устранения неоднозначности лексической единицы; установления отношений эквивалентности; выбора дескриптора, представляющего класс эквивалентности; установления иерархических и ассоциативных отношений дескрипторов.

Устанавливаются иерархические и ассоциативные отношения лексических единиц предметной области: парадигматические отношения, отражающие лексико-семантические связи между понятиями, выражаемыми дескрипторами. Связь указывают путем внесения в дескрипторную статью ссылки, включающей обозначение согласно таблице ссылок и связанный дескриптор. Основными типами связей являются: род - вид; часть - целое; причина - следствие; сырье - продукт; административная иерархия; процесс - объект; функциональное сходство; процесс - субъект; свойство - носитель свойства; антонимия.

Систематический указатель является перечнем дескрипторов, сгруппированных согласно принятой в ИПТ рубрикации. Строятся иерархические указатели, представляющие собой перечень списков дескрипторов, при этом каждый список начинается также с дескриптора, не имеющего вышестоящих. После каждого дескриптора приводятся непосредственно нижестоящие дескрипторы с указанием их уровня в иерархии путем применения нумерации либо графического обозначения уровня. Формируются пермутационные указатели, предназначенные для поиска лексических единиц по отдельным словам, входящим в текст лексической единицы. Пермутационный указатель представляет собой перечень списков, каждый из которых соответствует одному из знаменательных слов в составе лексической единицы и включает все лексические единицы, содержащие это знаменательное слово. Перечень списков упорядочен по алфавиту знаменательных слов, а внутри списки упорядочены по тексту лексической единицы ГОСТ 7.24-2007 «Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению» распространяется на многоязычные информационно-поисковые тезаурусы (МИПТ) и устанавливает состав, структуру и основные требования к построению МИПТ, применяемым в информационно-поисковых системах.

ГОСТ 7.24-2007 определяет многоязычный информационно-поисковый тезаурус как согласованную совокупность одноязычных информационно- поисковых тезаурусов, содержащую эквивалентные дескрипторы на языках - компонентах МИПТ, необходимую и достаточную для межъязыкового обмена, и включающую средства для указания их эквивалентности. Одноязычная версия МИПТ - каждый из одноязычных информационно-поисковых тезаурусов, входящих в состав МИПТ.

Для подготовки тезауруса необходимо большое количество лексических единиц. Разработчику тезауруса необходимо найти коллекции документов по интересующей предметной области, причем массивы документов должны быть политематическими в рамках данной области.

Согласно 2 назначение тезауруса заключается в следующем:

–   служить руководством для перевода текстов с естественного языка на искусственный, специально сформированный для определенной предметной области дескрипторный ИПЯ путем замены ключевых слов их однозначно установленными образами - соответствующими дескрипторами;

–    обеспечивать возможность избыточного индексирования документов и/или информационных запросов с целью обеспечения большей полноты информационного поиска;

–   быть пособием, которое бы помогало ищущему информацию специалисту находить правильные дескрипторы для выражения его информационной потребности.

В настоящее время считается, что основное назначение тезауруса - это формализация семантического содержания документов с целью обеспечения однозначного выражения их смыслового содержания, что, в свою очередь, обеспечивает высокую полноту и точность отбора релевантных источников и снижение информационного шума. Провайдеры сетевых баз данных игнорируют ценность контролируемых языков индексирования, не создают дорогостоящих, с их точки зрения, тезаурусов. Несмотря на то, что в распоряжении пользователей полнотекстовых информационных систем имеются многомиллионные массивы документов, по мнению многих исследователей, ни одна из известных поисковых машин не обеспечивает достаточную полноту поиска.

Устранение лексической неоднозначности смысловых понятий является одним из способов повышения эффективности информационного поиска. Основная масса пользователей формулирует свои запросы слишком широко, поэтому не получает высокорелевантной выдачи. Создание тезауруса, как части ИПС, получает все большую актуальность.

Подход, который чаще всего используется сегодня, основан на принципе автоматического построения поискового индекса системы на основе входящих в документальный массив слов. Этот подход не предполагает использование тезауруса и считается предпочтительным. Но, если этот подход можно было считать оправданным на начальном этапе развития полнотекстовых ИПС, поскольку хранение тезаурусов требовало значительных объемов памяти ЭВМ, то в настоящее время можно хранить тезаурусы любого объема. Объемы хранимых в настоящее время текстовых баз данных настолько велики, что их индексы намного превышают объемы тезаурусов. Это позволяет предположить, что в перспективе ИПС с тезаурусами займут доминирующее положение.

Важным элементом в системе информационного обеспечения управления органами внутренних дел является идентификация пользователей, процессов и устройств в едином информационном контуре, что определило одно из направлений диссертационного исследования как авторскую разработку методов идентификации на основе ортогональных преобразований с использованием модифицированного соискателем множества кусочно-постоянных ортогональных функций Уолша.


Заключение

1.    В настоящее время процедура поиска в информационно-поисковых системах направлена на построение логики отбора релевантных источников на основе операции инвертирования предметных списков, что приводит в увеличению полноты и точности отбора релевантных источников, а также снижению информационного шума.

2.    Использование поисковых систем в различных ориентированных на определенную тематику областях позволяет повысить эффективность поиска и приводит к построению фасетной классификации единого информационного контура системы управления органами внутренних дел, что обеспечивает многоаспектность отбора релевантных источников информации.

3.   Одним из главных средств повышения эффективности информационно- поисковых систем является лингвистическое обеспечение, включая тезаурус, содержащий в себе основные лексические единицы для определенной предметной области.

4.   Разработка фасетного тезауруса по предметным областям направлена на увеличение полноты и точности поиска релевантных источников и исключает тематическое рассеяние документальной информации.

5.   Формирование тезауруса в области оперативного управления органами внутренних дел остается сложной и слабо проработанной в теоретическом и практическом аспекте задачей.

6.   Неотъемлемой частью системы информационного обеспечения органов внутренних дел является разработка методов идентификации и аутентификации процессов, пользователей и устройств.

7.    Дальнейшее исследование диссертационной работы направлено на построение поисковой системы инверсного принципа реализации фасетной классификации дескрипторного типа.

Литература

1.        Дѐмин Б.Е. Системный анализ: теория и приложение / Б.Е. Демин, С.А. Редкозубов, Б.В. Тарасов. Воронеж: Научная книга, 2008. 356 с.

2.      Залманзон Л.А. Преобразование Фурье, Уолша, Хаара и их применение в управлении, связи и других областях / Л.А. Залманзон. М.: Наука, 1989. 371 с.

3.      Исаев Г.Н. Управление качеством информационных систем / Г.Н. Исаев. М.: МИРЭА, 2003. 200 с.

4.      Исаев Г.Н. Управление качеством информационных систем. Теоретико-методологические основания: монография / Г.Н. Исаев. М.: Наука, 2011. 279 с.

5.      Казаков А.В. Системный анализ управления / А.В. Казаков. Барнаул: Алтайский ГТУ, 2002. 177 с.

6.      Качмаж С. Теория ортогональных рядов / С. Качмаж, Г. Штейнгауз. М.: Наука, 1958. 508 с.

7.      Козлов В.Н. Системный анализ, оптимизация и принятие решений / В.Н. Козлов. М.: Проспект, 2010. 437 с.

Похожие работы на - Оперативное управление в органах внутренних дел

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!