Гусакова С.М., Комаров А.С. Выявление связи особенностей высшей нервной деятельности и почерка методами интеллектуального анализа данных Почерковедение как наука занимается изучением закономерностей формирования, функционирования и изменения функционально-динамического комплекса (ФДК) навыков, лежащего в основе почерка. Почерковедческие исследования (см., например, [1]) позволили сделать вывод, что ФДК формируется под влиянием трех групп факторов: 1. Заданных, т.е. врожденных, имеющих генетический характер. Эти факторы определяют моторно-двигательную функцию, особенности протекания нервных процессов. 2. Средовых, т.е. факторов, определяющих воздействие внешней среды. К этим факторам относятся навыки обучения, профессиональная деятельность и т. п. 3. Сознательное воздействие индивида. Здесь имеется в виду сознательное подражание, стремление изменить почерк и т.п. Поскольку разделение влияния этих факторов на формирование почерка не представляется возможным и по объективным и по субъективным (уровень развития почерковедения) причинам в почерковедческой экспертизе, которая опирается на почерковедческие исследования, используются исключительно статистические методы. Статистический характер задач, решаемых в почерковедческой экспертизе, полностью исключить невозможно, учитывая характер данных и знаний в этой области. Проявление одинаковых следствий под влиянием различных факторов с наложением этого влияния (многофакторность), неоднозначность следствий под влиянием одного и того же фактора (многоследственность), отсутствие четких границ в определении воздействующего фактора (пола, возраста, роста и т.п.) – все это указывает на невозможность полного выявления точных зависимостей в почерковедении. Все это делает тем более актуальными исследования, позволяющие определить тенденции, выявить некоторые эмпирические зависимости между конкретными факторами и особенностями почерка, получить некоторые отрицательные результаты. Такие исследования можно проводить методами интеллектуального анализа данных. 2 В докладе рассматриваются вопросы сбора и подготовки почерковедческих и нейрофизиологических данных и описываются интеллектуальные средства для проведения их анализа. При решении задач почерковедческой экспертизы ищутся наборы признаков почерка, достаточные для принятия экспертом решения об установлении исполнителя рукописи (идентификационная задача) или о приписывании исполнителю рукописи тех или иных атрибутов, таких как пол, возраст и т. п. (диагностическая задача). В почерковедении такие наборы называются комплексами. Для нахождения этих комплексов создаются специальные методики, требующие большого объема работы по сбору материала. Эти методики опираются на частотные характеристики признаков почерка. Особенность задач почерковедческой экспертизы заключается в том, что полный комплекс является заведомо избыточным. Но в нем содержатся комплексы для принятия решений экспертом. Эти комплексы могут пересекаться, но могут и иметь пустое пересечение. Пусть К – полный избыточный комплекс, К1 – комплекс и К1 К, то К ((К1 К) (К К) К- комплекс. Если К1 и К2 - комплексы, возможен один из следующих вариантов: (К1 К2) или (К2 К1) или (К1 К2 )&(К1 К2)&(К2 К1) или (К1 К2 =). Вес каждого признака, вычисленный в методике, дает возможность набирать множество признаков, суммарный вес которых превышает определенный порог. Эти множества и образуют искомые комплексы. По сути методики строятся по феноменологическому принципу – наблюдаются явления, характерные для одной группы индивидов и не характерные для другой, например частое появление признака в женских почерках и редкое появление этого признака в мужских. Если эти явления статистически значимы, то они и образуют комплексы признаков. Иногда полученные результаты удается объяснить с помощью почерковедческих теорий, но в целом, объяснения, почему тот или иной комплекс признаков характерен для индивидов с данными атрибутами, методики, конечно, не дают. Трудность создания методик вынуждает искать другие пути нахождения этих комплексов. Один из таких путей – логико-комбинаторный ДСМ-метод автоматического порождения гипотез, опирающийся на нахождение существенного сходства объектов [2]. ДСМ-метод – это метод, позволяющий как автоматически выдвигать гипотезы вида «причина следствие», так и проводить интеллектуальный анализ данных. При попытке применения этого метода к решению задачи определения пола исполнителя рукописи по его почерку [3] выявилась трудность определения сходства в признаках почерка лиц одного пола, т.к. комплексы признаков, достаточные для принятия 3 решения, могут быть различны и даже не иметь пересечения. Поэтому сходство определялось сначала покомпонентно. Т.е. для каждого признака отдельно, а затем в комплексы объединялись любые сочетания сходных признаков. Характер связей между изучаемыми событиями в рассматриваемых задачах таков, что имеются как причинно-следственные отношения между событиями, так и случайные изменения событий, влияющие на результат. Поэтому необходимо введение порогов, учитывающих частотность появления признака. Это влечет необходимость иметь достаточно представительную выборку, что увеличивает трудоемкость сбора данных. Все высказанные выше соображения приводят к мысли, что более эффективно применять логико-комбинаторный ДСМ-метод не к решению задач почерковедческой экспертизы, когда по признакам почерка надо определить исполнителя рукописи или его атрибуты, а к задачам выявления зависимостей особенностей почерка от факторов, формирующих почерк. Дело в том, что в задачах почерковедческой экспертизы мы имеем дело с ситуацией, когда по почерку определяются атрибуты, (если речь идет о диагностических задачах), в то время как реально именно атрибуты влияют на признаки почерка. Успешное применение ДСМ-метода во многом определяется созданием модели предметной области, которая находит отражение в языке представления данных и определении операции сходства [4]. Формирование двигательных навыков - очень сложный процесс. Центрально-нервные корни различных движений, их уровни построения различны. «Каждый новый морфологический этаж мозга, каждый очередной функциональный уровень построения содержит и приносит с собой не новые качества движений, а новые полноценные движения. В нервной системе…N структурным этажам и доступным для нее N уровням соответствует не N групп качеств движения, а N особых списков или контингентов движений, вполне законченных и биологически пригодных для решения определенных, посильных им задач» [5]. В проводившихся автором [5] опытах, в которых испытуемый писал карандашом, сначала держа его нормально в правой руке, а затем прикрепленным на правом надплечье, к носку ботинка правой ноги, удерживаемым в зубах, прибинтованным к голове, при сравнении полученных образцов почерка выявилось полное сохранение геометрического рисунка почерка, за который отвечает уровень пространственного поля, а «плавная округлость письма, создаваемая координациями более низкого уровня, не удержалась ни в одном из вариантов письма, кроме привычного писания правой кистью» [5]. Учитывая все сложности и особенности описанных задач, а также сложность создания модели предметной области, можно сделать вывод, что прежде чем формулировать постановку задач в почерковедении имеет смысл провести 4 интеллектуальный анализ данных. Такой анализ может помочь открыть некоторые эмпирические зависимости там, где они имеют место, и указать на невозможность установления некоторых других зависимостей. Для того чтобы ДСМ-метод можно было использовать как инструмент для анализа данных, необходимо, чтобы данные имели достаточно богатую структуру. Такую ситуацию мы будем иметь в почерковедческих данных, если сможем описать структуру факторов, влияющих на формирование почерка. Для этой цели были выбраны «заданные» факторы, в той их части, которая определяется высшей нервной деятельностью. Влияние этих факторов на формирование почерка доказано в почерковедении, но точные зависимости между параметрами и признаками почерка в полноте не выявлены. При подготовке данных к работе ДСМ-метода в них выделяются объекты и их свойства (эффекты, целевые признаки). Данные организуются в базу фактов (БФ), содержащую описание структур объектов и свойств и отношение 1 , означающее «объект обладает свойством». Выражение J(,n)(X1Y), =+1,-1, , 0 интерпретируется как: «объект X обладает свойством Y» (при = +1) – положительный пример, «объект X не обладает свойством Y» (при = -1) – отрицательный пример, «неизвестно обладает ли объект X свойством Y» (при = ), при = 0 имеет место фактическое противоречие. Параметр n означает номер шага. При n = 0 мы имеем дело с достоверными фактами.. При n =1,2, … в БФ J(,n-1) (X1Y) в результате работы ДСМ-метода может поменяться на J(+1,n)(X1Y) или J(-1,n)(X1Y) или J(0,n)(X1Y). Гипотетические знания о причинах проявляемых свойств, записываемые в виде J(,n)(V2 W), = +1,-1,0, образуют базу знаний (БЗ). Отношение 2 читается «быть причиной следствия». База знаний содержит также аксиомы предметной области (в начальном состоянии отношение 2 пусто). Существенно, что в базе данных должны быть не только положительные, но и отрицательные примеры. Анализ почерковедческих данных с помощью ДСМ-метода предполагает использование языка представления данных в категориях силы, подвижности и уравновешенности нервных процессов для описания объектов и множество общих и частных признаков для описания почерка. Структура объекта – кортеж вида СВ, СТ, ПНП, У, где СВ (сила возбуждения) принимает три значения: сильная , слабая, нормальная, СТ (сила торможения) принимает такие же значения, ПНП (подвижность нервных процессов) принимает значения – подвижная, инертная, нормальная, У (уравновешенность) принимает значения- уравновешенная, неуравновешенная в сторону возбуждения, неуравновешенная в сторону торможения. Структура, описывающая почерк, 5 тоже представляет собой кортеж вида Y = Y1, Y2, где Y1 – множество общих признаков, Y2 – множество частных признаков. Подробное описание этой структуры приводится в [3]. Признаки почерка делятся на группы по характеру движений, такие, например, как «направление движений», «координация движений». Эти группы должны быть соотнесены с уровнями построения движений и определяться ими [5].Описание почерка в данной постановке рассматривается как описание свойства объекта, в категориях параметров нервных процессов. Эти параметры определяются с помощью психологических тестов. Для данной работы был выбран тест Я. Стреляу [6]. Если объект (в данной постановке естественнее бы было употреблять слово субъект) X обладает свойством Y, то в базе данных содержится положительный пример J(+1,n)(X1Y), Y = 2 { pij1 , pkm } и отрицательный пример J(-1,n)(X1Z), где Z состоят из значений признаков, i k 2 отличных от pij1 и pkm (i=1,…,n1; k = 1, …, n2). Отметим, что ji и mk пробегают значения ii k го и k-го признаков, соответственно. В реальности J(-1,n)(X1Z) представляет не один, а целую группу отрицательных примеров. Для исключения влияния средовых факторов нужно иметь однородную по уровню обучения, профессиональной деятельности и возрасту выборку. Вместе с тем, следует учитывать, что однородность выборки по профессиональной деятельности может сузить варианты значений параметров высшей нервной деятельности, встречающиеся в выборке, если существует зависимость между значением этих параметров и выбором профессии. Поэтому желательно иметь в выборке несколько групп различающихся профессиональной деятельностью, но однородных по использованию ручки или карандаша по роду своей деятельности. Поскольку при такой постановке структура свойств в базе данных богаче, чем структура объектов и информации о них больше, эффективнее применять так называемый «обратный» ДСМ-метод, суть которого в том, что ищутся зависимости вида «следствие W вызывается причиной V», что выражается в поиске сходства на множестве свойств прежде, чем на множестве объектов. (Описание обратного ДСМ-метода см. в [7]). Отсутствие разумных интерпретируемых результатов при применении ДСМметода указывает на недостатки в определении языка представления данных и|или определении операции сходства, что в свою очередь свидетельствует о неадекватности модели предметной области. Поскольку в настоящий момент модель предметной области не является полной, интеллектуальный анализ данных с помощью ДСМ-метода должен носить итерационный характер. Результаты, в том числе и отрицательные, полученные на 6 первом этапе должны служить указанием для корректировки как модели предметной области, так и применяемых стратегий ДСМ-метода. Первый шаг итерации был проведен на данных, собранных в Московском Университете МВД России. Результаты анализа указали на необходимость более дробной шкалы характеристик параметров нервных процессов. Литература 1. Орлова В.Ф. Судебно-почерковедческая диагностика: учеб. Пособие для студентов вузов / М., ЮНИТИ-ДАНА, Закон и право, 2006 г.. 2. Финн В.К. Синтез познавательных процедур и проблема индукции. // НТИ, сер.2, №1-2, 1999 г. 3. Гусакова С.М., Комаров А.С. Возможности использования ДСМ-метода для решения задач почерковедческой экспертизы. // НТИ, сер.2, № 2007 г. 4. Гусакова С.М., Финн В.К. Сходство и правдоподобный вывод. // Известия АН СССР. – Сер. Техническая кибернетика.- №5 1987 г. 5. Бернштейн Н.А. Биомеханика и физиология движений // Избранные психологические труды. – Москва-Воронеж, 1997 г. 6. Стреляу Я. Роль темперамента в психическом развитии /под общ. ред. И.В. РавичЩербо. – М., Прогресс,1982 г. 7. Гусакова С.М., Михеенкова М.А., Финн В.К. О логических средствах автоматизированного анализа мнений // НТИ, сер.2, №5, 2001 г.