Egg написал(а):1. в конечном итоге, распознавание - это сопоставление образу идентификатора класса...
Хотел бы рассмотреть сравнение с самого начала.
1. Для сравнения в субъекте (так назову распознающий механизм) априори должна существовать некая информация, с которой будет происходить сравнение поступающей извне информации.
1.1. Эта априорная информация не просто набор несвязанных данных. Она связана между собой либо с пом. алгоритмов, находящихся в программном коде, либо часть ее - прямое декларативне указание на такие связи (пример- OWL) + алгоритмы, находящиеся в программном коде.
1.2. Существуют классы и индивиды. Например, "планета Земля". Здесь "планета" - это класс всех возможных планет, даже тех, про которые мы никогда не узнаем. Т.о. класс - это открытый, дополняемый субклассами и экземплярами данного класса понятие. "Земля" - это конкретный экземпляр класса, объект, кот. не может содержать в себе другие подклассы. Если же мы говорим "эта планета населена людьми", то в рамках общего контекста подразумеваем также конкретный индивид - нашу Землю, объект класса "планета". Класс планета содержит в данном примере 2 индивида - Земля и планета. Причем между этими индивидами можно установить связь "тот же самый", т.к. мы подразумевали один и тот же объект - нашу Землю.
1.3.Существуют свойства классов и индивидов. В примере "все_яблоки иметь_форму круглая" (все яблоки имеют форму круглую) виден обычный триплет - объект(класс), атрибут, значение атрибута (если выражаться старыми терминами). Допустим, что про все_яблоки субъекту больше ничего неизвестно. Понятие все_яблоки описано в терминах формы. Т.е. чтобы записать такой триплет, нужно априорно иметь понятия иметь_форму и круглая. Если эти понятия - классы - аксиомы (аппаратно- программно интерпретируемые), либо никак необъясненные - теоремы, то все толкование класса все_яблоки этим и закончится. Отностительно связей между понятиями иметь_форму и круглая. круглая есть субкласс понятия иметь_форму. Получили в итоге вот что - все_яблоки - это по сути дела субкласс класса круглая, а опосредованно - субкласс класса иметь_форму. Говоря обычными словами, "любое яблоко - это что-то имеющее форму" и "любое яблоко - это что-то имеющее круглую форму". Второе выражение - более конкретное.
1.4. На основании вышенаписанного: одним из необходимых условий распознавания является наличие в субъекте априорной онтологии хотя бы с одним корневым классом "Нечто/Вещь", т.к. все, что можно понять, сводимо к этому аксиоматическому классу. Все распознаваемые сущности должны последовательно укладываться в систему ранее описанных знаний онтологии. Поэтому очень важна последовательность создания такой онтологии.
1.5. Распознавание м.б. 2 видов:
1.5.1. Классификация - определение принадлежности распознаваемого образа совокупности/пересечения некоторых понятий-классов онтологии (данное яблоко - индивид класса все_яблоки?).
1.5.2. Идентификация - определение идентичности распознаваемого образа конкретному понятию индивиду онтологии (данное яблоко - тот же самый индивид яблоко1?).
Egg написал(а):2. в связи с тем, что обычно образ- это довольно сложный объект, необходимо его редуцировать...
3. редукция осуществляется с помощью фильтров, суть которых в обработке образа некоторой функцией,
на выходе которой объект меньшей сложности или размерности... в самом простом выражденном случае - скаляр (число)
4. подбирая фильтры (от одного до многих) мы формируем выходной вектор пространства кластеризации
5. это пространство с помощью того или иного метода кластеризации обрабатывается до решения п.1
всё... в эту схему вписывается любое распознавание, какими бы экзотическими не были образы,
фильтры и кластеризация...
2. Распознавание образов субъектом, похожим на человека, не сводимо к простым фильтрам. Первичное распознавание рассмотрел Хьюбелл уже давно на примере зрения. Там действительно по большей части имеется автомат- многомерный фильтр. Его задача - отразить одно пространство - все множество входных параметров/признаков в другое пространство признаков, отсеяв лишнюю необрабатываемую информацию - шум. В таком автомате зашита онтология чаще всего в неявном виде. Но его способностей явно недостаточно для высших субъектов. Поэтому нужен еще набор механизмов распознавания. Рассмотрим их.
2.1. Хорошо, когда есть в наличии все признаки и эти признаки позволяют однозначно классифицировать или идентифицировать. Тогда можно действовать методом полной индукции. Но чаще всего объект одного класса похож на индивида этого класса меньше, чем объект другого класса. Поэтому любое фильтрование приведет к ошибке. Такая ситуация возникает с наблюдением распознаваемого объекта в необычном ракурсе, заслонении его другими объектами, неудачное освещение, тени и др. Итак - первый механизм - первичная фильтрация и сопоставление полученных признаков с априорными эталонами онтологии.
2.2. Ресинтез в пространстве признаков, полученных в результате работы первичных фильтров. Это отдаленно похоже на работу 3D ускорителей в видеокарте, если говорить о зрительной информации. Фильтры активизируют несколько индивидов в онтологии, а механизм ресинтеза активизирует множество др. свойств данных индивидов и на основе этой доп. информации строит в оперативной памяти эти несколько моделей. Человек может манипулировать одновременно приблизительно не более чем с 7 такими моделями. Полученные модели используются для поиса субъектом недостающих характеристик распознаваемого образа, чтобы подтвердить или отвергнуть модели в оперативной памяти и свести распознавание к как можно меньшему кол. таких активизированных моделей. Если даже это неподвижное изображение, то он начинает обзор сменой направления взгляда. В реальной среде можно принимать более активные действия.
2.3. Если вышеописанное распознавание - аналог работы правого полушария мозга человека не приводит к удовлетворительной классификации/идентификации, то необходимо применить абстарактный анализ - синтез. На этом этапе в дело идут более сложные механизмы с т.з. логики их работы. Двигаясь вверх по онтологии от зрительные (перцептивных) моделей (описания индивидов и классов в терминах зрительных признаков), можно получить более абстрактные модели. Например, при рассматривании яблока мы переходим на класс съедобных объектов, если такая информация имеется в онтологии. И чтобы убедиться, что перед нами действительно яблоко, а не муляж или не мячик, искусно раскрашенный под яблоко, пытаемся его надкусить, либо ищем взглядом наличие плодоножки. Здесь видим работу двух механизмов - абстрактный анализ на основании получения признаков распознаваемого образа, не имеющихся в этом образе, под каким бы ракурсом мы его не рассматривали, например, съедобность. И синтез. На самом деле эти механизмы неразделимы, если рассматривать движение по онтологии. Активация более абстрактных понятий на основе более конкретных предположений и проверка этих предположений с пом мысленного или реального эксперимента.
Можно назвать работу такой системы по распознаванию фильтрацией. Но в качестве суперфильтра выступает онтология, а синтезируемые конкретные и/или абстрактные модели - активируемые звенья такого фильтра. Самый простой фильтр - это сопоставление с готовым шаблоном- паттерном, в более сложных случаях необходим итерационный процесс анализ синтез с множеством параллельных вариантов. В некоторых особо сложных случаях синтез такого фильтра - модели - это отдельная сложная задача. Для этого приходится строить сложные теории, а потом годами пытаться их доказать или опровергнуть. Так, например, пытаются объяснить космические наблюдаемые явления с пом. гравитационных волн или космических струн. Это ведь тоже распознавание образов. Построение гипотез и их доказательство - синтез нового, не существующего априори фильтра, элемента онтологии. Это приводит к изменению самой онтологии, и, как следствие, изменение характеристик распознавания на основе исторических данных распознавания и запомненных решений по распознаванию.
Отредактировано victorst (2009-09-18 11:07:06)