|
Реферат по Теории распознавания образов
1.Общие замечания о применении методов обучения автоматизированному распознаванию образовВ решении задач обучения автоматизированному распознаванию образов (ОАРО) можно проследить одну и ту же схему: для каждой конкретной проблемы специалисты указывают формальный способ описания ситуации, в соответствии с которым образуются векторы признаков ситуации, подлежащие классификации. После этого составляется соответствующая обучающая последовательность (обучающей последовательностью называется последовательность ситуаций с указанием, к какому классу они относятся), а затем с помощью одного из универсальных алгоритмов обучения распознаванию образов строится нужное решающее правило. Часто оказывается, что полученное правило классификации позволяет разделять ситуации точнее, чем это делают специалисты. Может возникнуть иллюзия, что уже одно применение алгоритмов обучения распознаванию образов само по себе гарантирует успех в решении задач классификации. Это далеко не так. Оказалось, что в большинстве успешно решенных задач ОАРО уже задолго до появления методов обучения распознаванию образов было ясно, какая информация нужна для классификации и как данная информация может быть формально представлена. Именно этим во многом и объясняется успех применения методов распознавания. 2.Применение метода обучения распознаванию образов в медицинеВероятно, наибольший интерес у специалистов в области построения обучающихся программ вызывает приложения, связаные с внедрением методов распознавания в медицину. Оказалось, что почти на всех участках своей деятельности врач так или иначе связан с необходимостью классифицировать различные ситуации. Внедрение методов ОАРО в медицину началось уже в первой половине 60-х годов ХХ века. В настоящее время существуют десятки задач, решенных методами ОАРО. При этом оказалось, что в сопоставимых условиях, как правило, классификации с помощью машин значительно точнее классификаций, которые проводит врач. Однако, несомненно, именно на враче лежит ответственность за полноценый и адекватный сбор необходимой диагностической информации, а также за выбор наиболее эфективной в конкретной ситуации стратегии лечения. Методы обучения распознаванию образов используются в медицине для решения следующих задач:
3.Математическое описание задачи обучения автоматизированному распознавания образов3.1. Обобщенная математическая модель процесса обучения распознаванию образов.Основным принципом построения автомата, обучающегося распознаванию образов, является реализация двухэтапной системы обучения, где на первом этапе по априорным данным задается класс возможных решающих правил, а на втором этапе из заданного множества роешающих правил выбирается нужное. Во всякой программе распознавания априори заложен некоторый запас решающих правил, выбранный из тех или иных соображений. И только из этого запаса с помощью обучающей последовательности выбирается нужное правило. Математически это означает, что всякая реальная машина должна использовать специализированное отображение y=f(x), такое, что среди координат вектора y есть такие, которые не меняются при определенных преобразованиях вектора x. В каждой конкретной области приложений выбор отображения чрезвычайно сильно связан с конкретными особенностями этой области знаний и со спецификой конкретной задачи обучения. Таким образом, при реализации первого этапа построения обучающегося автомата приходится решать задачу неформальную: класс функций, задающих решающие правила, определяется конструктором на основании имеющихся в его распоряжении сведений о тех конкретных задачах, которые предстоит решать обучающемуся устройству. Задача второго этапа реализации обучающегося устройства, наоборот, может быть формализавана и имеет строгие схемы решения. Отметим, что, как показали эксперименты, человек недостаточно хорошо справляется с классификацией абстрактной информации. И, к сожалению, пока нет сколь-нибудь общих принципов выбора класса решающих правил - и здесь успех в значительной степени определяется жизненным и профессиональным опытом, интуицией и прозрением специалиста. Поэтому, оставляя в стороне вопрос о том, как устроено отображение, будем рассматривать более общую схему обучающегося автомата. Будем считать, что дано некоторое отображение f(x) или в, координатной форме, y1 = j1(x), ..., ym = jm(x).
Здесь f(x) - входной вектор, соответствующий исходному описанию объекта. Отображение f(x) ставит ему в соответствие некоторое новое описание y. Это отображение выбирается до начала обучения и может быть построено на основании известных сведений о природе данной задачи распознавания. (Биологические объекты, включая человека, вовсе и не учатся находить эти специфицеские отображения, сохраняющие требуемые инварианты. Способность использовать их дана живым существам от рождения и заложена в "схеме" анализаторов, возникших и развившихся в ходе длительной эволюции.) Координаты вектора y теперь в общем случае - действительные числа, не обязательно 0 или 1.. Для простоты будем считать, что требуется различить всего два понятия (поскольку любую задачу классификации можно свести к последовательной дихотомии). Тогда обучающийся автомат отнесет вектор x к первому понятию, если выполнится неравенство m å li ji(x) ³ 0, i=1а в противном случае - ко второму. Такая схема имеет простую геометрическую интерпретацию: в пространстве X задана гиперповерхность m å li ji(x) = 0, i=1которая делит пространство на два полупространства. Считается, что, если вектор x находится по одну сторону от поверхности, то он соответствует первому понятию, если же по другую от нее сторону, то второму. Такие гиперповерхности называют разделяющими. Для образования нового понятия надо построить соответствующую разделяющую гиперповерхность. Каждой гиперповерхности пространства X в пространстве Y соответствует гиперплоскость m å li yi = 0. i=1 Таким образом, введение пространства Y позволяет заменять рассмотрение разделяющих гиперповерхностей рассмотрением разделяющих гиперплоскостей. Поэтому пространство векторов Y получило название спрямляющего. Возникает естественный вопрос, существует ли такое отображение, при котором любые два непересекающиеся в исходном пространстве множества были бы разделимы в новом пространстве гиперплоскостью. Оказывается, да. Беда лишь в том, что при этом:
Это обстоятельство приводит к катастрофически большой оценке необходимой длины обучающей последовательности. Поэтому всякая реальная машина должна использовать специализированное отображение y = f(x), при котором лишь относительно немногие пары непересекающихся в исходном пространстве множеств переходят в разделимые гиперплоскостью. Выбор такого отображения тесно связан со спецификой конкретной задачи обучения и должен делаться в нашей схеме до начала обучения, т.е. опираться на априорные сведения о природе распознаваемых образов. 3.2.Задача обучения автоматов распознаванию образовЗадача обучения распознаванию образов часто рассматриается с точки зрения проблемы минимизации среднего риска, т.е. приводится в следующей постановке: требуется найти минимум функционала R(a) = ò Q(z,a) dP(z),
причем функция Q(z, a) считается известной, а вероятностная мера P(z) заранее неизвестна, но зато дана случайная выборка z1,...,zl, полученная в результате независимых испытаний с неизменным распределением P(z).
Предполагается, что минимум R(a) существует и достигается при a = a0.
Установлено, что решение этой задачи поиска минимума функционала R(a) может быть получено с помощью рекурентных процедур вида: a(i) = a(i - 1) - g(i) q(zi, a(i - 1)).
Для решения задачи поиска минимума функционала R(a) могут также быть использованы методы, где в качестве приближения берется значение a*, доставляющее минимум функции l
Rэмп(a) = 1 / l å Q(z,ai)
i=1.
В качестве меры близости a0 и a* берется разность значений функционала R(a)в этих точках: r(a0, a*) = R(a*) - R(a0),
Близость значений a0 и a* в этом смысле гарантирована, если функция Rэмп(a) равномерно по параметру a приближает функцию R(a), т.е., если
sup | R(a) - Rэмп(a) | £ e
a
или иными словами, нас интересуют не классические условия, когда для любых a и e имеет место
P {| R(a) - Rэмп(a) | > e} ® 0
l ® ¥
а более сильные условия, когда для любого e справедливо
P { sup | R(a) - Rэмп(a) | > e} ® 0
a l ® ¥
В задаче обучения распознаванию образов функция Q(z, a) в функционале R(a) имеет специальный вид. Здесь каждый элемент z есть пара x, w, где x - описание ситуации, а w - указатель класса, к которому в действительности относится эта ситуация. Обычно число классов невелико, т.е. w может принимать конечное небольшое число значений 0, 1, ..., k. Каждому значению параметра a соответствует решающее правило F( x, a), причем функция F( x, a) принимает те же дискретные значения, что и w. В качестве критерия R(a) обычно берется вероятность неправильной классификации с помощью правила F( x, a). Это значит, что определена функция штрафа ì 0 при w = F
F (w, F) = í
î 1 при w ¹ F
и функционал R(a) задан в виде
R(a) = ò F (w, F(x, w)) dP(x, w).
Функция F (w, F) есть характеристическая функция множества Ta = { x, w: F(x, a) ¹ w } .
Соответствено функционал R(a) при каждом значении a есть вероятность события Ta :
R(a) = P {F(x, w) ¹ w} = P (Ta ).
Эмпирическая оценка Rэмп(a) равна частоте n(Ta ) появления этого события в обучающей выборке, т.е. частоте ошибок на материале обучения. Пусть теперь параметр a принимает всевозможные допустимые значения a Î Q. Соответствующие события Ta образуют класс событий S. Равномерная близость функций R(a) и Rэмп(a) означает равномерную близость частот и вероятностей событий Ta по классу S.
|