Распознавание рукописного текста

Страница: « 1 … 4 5 6

Сообщений 151 страница 165 из 165

Поделиться1512009-08-29 00:06:13

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

NO написал(а):

Морфология чего-то слишком сложная

она, наверное, слишком кастомизирована... ее нужно привести к системе...
но я решил таким путем не ходить...
я буду делать три вещи (на начале)
1) считать длину слова
2) распознавать первую и последнюю букву
3) составлю вероятности (с учетом частотности) встечи следующей буквы слева и справа...

а потом, с учетом получившихся вариантов - распознавать слово целиком...

Поделиться1522009-08-29 02:48:27

Автор: NO
Активный участник
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 454
Уважение: [+5/-0]
Позитив: [+8/-1]
Провел на форуме:
5 дней 7 часов
Последний визит:
2012-08-20 09:25:48

Так ошибки могут быть совсем странные. По тематике и структуре предложений можно неплохо догадываться что за слово. Меня чего-то вот это заинтересовало. Как по базе текстов найти лексику, морфологию, грамматику.

Поделиться1532009-08-29 04:13:25

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

NO написал(а):

Так ошибки могут быть совсем странные

да, конечно, "модель" ошибок тоже должна быть...

NO написал(а):

тематике и структуре предложений можно неплохо догадываться

это ты пытаешься сказать о семантике, только используя эвфемизмы...
не знаю, это еще один слой, я пока боюсь об этом думать...

Поделиться1542009-09-11 18:43:05

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

к вопросу о распознавании рукописного текста
http://uncle-doc.livejournal.com/163166.html

Поделиться1552009-09-11 20:57:15

Автор: NO
Активный участник
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 454
Уважение: [+5/-0]
Позитив: [+8/-1]
Провел на форуме:
5 дней 7 часов
Последний визит:
2012-08-20 09:25:48

Грамматику и тематику можно найти статистически, но это еще не смысл. В русском находим частые окончания, по ним классы слов, потом статистику структур предолжений из классов. Отдельно корелляции между значениями разных классов, это уже не подклассы, а именно их связки-темы. На знаю насколько это информативно и стоит ли заниматься, но когда я сам читаю то иногда можно совсем не понятное слово полностью угадать по фразе. Кажется чем более редкое слово тем типичнее его применение, поэтому в словаре стоит хранить не только самую частую статистику.
Про смысл вообще никогда не занимался, сейчас немного поразбирался. Даже человек читает совсем не быстро, а что именно сможет компьютер совсем не ясно. Думаю системная логика может быть не сложная, а вот разные таблицы и онтологии довольно объемные, сложность в них, а не в системе. Без прагматики похоже от семантики остается одна грамматика да статистика, чтобы понимать всё нужно делать какого-то субъекта. Слов очень много поэтому вероятности будут плохие, уверенность наверно бывает только при совпадении распознавания разными способами даже если сумма вероятностей при этом низкая. Программу немного начал, еще без самого распознавания.

Поделиться1562009-09-13 12:40:23

Автор: NO
Активный участник
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 454
Уважение: [+5/-0]
Позитив: [+8/-1]
Провел на форуме:
5 дней 7 часов
Последний визит:
2012-08-20 09:25:48

Поздравляю всех с днем программиста.
Сегодня 256-й день года, по ящику показали министра связи, теперь это официально профессиональный праздник.

Поделиться1572009-09-14 19:20:48

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

NO написал(а):

Думаю системная логика может быть не сложная, а вот разные таблицы и онтологии довольно объемные, сложность в них, а не в системе. Без прагматики похоже от семантики остается одна грамматика да статистика

вообще-то прежде, чем стороить онтологии, хотелось бы понять, а что такое понимание?
честно говоря, удовлетворительного ответа я ни разу не услышал...
почему-то для большинства людей понимание - это умение пользоваться толковым словарем...
можно вернуться в тему "что такое НОВОЕ знание", но без оптимизма,
если под строительством онтологии ты понимаешь конструирование какой-то семантической сети,
то это просто очередной круг...

семантика должна быть выражена через устройство и функционирование системы "понимания",
если она будет в явном виде, то нам будет нужен словарь для словаря для словаря для словаря...
Ленатовские тупики это...

Поделиться1582010-02-02 22:42:56

Автор: Midas
Участник
Зарегистрирован: 2010-01-21
Приглашений: 0
Сообщений: 21
Уважение: [+0/-0]
Позитив: [+0/-0]
Провел на форуме:
7 часов 20 минут
Последний визит:
2010-03-04 16:58:38

И чем все это закончилось? А то остановились как всегда на самом интересном... :'(

Поделиться1592010-02-02 23:21:39

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

Midas написал(а):

И чем все это закончилось?

а ничем... Просольвер, практически, признал свое поражение, сказав, что моё конкретное
решение может быть лучше его решения, но его интересуют какие-то другие решения, а потом вообще
ушел с форума, обидевшись на то, что несет всякую лженаучную чушь...
мне эта задача (как я и говорил) интересна только со стороны работы с семантическим контекстом,
собственно этой работы я и не бросал, поскольку она является частью Референта...

в целом, в этой задаче нет смысла искать какую-то новизну, кроме работы с семантикой,
мощности компов таковы, что можно использовать ЛЮБЫЕ распознавалки, это уже неважно сейчас...

Поделиться1602010-02-05 13:38:16

Автор: Midas
Участник
Зарегистрирован: 2010-01-21
Приглашений: 0
Сообщений: 21
Уважение: [+0/-0]
Позитив: [+0/-0]
Провел на форуме:
7 часов 20 минут
Последний визит:
2010-03-04 16:58:38

Egg написал(а):

хотелось бы понять, а что такое понимание?
честно говоря, удовлетворительного ответа я ни разу не услышал...

А если так: Есть феномены Х, У и Z. Для них запоминание это Х -> У -> Z, а понимание это Z(Y(x)), т.е. в рамках некой условности запоминание это таблица соответствий, а понимание построение алгоритма. Таким образом при запоминании последовательность действий детерминирована и может быть только расширена за счет добавлений (аппаратные ограничения на реструктуризацию сверх больших таблиц). При понимании последовательность действий динамическая и определяется условием существования промежуточных значений (практически нет никаких аппаратных ограничений).

Поделиться1612010-02-05 14:08:25

Автор: Midas
Участник
Зарегистрирован: 2010-01-21
Приглашений: 0
Сообщений: 21
Уважение: [+0/-0]
Позитив: [+0/-0]
Провел на форуме:
7 часов 20 минут
Последний визит:
2010-03-04 16:58:38

NO написал(а):

Грамматику и тематику можно найти статистически, но это еще не смысл.

Не совсем так. В чистом виде грамматику по голой статистике навряд ли поймаешь. Грамматика - фаза развития языка и сильно вариативна ее типизация. По мне так вообще имело бы смысл говорить не о генетической типизации, а об онтологической. В таком ракурсе становится понятны, по крайней мере мне (с моей колокольни), затруднения с окончательной структурой типов у классической лингвистики. Мне почему-то кажется что существует единый, рекуррентный алгоритм развития семейства языков Homo Sapiens, циркулирующий в границах сегментированных онтологий - агглюкативные на периферии, флективные в основной (массовой) и максимально изолированные в ядре. Т.е. если применять частотный анализ в рамках хотя бы базовой онтологии, то можно построить не только грамматику и тематику, но и получить, через них, хотя бы грубый контекст и начальное понимание.

Поделиться1622010-02-05 18:32:01

Автор: fuzzy_man
Активный участник
Зарегистрирован: 2009-08-29
Приглашений: 0
Сообщений: 60
Уважение: [+0/-0]
Позитив: [+0/-0]
Провел на форуме:
11 часов 8 минут
Последний визит:
2012-02-16 19:57:48

Midas написал(а):

понимание построение алгоритма

Опять алгоритмы , у меня создается ощущение, что большинство людей пребывает в иллюзии того, что все эти высокоуровневневые системы и объекты, таки как медиа, блоги, тексты и прочее, - это уже элемент обработки компьютеров. Давайте, мы вспомним о том, что компьютер занимается только обработкой чисел, а все смыслы и понимания создает человек, который использует компьютер так же как трактор, почему то ни у кого нет иллюзии о том, что трактор выращивает овощи или заводы делают изделия, или телевизор создает фильмы и передачи. Вот, хороше слово: передача, компьютер занимается только передачей. Интеллект, безусловно, не достижим, но зачем же при этом, вместо того, чтобы пытаться сделать более интеллектуальным обработку, Вы пытаетесь максимально упростить процесс понимания? Понимание основано на образах, эмоциях и существовании, а не таблицах и алгоритмах.

Поделиться1632010-02-05 21:27:20

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

Midas написал(а):

А если так:

если так, то вообще не понятно... похоже на HMM, нет в этих цепях никакого понимания...
без понятий Модель и Прогноз что такое понимание не понять...

Поделиться1642010-02-07 16:11:44

Автор: Midas
Участник
Зарегистрирован: 2010-01-21
Приглашений: 0
Сообщений: 21
Уважение: [+0/-0]
Позитив: [+0/-0]
Провел на форуме:
7 часов 20 минут
Последний визит:
2010-03-04 16:58:38

А если так:

если так, то вообще не понятно... похоже на HMM, нет в этих цепях никакого понимания...
Понимание качествено новый этап развития памяти. Качество "компактность", чье весьма частное свойство МДО ты так не любишь , будет уплотнять память реструктуризируя феноменологическую таблицу отношений в граф. Но это ненадолго - идеальное усложнение системы ускоряет прохождение сигналов, но не увеличивает память. Следующим шагом будет компрессия с потерями, когда последовательность "промежуточных" значений заменяется алгоритмом (совокупность контекстно-связанных алгоритмов - модель). Вычислимые феномены\свойства, вместо хранимых, используются для формирования новых алгоритмов. Отсюда видно что расчет значения системы в новой, ранее не расчитывавшейся, точке не является прогнозом, т.к. Модель существует на всем известном интервале и эквивалентно извлечению существующего значения из архива. Так что прогноз, построение модели для несуществующего в памяти диапазона, тут не причем - еще не доросли. Но тут пока не видно рового качества, так, все еще количественные изменения. А качество в автогенерации новых, чисто динамических, алгоритмов и моделей, т.е. Формирование нового измерения ранее недоступного нам в "ощущениях". И действительно, наши рецепторные системы не регистрировали феноменов лежащих в основе некоторых моделей, но они, хоть и динамически, но уже априори существуют в нашей ментальной модели. Следующей мутацией знание, кстати изобретенное до человека, будет прогноз - автогенерация алгоритмов\моделей для несуществующего диапозона.

без понятий Модель и Прогноз что такое понимание не понять...
И как ты себе это представляешь - отрезали лягушке лапу, подкличили ток и она будет сокращаться до старческой смпрти клеток? А откуда возмется АТФ и куда будет деваться метаболиты? Так что по мне без рекурентных, хоть и не объявленных явно, качеств никак...

PS На смартфоне, да еще и моем, форум работает ужасно. Так что звиняй еже ли что...

Поделиться1652010-02-07 20:58:08

Автор: Egg
Активный участник
Откуда: CU, USA
Зарегистрирован: 2009-08-03
Приглашений: 0
Сообщений: 1102
Уважение: [+2/-1]
Позитив: [+8/-1]
Провел на форуме:
7 дней 7 часов
Последний визит:
2025-02-02 18:13:51

Midas написал(а):

Качество "компактность", чье весьма частное свойство МДО

ага.. сейчас все свойства станут частными случаями МДО... Ты когда-нибудь пробовал читать zip-файл какого-нибудь текста?
много понятнее, чем простой текст, не правда ли?
представление о том, что мышление - это что-то типа архивирования как раз и грешит тем,
что понятие - это вовсе не свертка сигнала с рецепторов, это "интерфейс" между образом и нотацией...
поэтому и нет ничего, чтобы не было доступно нам в ощущениях, просто ощущения эти очень разные...
у математика они одни, у художника - другие...

Midas написал(а):

автогенерация алгоритмов\моделей для несуществующего диапозона

это не самая сложная задача... с ней справляется любая экстраполяция...
проблема в том, что это за "диапазон"... если это область значений какого свойства - это одно,
если это качественное изменение фазы описания явления - это совсем другое...
эта задача уже из области: пойду туда не знаю куда, принеси то не знаю что...
но и с автогенерацией будет проблема... никогда не будет нужных для этого вычислительных мощностей...
человеческое мышление идет по совсем другому пути - фильтрации и оптимизации...

Midas написал(а):

отрезали лягушке лапу, подкличили ток

не понял этой метафоры...
я говорил о том, что мышление - это умение строить модели мира и прогнозировать с их помощью изменения мира в будущем...
это мое текущее бытовое определение этого процесса...

Страница: « 1 … 4 5 6

Искусственный Интеллект

Меню навигации

Пользовательские ссылки

Информация о пользователе

Распознавание рукописного текста

Сообщений 151 страница 165 из 165

Поделиться1512009-08-29 00:06:13

Поделиться1522009-08-29 02:48:27

Поделиться1532009-08-29 04:13:25

Поделиться1542009-09-11 18:43:05

Поделиться1552009-09-11 20:57:15

Поделиться1562009-09-13 12:40:23

Поделиться1572009-09-14 19:20:48

Поделиться1582010-02-02 22:42:56

Поделиться1592010-02-02 23:21:39

Поделиться1602010-02-05 13:38:16

Поделиться1612010-02-05 14:08:25

Поделиться1622010-02-05 18:32:01

Поделиться1632010-02-05 21:27:20

Поделиться1642010-02-07 16:11:44

Поделиться1652010-02-07 20:58:08