Искусственный Интеллект

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Искусственный Интеллект » Онтологическая проблематика ИИ » Что такое изображение?


Что такое изображение?

Сообщений 1 страница 30 из 32

1

Когда я смотрю на мир, я не вижу изображений...
я вижу вещи, предметы... объекты... и даже понятия...
то, что мы не видим изображения доказывает оптические иллюзии
и, в частности, эта, где квадраты A и B одинакового цвета...

в машине ровно наоборот, одна из сложнейших задач - выделение
объектов, связностей и цельных поверхностей...
а вот видеть "понятия" машину не научили до сих пор...

что же мы все-таки видим?
есть желание еще раз поспекулировать на эту тему?

увеличить

Отредактировано Egg (2009-08-27 18:53:34)

0

2

Надо как-то строить обратные связи.
Чтобы обработка была не на уровне пикселей,
а "автоматически" через объекты.

0

3

Орлов написал(а):

"автоматически" через объекты

это будет: распознавание + реконструкция...
теоретически возможно, практически, придется распознавать ВСЕ ВОЗМОЖНЫЕ в мире объекты... :)
допускаю, что мозг при зрении делает тоже самое...
но в таком виде этого не повторить на компе...

0

4

Зрение многоэтапный процесс.
1.В глазу создаются неопределенности, которые разрешаются внешними силами.
2.Получившаяся информация проходит простую обработку вроде поиска границ-областей.
Дальше уже "видит" мозг. Для уверенности что разспознано нужна не просто какая-то вероятность >0, а чтобы несколько независимых распознавателей дали одинаковый результат. А то иногда на самом высшем уровне обработки получается несколько образов, на этом многие иллюзии построены.

Пример. Подпись была "жуткая неведомая @#$я, она подстерегает вас повсюду" :)

увеличить

Отредактировано NO (2009-08-27 21:28:54)

0

5

NO написал(а):

Зрение многоэтапный процесс.

а вот как раз не этапный, а параллельный...
все, что ты написал + различные понятийные штучки на уровне
лицо = глаза + [нос] + губы + еще что-то...
но все это происходит параллельными потоками,
конечно, с обратными связями (куда без них) и только на самом последнем этапе
у нас возникает какая-то устойчивая "интерференционная" картинка всех
вероятностей и возможностей...

восприятие (в том числе и зрение) - это создание параллельных вселенных смысла...

0

6

Еще сегодня смотрел про мозг. Взрослые различают лица людей, но не могут различить двух обезьянок, типа лемуров, даже специалисты. Потом показали обезьянок детям до года, те отличили. Я приостановил и рассматрел картинки, да, там есть отличия вполне явные, но все распознается не конкретная обезьяна, а вот тип этих обезьян. Видимо у меня никаких интересующих меня ассоциаций, типа большеглазая по ночам не спит, толстомордая дерется, длинноухая боится. Поэтому признаки остаются незаметными. Нас ведь интересует не сама картинка, а что из этого следует.

0

7

Egg написал(а):

что же мы все-таки видим?
есть желание еще раз поспекулировать на эту тему?

1. Для начала лучше поставить вопрос шире - "что такое контекст?".
Я осознаю целостный контекст, в который входят визуальные образы, аудиальные образы, образы своего внутреннего состояния, мышечное чувство и т.д. Образ - это актуальный в данный момент класс. Актуальных классов может быть много.
2. Чтобы детальнее понять механизмы того, "что" мы видим, необходимо ответить на более интересный вопрос: зачем мы видим? (зачем нам контекст?) Видим мы только для одной цели - координировать действия своих мышц в пространстве. Т.е. контекст (в частном случае - визуальный контекст) представляет собою что-то вроде карты возможностей для координации тела.
3. Следующий вопрос ещё интереснее: зачем нам координироваться, в чём цель? И есть ответ: координироваться необходимо для того чтобы:
- освободить энергию организма (восстановить энергетический баланс) - безусловный стимул
- устранить изъян в контексте (в картинке, в частном случае) - условный стимул
4. Что может быть изъяном? А вот здесь начинается хаос неопределённостей, ибо изъяном может быть всё что угодно - это зависит от конкретного человека, его случайных целей, всей его социокультурной истории.

Это - контекст (описание) всего человека. В этом описании есть изъян - он не детальный. Этот изъян можно исправлять.

0

8

Prosolver написал(а):

Для начала лучше поставить вопрос шире - "что такое контекст?".

нет, давай не надо шире...
если возникают проблемы понимания слов - вики под руками...
мне практически никогда не интересны онтологии по поводу, мне интересны механизмы...
какая в ж. разница "зачем", "почему", "что"...
с одной стороны ответы на эти вопросы есть всегда, с другой стороны, точно на них вообще не ответить...
все эти вопросы интресны только в связи с ответом на вопрос КАК?
те вопросы, которые ты посчитал более интересными, на мой вкус имеют мало смысла...
а "термины" типа "энергия" или "изьян" или "карта возможностей" - это (ты не сердись) бред...

0

9

NO написал(а):

Поэтому признаки остаются незаметными.

я думаю, здесь обучение играет отрицательную штуку...
без обучения невозможна эффективная работа рецепторами и эффекторами...
но обучение "канализирует" распознавание...

0

10

Egg написал(а):

те вопросы, которые ты посчитал более интересными, на мой вкус имеют мало смысла...
а "термины" типа "энергия" или "изьян" или "карта возможностей" - это (ты не сердись) бред...

Я напиcал слова - создал картинку. Ты их почитал - построил контекст. Нашёл в нём изъяны (выделено в цитате). Высвобождая энергию, набил на клавитуатуре текст, чтобы таким образом (где-то в глубине души надеясь) повлиять на меня т.е. исправить изъян.

Ты пользуешься описанной мною схемой. Мне нечего возразить...
Я могу только попытаться детализировать своё описание, чтобы ответить на вопрос КАК? но если ты даже в общем с моей схемой не согласен (хотя неосознанно и парадоксально применяешь именно её), то я не вижу никакого смысла в этой детализации. (Для меня твоё несогласие является изъяном моего контекста, с которым я, увы, ничего активного поделать не могу... Только отправить данное сообщение и ждать).

0

11

Prosolver
у тебя есть что сказать по существу темы? Конкретно? Без контекстов и энергий?
если есть - говори, если нет - молчи... всё... вся процедура.
Если она понятна - воспользуйся ей, если не понятна - сиди думай.
Прошу еще раз - давай без этих бредовых псевдофилософских оффтопов.
Право быть философами осталось только у двух людей - Сахонько и Болдачева.

Отредактировано Egg (2009-08-27 23:36:07)

0

12

Egg написал(а):

это будет: распознавание + реконструкция...

Не  обязательно. Ассоциативные сети восстанавливают исходное изображение с 25-40% шума.
Никакого распознавания и реконструкции не имея.
Сейчас они работают с растрами, а нужно научить их работать с объектами.

0

13

такое ощущение, что они у нас эту тему подглядели:
http://habrahabr.ru/company/gilalgorithms/blog/68127/

0

14

Орлов написал(а):

Ассоциативные сети восстанавливают исходное изображение с 25-40% шума.

это "восстановление" - не более, чем "сваливание" в одну из "сохраненных" внутри сети картинки...
но они уже заранее должны быть эти картинки...

Орлов написал(а):

а нужно научить их работать с объектами

ок, а что такое объект тогда? растр - это хороший объект,
особенно в проблематике технического зрения...
об объектах какого типа вы говорите?

0

15

Лицо какое нарисовали...ххудожники. Мне на лице видится что-то типа птички. Раскрытый хвост это лоб, крылья это щеки, нос как тело. Это светлая часть, она первой бросается в глаза. По этой фигурке можно представить весь контур, а там уже известно что где искать.

из форума фраза "а все врубился… спасибо" - врубился значит разделил пополам.

Отредактировано NO (2009-08-28 20:35:25)

0

16

NO написал(а):

а там уже известно что где искать

схема в хабре мне не понравилась...
она 1) очевидна, 2) ее реализовывали много раз
ничего радикально успешного (кроме частных инженерных вариантов) я не видел...

проблема в слойности и объектности... плюс градиенты светов и тонов, перекрытия, шумы в тенях и т.п.
я честно не понимаю как это делает глаз...
я понимаю только то, что это - обратная задача и реконструкция...

0

17

Egg написал(а):

я честно не понимаю как это делает глаз...

глаз это делает медленно :)
учиться нужно долго, даже при мощностях человека

Egg написал(а):

я понимаю только то, что это - обратная задача и реконструкция...

Тоже так думаю. Только обратная задача обычно понимается как оценка параметров, обычно числовых. А тут нужна информация о структурах, они плохо представляются числами.

0

18

Egg написал(а):

такое ощущение, что они у нас эту тему подглядели:
http://habrahabr.ru/company/gilalgorithms/blog/68127/

я дико извиняюсь, но когда люди пишут что-то типа этого:
"Базовые алгоритмы распознавания образов, в общем, копируют те же самые блоки:
— выделение контуров
— поиск заданных цветов, текстур
— линейные фильтры..."
то как-то не хочется их читать...
распознавание образов - это не обработка изображений... эти понятия обычно путают те люди, которые реально не занимались этими задачами или только начинают заниматься

0

19

Egg написал(а):

то, что мы не видим изображения доказывает оптические иллюзии
и, в частности, эта, где квадраты A и B одинакового цвета...

меня гораздо больше удивляет, что мы все ж таки воспринимает отдельные пиксели, пусть и "слегка" обработанные
реконструкция? - возможно
но в зрении так много малосвязанных каналов, что удивительно, как собираются результаты обработки в этих каналах для реконструкции...
и есть ли в мозге область, в которой результат этой реконструкции представлен топологически (грубо говоря, как на сетчатке, но вместо видимых яркостей - восстановленные коэффициенты отражения)
если нигде в мозгу такая реконструкция не фиксируется, то как же мы все же видим сцены как изображение?..

0

20

Necr0x0Der написал(а):

и есть ли в мозге область, в которой результат этой реконструкции представлен топологически (грубо говоря, как на сетчатке, но вместо видимых яркостей - восстановленные коэффициенты отражения)

не может не быть... я где-то читал про "кинозал" внутри мозга... но подробностей не помню...

0

21

В книгах про ЛСД и шизофрению такое бывает, называется соответственно "глюк" и "галлюцинация".

0

22

Egg написал(а):

я где-то читал про "кинозал" внутри мозга...

идея кинозала мне не понятна
не буду оригинальным, вспомнив про бесконечную вложенность гомункулусов, смотрящих на "экран" в мозгах друг друга

0

23

Necr0x0Der написал(а):

идея кинозала мне не понятна

если не вдаваться в биологические подробности того как это реализовано у животных и человека,
я представляю себе идею кинозала примерно так то,
что обработка сигналов с глаза происходит именно как кадр,
в какой-то одной области (или не в одной, но с mapping'ом),
где текущий кадр "воспринимается" мозгом как единый зрительный образ...
конечно, этот "кадр" - это сложный объект, во многом в его построении участвует память,
есть какие-то специальные процессы вроде колебания зрачка, есть фокусировании и т.п.,
но это детали...
самая идея очень проста - зрительный образ внешнего мира - это последовательность кадров...

чем плохо?

0

24

Egg написал(а):

об объектах какого типа вы говорите?

Да. Можно и растр. Можно какой-то более сложный объект,
где параметрами является какие-то вектора. В соседней ветке строили.
Моя идея - рассмотреть вопрос, можно ли организовать такой процесс автоматически.
Да. Любая прога - это автоматически.   :angry:
Но при реконструкции и распознавании мы закладываем априорную инфу.
Можно ли получать автоматическое формирование объектов без нее.
Если да, то как.

0

25

Орлов написал(а):

Можно ли получать автоматическое формирование объектов без нее.

человек же получает... :) :)

я смутно понимаю о чем вы говорите... смутно... ассоциирую, не более того...
в своих "экспериментах" с mindstorms роботом я хочу добиться именно этого -
"автоматического" формирования модели внешнего мира на основании сигнала с сонара
и сигналов на двигатели шасси...

был у меня когда и тест такой - выделение слов из потока букв,
тоже достаточно схожая задача, много проще даже, там байты...
на мой вкус это все упирается в одну сложнейшую вещь - в возможность
построение модели "качественного перехода"... я эту проблематику внутри себя зову:
управление сложностью...

если объекты, которыми будет оперировать какая-то система - это "предизайнд" объекты,
тогда эту задачу не решить ни как, ни с какими внешними данными, ни при какой открытости...
если научиться создавать объекты, сложность которых становится большей в процессе работы
системы,  то уже и не важно как именно будут обрабатываться данные...

вот она точка...

0

26

Когда я смотрю на мир, я не вижу изображений...
я вижу вещи, предметы... объекты... и даже понятия...
то, что мы не видим изображения доказывает оптические иллюзии
и, в частности, эта, где квадраты A и B одинакового цвета...

в машине ровно наоборот, одна из сложнейших задач - выделение
объектов, связностей и цельных поверхностей...
а вот видеть "понятия" машину не научили до сих пор...
что же мы все-таки видим?

Мы мало отличаемся от машины, ....видим абсолютно также, даже хуже.... а осознаём только разницу. Причём машина осознаёт свою разницу, человек свою.
Обученная машина может осознавать разницу схожую с человеческой как частный случай... причём, учитель оставляет неизгладимый след своей неразумности в сознании машины. Абсолютный Разум машины не может быть сформирован человеком.... только  самой машиной как интеграция.
Подробнее позже...

0

27

в продолжение бесед об "изображении" как мы его "видим"...
окружности, конечно, не идеальные как написано, но окружности...

кто-нибудь возмьмется объяснить, почему вы видим так, а не иначе?

увеличить

0

28

Egg написал(а):

кто-нибудь возмьмется объяснить, почему вы видим так, а не иначе?

Я вижу спирали. Причем ломанные. Не ровные.
Взгляд продолжает стороны квадратов. Как касательные.
Убрал цвет. Иллюзия уменьшилась, но осталась.
Думаю, отрезки глаз воспринимает "дальше", чем они заканчиваются.

0

29

Egg написал(а):

кто-нибудь возмьмется объяснить, почему вы видим так, а не иначе?

Типичный пример конфликта законов перцептивного группирования.
Элементы зрительного поля могут быть сгруппированы как окружности, могут  - как (почти) прямые линии.
Зрительная система должна выбрать один способ, ибо она предназначена для восприятия нормального мира (а не искусственных картинок), интерпретация которого должна быть однозначной.
В данном случае обе интерпретации столь близки по вероятностям, что зрительная система в разные моменты времени перескакивает то на один способ описания картинки, то на другой. У меня лично картинка все время "плывет"; у кого-то, возможно, получается какое-то усреднение интерпретаций.

0

30

Думаю тут вот в чём секрет.
Квадраты ориентированы так, что если продлить сторону - она не пройдёт через центр конструкции.
Это и создаёт иллюзию спирали.

увеличить

0


Вы здесь » Искусственный Интеллект » Онтологическая проблематика ИИ » Что такое изображение?


Создать форум. Создать магазин