понимаете, я в 23 года был доцентом на кафедре физики, а в 24 завсектором в УрО РАН...
что такое наука как она делается я знаю очень отчетливо...
Я тоже очень хорошо знаю, какой бывает наука в СНГ.
Но вы, судя по всему, не ездили в США и Европу - или, если ездили, то в какие-то крайне неправильные с точки зрения науки места. Потому как в правильных местах там действительно занимаются делом. И такой фигни, как у меня была с публикацией в местной "мурзилке", когда отчет за пару недель работы легким движением руки превратился в статью, там нет (в приличных местах конечно).
уточните задачу - покажу, какие проблемы...
Задача формулируется очень просто: есть база рукописных цифр, вот эта http://yann.lecun.com/exdb/mnist/ - там все описано. 60 тысяч цифр для обучения, 10 тысяч для тестирования. Обучение без учителя - т.е. алгоритм должен посмотреть на базу, выработать какой-то набор классов на обучающей выборке, каждому этому классу вы ставите в соответствие число, которое будет ответом системы, если образ будет отнесен к этому классу, и при запуске на тестовой выборке нужно посмотреть, сколько чисел совпадет с правильными ответами.
Реальные данные - это тонкости, детали и условия, тонны деталей,
Я вас от всех тонкостей освобождаю - мне нужна просто база векторов: исходные данные и класс, к которому этот вектор принадлежит. Ну и ваш алгоритм в скомпилированном виде - чтобы сравнить результаты работы.
Или могу предложить свои данные, самые свежие - есть изображение руки по 4м каналам (R,G,B, маска кожи), выборка что-то около 60 тысяч векторов по 1024 числа. На выходе - два вещественных числа от 0.1 до 0.9, обозначающих координаты центра поданной на вход руки (так, что 0.5, 0.5 означает, что изображение руки центрировано, 0.1 сильно смещено в одну сторону, 0.9 - в другую, дам точную формулу зависимости числа от смещения в пикселях и ограничения). Тестовая выборка тоже примерно того же размера. У меня на решение этой задачи ушло около четырех суток (с момента окончательного выбора препроцессинга до получения сети, которая ушла в финальную версию проекта). Ну и разумеется тут я дам свою программу, которая покажет соответствующий результат (на тестовой выборке - что-то около 2-3 пикселей ошибки, по памяти не скажу точнее), и которая даст сеть, обладающую свойствами сходимости (т.е. если последовательно давать ей данные, смещаться в сторону, которую она укажет, и давать новые данные - придем к руке из большинства окрестных точек). Но сходимость ладно, ее тестировать неудобно - хотя бы среднюю ошибку сравним.
посмотрим какой вы инженер - сделаю следующий шаг
Я все же надеюсь, что я ученый, а не просто инженер. Хотя в принципе в IEEE я состою, да...