Структуры данных для поиска

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Структуры данных для поиска

« : Апрель 01, 2012, 10:33 »

Добрый день

Есть картинка напр 1kx1k, то есть всего миллион пикселей. Каким-то образом отобрана/маркирована тысяча пикселей (т.е. очень небольшой процент). Теперь пробегаемся по всем пикселям, для каждого смотрим маркированных ближайших соседей. Допустим все они оказались одного (или близкого) цвета. Все хорошо, пошли дальше. Если нет - надо маркировать новый пиксель. Это изменит расклад как для последующих так и для предыдущих - теперь новая точка может оказаться ближайшей вместо старой. Заметим что мы совсем не обязаны немедленно маркировать тот самый пиксель где есть дисбаланс. Задача "сбалансировать всех" а какой пиксель отбирать - наше дело. Конечная цель понятна - описать картинку приближенно небольшим числом пикселей.

Какие структуры данных (возможно стандартные, деревья и.т.п) Вы бы использовали для этой задачи?
Ну и тоже интересно - как бы это дело "разпоточить" (как говорит молодежь

)

Спасибо


	Записан

Tonal

Гость

Re: Структуры данных для поиска

« Ответ #1 : Апрель 02, 2012, 12:15 »

Напрямую матрица в памяти. Если пиксел разумных размеров, то это несколько метров в памяти. Для современных систем - пшик.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Структуры данных для поиска

« Ответ #2 : Апрель 05, 2012, 16:28 »

Цитата: Tonal от Апрель 02, 2012, 12:15

Ну матрица в памяти, и что, как искать-то? Прямым перебором окрестности - прикинем. Радиус 20, значит для каждого пикселя перебрать 440 соседей. Это убого даже для простейшего случая и не годится вообще при первом же усложнении.

А главное - как избежать поиска практически по всему миллиону пикселей снова и снова? Обычно на каждом проходе добавляется очень небольшое число новых пикселей (меньше и меньше с каждым проходом). Т.е. изменяется расклад в очень небольшой области.

Про параллельную реализацию - я так понял даже не беретесь. Ну да, здесь думать надо, это Вам не в СУБД керосин заливать


	Записан

V1KT0P

Гость

Re: Структуры данных для поиска

« Ответ #3 : Апрель 05, 2012, 16:39 »

Цитата: Igors от Апрель 01, 2012, 10:33

)

Спасибо

Может я не совсем понял, но из того что понял я бы делал примерно так(уже с учетом распараллеливания):
1) Делю количество пикселей на количество потоков, каждому потоку даю работу обработать свой участок.
2) На первом проходе выявляются пиксели требующие обработки и номер пикселя добавляется в единый список пикселей.
3) Из единого списка пикселей раздаю потокам пиксели так, чтоб гарантированно не пересекались области работы этих потоков.
4) Каждый поток получив пиксель обрабатывает свою область вокруг пикселя и если требуется обработать еще пиксели в своей области, то добавляют их в список пикселей(это для того чтоб можно было контролировать области работы потоков).
5) Пункты 3-4 повторяются до достижения результата.
Но я не знаю что у тебя за задача стоит и поэтому может можно еще проще ее решить.

добавлено:
Да и еще, если позволяет задача, то потокам можно выдавать бОльшую область и если необходимо обработать новые пиксели, то проверятся если изменения не выйдут за область то обработать тут-же, если выходят то передать в список пикселей. Ну или добавить менеджера, который будет следить и увеличивать область потоку по его запросу, тем самым координируя действия потоков. Короче нужно более подробное описание.

добавлено:
Можно еще проще сделать, разбить изображение на прямоугольные области. Области отдавать потокам. Так как потоки не могут трогать пиксели за пределом своей области, то пиксели на границах всех прямоугольных областей образуют новые прямоугольные области которые используются в следующей итерации. И так каждый раз будут образовываться новые области, но каждый раз меньшего размера и в конце концов обработается последняя область.


« Последнее редактирование: Апрель 05, 2012, 16:50 от V1KT0P »	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Структуры данных для поиска

« Ответ #4 : Апрель 05, 2012, 17:06 »

Цитата: V1KT0P от Апрель 05, 2012, 16:39

2) На первом проходе выявляются пиксели требующие обработки и номер пикселя добавляется в единый список пикселей.

Каким образом выявляются? Как уже говорилось выше, прямой перебор/сканирование не годится

Цитата: V1KT0P от Апрель 05, 2012, 16:39

3) Из единого списка пикселей раздаю потокам пиксели так, чтоб гарантированно не пересекались области работы этих потоков.
4) Каждый поток получив пиксель обрабатывает свою область вокруг пикселя и если требуется обработать еще пиксели в своей области, то добавляют их в список пикселей(это для того чтоб можно было контролировать области работы потоков).

Допустим выявлена группа/банда 10 пикселей стоящих "кучно".

С одной ниткой: маркируем первый, проверяем 9 остальных, допустим все хорошо, больше маркировать не требуется, пошли дальше

С 2-мя нитками: маркируем первый, проверяем остальные, но вот беда: только 5 из них обрабатываются нашей ниткой, 4 остальные - другой. Что делать?


	Записан

V1KT0P

Гость

Re: Структуры данных для поиска

« Ответ #5 : Апрель 05, 2012, 17:15 »

Цитата: Igors от Апрель 05, 2012, 17:06

Цитата: V1KT0P от Апрель 05, 2012, 16:39

Каким образом выявляются? Как уже говорилось выше, прямой перебор/сканирование не годится

Цитата: V1KT0P от Апрель 05, 2012, 16:39

Ну так перебор полюбому должен быть надо же выявить все пиксели. Короче я считаю надо делать так:
Пример с двумя нитками: левая часть обрабатывается первой ниткой, правая второй. правая часть левого изображения и левая правого запрещена к обработке(расстояние при котором гарантированно изменение других пикселей на текущий момент не изменит за пределами области) и эта область является новой областью переходящей в следующую итерацию.
В следующей итерации все области делятся на количество потоков(если потоков меньше областей, то некоторые потоки обработают оставшиеся области) в нашем случае у нас одна область по центру изображения, желательно делить более длинную сторону. У нас по идее вертикальная длинее, значит делим ее горизонтально на верхнуюю и нижнюю, верхнуюю отдаем первому потоку, нижнюю второму. И так повторяем итерици пока не обработаем. Также нельзя разбивать область на части если она меньше определенного размера, иначе эффективность сильно пострадает.

Если что-то непонятно выкладывай картинки, на них проще объяснить.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Структуры данных для поиска

« Ответ #6 : Апрель 06, 2012, 12:44 »

Цитата: V1KT0P от Апрель 05, 2012, 17:15

Короче я считаю надо делать так:
Пример с двумя нитками: левая часть обрабатывается первой ниткой, правая второй. ..

А так нет воспроизводимости. Если мы спланировали работу 1 ниткой - будут маркироваться одни пиксели. Если 2-мя - уже другие. Др числом ниток - третьи

Цитата: V1KT0P от Апрель 05, 2012, 17:15

Ну так перебор полюбому должен быть надо же выявить все пиксели.

Ну вот когда Вам в обычной задаче надо найти элемент в массиве - Вы же не перебираете все элементы, а используете напр QHash или std::set или др. средства. То же и здесь, иначе быстро захлебнемся в переборах, напр

- маркировали какой-то пиксель. Тогда с тупым перебором мы должны
- проверить все точки вокруг этого пикселя (сотни)
- для каждого проверяемого найти его ближайших соседей (чтобы выяснить с ним все Oк)

С квадратичным перебором никакого железа не хватит


	Записан

V1KT0P

Гость

Re: Структуры данных для поиска

« Ответ #7 : Апрель 06, 2012, 13:04 »

Цитата: Igors от Апрель 06, 2012, 12:44

Незная точно что вам нужно конечно врятли кто-то угадает то что необходимо.

Цитата: Igors от Апрель 06, 2012, 12:44

Ну ладно остановимся пока на одной нитке, ибо вам важно в каком порядке обрабатываются пиксели:
1) Проходим по всему массиву и составляем список пикселей для обработки.
2) Проходим по списку и обрабатываем, те что необходимо проверить тоже в список добавляем.
3) Повторяем второй шаг пока не закончатся пиксели.
А вот насчет того чтоб избавиться от необходимости проверки всех точек вокруг пикселя надо знать конкретные условия, например если мы изменяем точку и если на расстоянии нее в 10 пикселей в четыре стороны нету пикселей меньшей цветности то можно добавить квадраты в которых описаны минимальные значения своего участка. И сделать участки можно перекрывающимися. Тогда можно проверить если есть такой пиксель, то производим проверку в нужном квадрате, если нету то продолжаем обработку.
Если задача узкоспециализированна, то надо отталкиваться от условий задачи а не искать способ на все случаи жизни.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Структуры данных для поиска

« Ответ #8 : Апрель 07, 2012, 03:41 »

Цитата: V1KT0P от Апрель 06, 2012, 13:04

А вот насчет того чтоб избавиться от необходимости проверки всех точек вокруг пикселя надо знать конкретные условия, например ..

Каждый пиксель имеет "радиус захвата" который может быть разным для разных пикселей, но всегда известен. Когда пиксель маркируется все точки внутри круга подлежат перепроверке на валидность. Проверка может быть очень всякой-разной, но в любом случае исходные данные для нее = все маркированные пиксели захватывающие данный + конечно расстояния до них.

Цитата: V1KT0P от Апрель 06, 2012, 13:04

1) Проходим по всему массиву и составляем список пикселей для обработки.
2) Проходим по списку и обрабатываем, те что необходимо проверить тоже в список добавляем.
3) Повторяем второй шаг пока не закончатся пиксели.

С этим тоже не все так просто. Получив на первом проходе список инвалидов мы имеем выбор - типа можем ту точку маркировать, а можем и эту. Оптимально выбрав мы можем заметно сократить общее число отмеченных.

Цитата: V1KT0P от Апрель 06, 2012, 13:04

Если задача узкоспециализированна, то надо отталкиваться от условий задачи а не искать способ на все случаи жизни.

Понимаю, но это палка о двух концах - чрезмерная привязка к конкретике, мягко говоря, "не украшает"


« Последнее редактирование: Апрель 07, 2012, 03:43 от Igors »	Записан

V1KT0P

Гость

Re: Структуры данных для поиска

« Ответ #9 : Апрель 07, 2012, 03:56 »

Цитата: Igors от Апрель 07, 2012, 03:41

Понимаю, но это палка о двух концах - чрезмерная привязка к конкретике, мягко говоря, "не украшает"

Тут уж выбирай, либо медленный но универсальный алгоритм. Или же быстрый но узкоспециализированный.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Структуры данных для поиска

« Ответ #10 : Апрель 07, 2012, 14:21 »

Цитата: V1KT0P от Апрель 07, 2012, 03:56

Тут уж выбирай, либо медленный но универсальный алгоритм. Или же быстрый но узкоспециализированный.

А на чем я могу здесь "специализироваться"? Так или иначе мне надо знать расклад, т.е. какие (маркированные) пиксели захватывают/влияют на данный.


	Записан

m_ax

Джедай : наставник для всех

Offline

Сообщений: 2094

Re: Структуры данных для поиска

« Ответ #11 : Апрель 07, 2012, 15:25 »

Честно говоря, постановка задачи немного мутная..
Не понятно чего в итоге хотите получить?


	Записан

Над водой луна двурога. Сяду выпью за Ван Гога. Хорошо, что кот не пьет, Он и так меня поймет..

Arch Linux Plasma 5

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Структуры данных для поиска

« Ответ #12 : Апрель 07, 2012, 15:31 »

Цитата: m_ax от Апрель 07, 2012, 15:25

Не понятно чего в итоге хотите получить?

Цитата: Igors от Апрель 01, 2012, 10:33

Конечная цель понятна - описать картинку приближенно небольшим числом пикселей.


	Записан

QuAzI

Гость

Re: Структуры данных для поиска

« Ответ #13 : Апрель 07, 2012, 15:49 »

Наверное проще увеличить контрастность рисунка и будет у вас гораааздо меньше "разных цветов", в зависимости от того, на сколько сильно "шумный" рисунок. Другой вопрос - как вы этот винегрет из координат будете хранить и воспроизводить? А так 1000*1000 при условии что в памяти это разворачивается в битмап (4 байта на пиксель = R+G+B и какая-то там масочка, которая не всегда используется), соответственно выравнивается по 4 байта и имеет вполне съедобную структуру, при прямом обращении к памяти скорость просто шикарна. Где-то у меня даже старые билдеровские исходники дома валялись, задача была: отсканированный рисунок почистить от шумов, повысить контрастность и затем найти на нём контур детали (как раз сохранялись координаты этой детали с определённым шагом между точками). Работал с BMP, на omnibook xe2 (Pentium II, 64 Мб ОЗУ) шуршало только в путь.


	Записан

V1KT0P

Гость

Re: Структуры данных для поиска

« Ответ #14 : Апрель 07, 2012, 16:02 »

Цитата: Igors от Апрель 07, 2012, 15:31

Цитата: Igors от Апрель 01, 2012, 10:33

Конечная цель понятна - описать картинку приближенно небольшим числом пикселей.

Тебе нужны LODы? Ну так сделай пару лодов, и выбирай их в зависимости от необходимой точности.


	Записан

Страниц: [1] 2 Вверх

Печать

« предыдущая тема следующая тема »