Простой (?) поиск

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Простой (?) поиск

« : Сентября 16, 2018, 11:34 »

Добрый день

Есть контейнер объектов, каждый имеет такие (интересующие нас) поля. все они НЕ уникальны

- имя (QString)
- тип (enum или int)
- visibility (bool)

Нужно: для заданного имени + типа найти "наилучший" объект в контейнере, т.е.

- имя должно точно совпадать, иначе объект не найден
- тип: если совпадает с заданным - хорошо, это "наилучший", иначе годится любой
- visibility: если true это "наилучший", иначе годится и false

И наконец если все ключи совпадают, должен быть найден первый (по порядку в исходном контейнеру). Как лучше/техничнее сделать такой поиск ?

Спасибо


	Записан

deMax

Хакер

Offline

Сообщений: 600

Re: Простой (?) поиск

« Ответ #1 : Сентября 18, 2018, 17:18 »

Обьектов много? Имен не уникальных много? Если в лоб, находим первый объект с именем(если все совпало - в ответ), иначе ищем следующий (если лучше - заменяемб совпало в ответ)... и так пока все объекты не пройдем.

Чтобы быстрее искалось - QMap, QMsql.... Если объектов с одинаковым именем очень много, тогда БД - ищем полное совпадение, потом хуже и хуже...


	Записан

RedDog

Частый гость

Offline

Сообщений: 221

Re: Простой (?) поиск

« Ответ #2 : Сентября 18, 2018, 19:04 »

QMultiMap можно заюзать, если есть совпадающие имена. Тогда в значениях ее можно хранить структуру int/bool.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Простой (?) поиск

« Ответ #3 : Сентября 19, 2018, 08:08 »

Цитата: deMax от Сентября 18, 2018, 17:18

Обьектов много?
...
Если объектов с одинаковым именем очень много...

Причем тут много-мало?

Интересует корректное, "академическое" решение задачи, действительно ли оно такое уж сложное? А может оно проще "прямого перебора" который кстати здесь достаточно хлопотливый ?

Цитата: deMax от Сентября 18, 2018, 17:18

Чтобы быстрее искалось - QMap,

Цитата: RedDog от Сентября 18, 2018, 19:04

QMultiMap можно заюзать, если есть совпадающие имена. Тогда в значениях ее можно хранить структуру int/bool.

Да, можем создавать любые контейнеры (поиск нужен многократно). И что? Как искать-то?

Вначале я подумал слить все проверки в ключ (или оператор <) и отсортировать по этому (композитному) ключу. Тогда поиск: lower_bound и проверяем найденный + предыдуший. Но почему-то мне показалось это не проходит... Или я неправ?


	Записан

Figaro

Гость

Re: Простой (?) поиск

« Ответ #4 : Сентября 19, 2018, 14:09 »

Цитата: RedDog от Сентября 18, 2018, 19:04

QMultiMap можно заюзать, если есть совпадающие имена. Тогда в значениях ее можно хранить структуру int/bool.

Согласен с QMultiMap, только в значениях проще хранить QVariant… Это мне кажется проще


	Записан

RedDog

Частый гость

Offline

Сообщений: 221

Re: Простой (?) поиск

« Ответ #5 : Сентября 19, 2018, 19:02 »

Цитата: Igors от Сентября 19, 2018, 08:08

Цитата: deMax от Сентября 18, 2018, 17:18

Обьектов много?
...
Если объектов с одинаковым именем очень много...

Причем тут много-мало?

Цитата: deMax от Сентября 18, 2018, 17:18

Чтобы быстрее искалось - QMap,

Цитата: RedDog от Сентября 18, 2018, 19:04

QMultiMap можно заюзать, если есть совпадающие имена. Тогда в значениях ее можно хранить структуру int/bool.

Исходя из первого поста если я правильно понял, то иерархию поиска можно описать по убыванию:
- имя
- видимость
- тип
т.о. у мапы ключ - имя, в значениях отсортированный лист структур, оператор < можно сделать только по полю "видимость".
Ну а далее либо самый первый в листе берем, либо есть видимость в фолсе, тогда переходим к следующему.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Простой (?) поиск

« Ответ #6 : Сентября 20, 2018, 08:27 »

Цитата: RedDog от Сентября 19, 2018, 19:02

Исходя из первого поста если я правильно понял, то иерархию поиска можно описать по убыванию:
- имя
- видимость
- тип

Нет, см первый пост: имя + тип + видимость

Цитата: RedDog от Сентября 19, 2018, 19:02

т.о. у мапы ключ - имя,

Чего это

Почему не

Код

C++ (Qt)
typedef QPair<QString, int> TKey;  // имя + тип
typedef QPair<QString, QPair<int, bool> > TKey;  // имя + тип + видимочть


	Записан

RedDog

Частый гость

Offline

Сообщений: 221

Re: Простой (?) поиск

« Ответ #7 : Сентября 20, 2018, 09:36 »

Я может не сильно до конца задачу понял, но показалось, что первичное условие это имя, и если его нет, то далее искать бессмысленно.
Поэтому поиск по оставшимся 2 параметрам можно сократить, объединив элементы с одинаковыми именами.


	Записан

deMax

Хакер

Offline

Сообщений: 600

Re: Простой (?) поиск

« Ответ #8 : Сентября 20, 2018, 09:47 »

Цитата: Igors от Сентября 19, 2018, 08:08

Причем тут много-мало?

А что сложного в прямом переборе? Создаете пустой указатель и перебираете массив, заменяя значение более выгодным (если все совпало, поиск останавливаете).
Если память не так важна, и вызовов очень много, то загоните в QMap<QString /*Name*/, QMap<int /*Type*/, bool /*Visible*/>> и двумя строчками извлеките ответ.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Простой (?) поиск

« Ответ #9 : Сентября 20, 2018, 09:58 »

Цитата: RedDog от Сентября 20, 2018, 09:36

Я может не сильно до конца задачу понял, но показалось, что первичное условие это имя, и если его нет, то далее искать бессмысленно.

Да, так и есть, правильно поняли

Цитата: RedDog от Сентября 20, 2018, 09:36

Поэтому поиск по оставшимся 2 параметрам можно сократить, объединив элементы с одинаковыми именами.

Совершенно непонятный вывод. А остальные правила (или критерии) поиска разве нельзя задать в ключах мапы?

Цитата: deMax от Сентября 20, 2018, 09:47

А что сложного в прямом переборе?

Ну вообще-то прямой перебор - "визитная карточка лоха"

Цитата: deMax от Сентября 20, 2018, 09:47

Если память не так важна, и вызовов очень много, то загоните в QMap<QString /*Name*/, QMap<int /*Type*/, bool /*Visible*/>> и двумя строчками извлеките ответ.

Какой Вы быстрый

Ну во-первых мапа не гарантирует что эл-ты с одним ключом будут в порядке исходного массива. И хотелось бы увидеть эти "две строчки извлечения"


	Записан

RedDog

Частый гость

Offline

Сообщений: 221

Re: Простой (?) поиск

« Ответ #10 : Сентября 20, 2018, 13:16 »

есть мысль построить индексы по каждому полю, в значениях хранить лист индексов элементов в исходном массиве.
тогда при поиске делать пересечение всех трёх индексов.
С телефона код не напишу, могу вечером набросать.


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Простой (?) поиск

« Ответ #11 : Сентября 20, 2018, 17:08 »

Цитата: RedDog от Сентября 20, 2018, 13:16

Спасибо, но давайте лучше уясним что писать-то, тогда собсно написание не проблема. Пусть напр ключи в мапе легли так

Цитировать

{ "Name", 1, false, 100 } // имя, тип, видимость, индекс в исходном
{ "Name", 3, false, 10 }
{ "Name", 4, true, 101 }

Ищем { "Name", 2, false, 0 }. QMap::lowerBound (std::lowerBound) вернет итератор на второй { "Name", 3, false, 10 }, он "не меньше". Проверяем найденный и предыдущий - у обоих тип не совпадает, у обоих видимость false. Однако был ключ "лучше" - у последнего тоже тип не совпадает, зато видимость true. Поэтому я и решил что не проходит, нужно топать по всем эл-там пока искомое имя не кончится и руками искать "лучший". Верно ли я мыслюсь?


	Записан

RedDog

Частый гость

Offline

Сообщений: 221

Re: Простой (?) поиск

« Ответ #12 : Сентября 20, 2018, 19:32 »

вот чего накидал:

Код:

#include <QHash>
#include <QVector>
#include <QSet>
#include <QDebug>

#include <algorithm>

struct ObjectInfo
{
    QString name;
    int type;
    bool visible;

};

QList<ObjectInfo> objects;

QHash<QString, QList<int>> nameIndex;
QHash<int, QList<int>> typeIndex;
QHash<bool, QList<int>> visibleIndex;


void fill()
{
    for (int i = 0; i < 100; ++i)
    {
        const QString name = QString("name%1").arg(qrand()%5);
        const int type = qrand()%27;
        const bool visible = (i%2);
        ObjectInfo objectInfo{name, type, visible};

        const int index = objects.size();

        nameIndex[name] << index;
        typeIndex[type] << index;
        visibleIndex[visible] << index;
        objects << objectInfo;
    }
}

int find(const QString& name, const int type, const bool visible)
{
    auto it = nameIndex.find(name);
    if (it == nameIndex.cend()) // имя не найдено - увы
        return -1;

    if (it.value().isEmpty()) // ничего не проиндексировано - увы
        return -1;

    QSet<int> types = typeIndex.value(type).toSet();
    QSet<int> visibles = visibleIndex.value(visible).toSet();

    QSet<int> intersects = types.intersect(visibles); // пересекающиеся индексы типа и видимости
    if (intersects.isEmpty()) // ничего не персекается - возвращаем первый индекс по имени
        return it.value().first();

    intersects = intersects.intersect(it.value().toSet()); //пересечение имени и типа/видимости
    if (intersects.isEmpty())
        return it.value().first();

    QList<int> indexes = intersects.toList();
    auto min = std::min_element(indexes.cbegin(), indexes.cend());
    return *min;
}


int main(int argc, char *argv[])
{
    Q_UNUSED(argc);
    Q_UNUSED(argv);

    fill();

    const int index = find("name1", 5, true);
    if (index >= 0)
        qDebug() << objects.at(index).name;

    return 0;
}


	Записан

Igors

Джедай : наставник для всех

Offline

Сообщений: 11445

Re: Простой (?) поиск

« Ответ #13 : Сентября 21, 2018, 09:12 »

Цитата: RedDog от Сентября 20, 2018, 19:32

вот чего накидал:

Ну все-таки надо думать о производительности и расходе ресурсов (хотя бы иногда

). Создавать многочисленные контейнеры на каждом поиске - ну это уж слишком


	Записан

RedDog

Частый гость

Offline

Сообщений: 221

Re: Простой (?) поиск

« Ответ #14 : Сентября 21, 2018, 09:44 »

Цитата: Igors от Сентября 21, 2018, 09:12

Цитата: RedDog от Сентября 20, 2018, 19:32

вот чего накидал:

Ну все-таки надо думать о производительности и расходе ресурсов (хотя бы иногда

). Создавать многочисленные контейнеры на каждом поиске - ну это уж слишком

Если объектов десятки-сотни миллионов, тогда поиск лучше возложить на БД.
Что касается производительности, то поиск по хешу О(1) в среднем. Пересечение только замедлить может.
Ну в общем, принцип пересечения подмножеств я предложил, дальше вам решать, подойдёт ли он под конкретную задачу.
ps: у меня в проекте с 300-2000 тыс объектов подобные индексации используются, производительности хватает, памяти на индексирование до 200мб жрется.


	Записан

Страниц: [1] 2 3 Вверх

Печать

« предыдущая тема следующая тема »