Как эффективно генерировать комбинацию без повторения с определенным отличительным числом между ними


Как эффективно генерировать наборы комбинаций без повторения, где все множества имеют определенное отличительное число между собой.
* ПРИМЕЧАНИЕ: Номер диапазона всегда начинается с 0.


Пример:

Номер диапазона (числа [])= 0,1,2,3,4,5,6,7 == > всего 8 чисел (n).
Комбинация (k)= 5 чисел.
Отличительные номера (nD)= 2 числа.


Результаты:
0 1 2 3 4
0 1 2 5 6
0 1 3 5 7
0 1 4 6 7
0 2 3 6 7
0 2 4 5 7
0 3 4 5 6
Есть 7 допустимых комбинаций


Как он собран:

Так как я плохо разбираюсь в словах, поэтому позвольте мне визуализировать их так: введите описание изображения здесь

Чтобы объяснить их отличительные числа: введите описание изображения здесь

И мы могли бы суммировать их в этой таблице: введите описание изображения здесь


Что я до сих пор добился

Мое текущее решение очень неэффективно (или вы можете называть его грубой силой).
* Первый цикл я для каждой комбинации. == > k C n
* Затем я создаю temp для действительной комбинации.
* Затем для каждой комбинации я проверяю на мой темп, если его действительный, то сохраните его в temp, иначе проигнорируйте его.
Вот оно.

Вот мой код в приложении консоли:

class Program
{
    static List<int[]> ValidCombinations;

    static void Main()
    {
        ValidCombinations = new List<int[]>();

        int[] numbers = Enumerable.Range(0, 8).ToArray();
        int n = numbers.Length;
        const int k = 5;
        const int nD = 2;

        int maxIntersect = k - nD;

        int iCombination = 0;
        int iValidCombination = 0;
        int[] _temp = new int[k];
        foreach (int[] c in FindCombinations(k, n))
        {
            // #Print out
            for (int i = 0; i < n; i++)
            {
                if (c.Contains(i))
                    Console.Write(c[Array.IndexOf(c, i)] + " ");
                else
                    Console.Write("_ ");
            }

            // Save to List
            if (IsValidSet(c, maxIntersect))
            {
                _temp = new int[k];
                for (int i = 0; i < c.Length; i++)
                {
                    _temp[i] = c[i];
                }
                ValidCombinations.Add(_temp);
                iValidCombination++;
                Console.Write(" ### --> {0}", string.Join(" ", c));
            }
            Console.WriteLine();

            iCombination++;
        }
        Console.WriteLine("\nTotal Combination = {0}", iCombination);
        Console.WriteLine("Valid Combination Found = {0}", iValidCombination);
    }

    public static IEnumerable<int[]> FindCombosRec(int[] buffer, int done, int begin, int end)
    {
        for (int i = begin; i < end; i++)
        {
            buffer[done] = i;

            if (done == buffer.Length - 1)
                yield return buffer;
            else
                foreach (int[] child in FindCombosRec(buffer, done + 1, i + 1, end))
                    yield return child;
        }
    }

    public static IEnumerable<int[]> FindCombinations(int m, int n)
    {
        return FindCombosRec(new int[m], 0, 0, n);
    }

    private static bool IsValidSet(int[] set, int maxIntersect)
    {
        foreach (var item in ValidCombinations)
        {
            if (set.Intersect(item).Count() > maxIntersect)
                return false;
        }

        return true;
    }
}

Я получил базовый код для создания комбинации здесь.


Проблемы

Это работа, но для большего диапазона чисел это решение займет много времени. Я знаю, потому что комбинационный алгоритм задействован, но должен быть какой-то ярлык или шаблон, чтобы упростить его (который мой маленький мозг не смог понять).

Большое спасибо.

Ответ 1

Ваше матричное представление показывает, что эта проблема гомологична или, по крайней мере, очень похожа на нахождение набора различных двоичных слов фиксированного размера, константа Вес Хэмминга и с константой расстояние Хэмминга между любой их парой.

Графически:

введите описание изображения здесь

Как описано в этом вопросе, эта проблема не обязательно тривиальна. В частности, предлагаемое решение объясняет, как построить матрицу Адамара, строки которой представляют собой бинарные слова, которые вы ищете.

Изображение взято из http://mathworld.wolfram.com/images/eps-gif/HadamardMatrices_800.gif

Это выглядит очень похоже на вашу матрицу. Во всяком случае, вам нужно немного более общее. В отличие от этого случая, вы не хотите, чтобы каждая пара строк имела ровно расстояние n/2, но постоянное расстояние d < n/2.

Нижняя строка

Возможность легко генерировать множества двоичных слов с постоянным размером (определяется длиной массива numbers), постоянным весом (определяемым вашим k) и постоянным расстоянием (определяется вашим nD), в значительной степени зависит от эти параметры. Учитывая, что некоторые методы для создания этих наборов полагаются на некоторые предположения по этим параметрам, я предполагаю, что нет эффективного алгоритма для общего случая.

В любом случае, может быть полезно, если вы измените свой вопрос и спросите его на MathOverflow, возможно, связав этот вопрос и тот, который я связал.

Предложение алгоритма

Что касается алгоритма (который, как и ваш, не будет работать с большими числами), вы можете попробовать следующее:

  • Создайте двоичное слово, состоящее из k, за которым следует (numbers.Length - nD) нули и сохраните его в списке
  • Итеративно генерируйте каждое слово, имеющее ровно 2*nD бит, отличный от вашего исходного слова.
  • Для каждого сгенерированного слова попробуйте сохранить его в списке, только если он имеет 2*nD расстояние друг от друга в списке.

Не так уж и отличается от вашего подхода, но я думаю, что это могло бы работать немного лучше, ты.

Ответ 2

#include<iostream>
#include<vector>
#define N 8
#define K 5
#define D 2
using namespace std;

vector<vector<int>> vv;
vector<int> v;
int intersection(const vector<int>& a, const vector<int>& b) 
{//count elements of intersection of two sorted vectors
    int count = 0;
    auto a_it = a.begin();
    auto b_it = b.begin();
    while(a_it != a.end() && b_it != b.end()) {
        if(*a_it == *b_it) count++, a_it++, b_it++; 
        else if(*a_it < *b_it) a_it++;
        else b_it++;
    }
    return count;
}

void select_num(int n)
{//might reduce some unnecessary iteration of nCk combination 
    for(auto& a : vv) if(intersection(a, v) > K - D) return;
    //above line will cut off the chain when the intersection is already over 
    //limit. You can add some more conditions to cut off unnecessary calculation.
    if(v.size() == K) {
        bool ok = true;
        for(auto& a : vv) {
            if(intersection(a, v) != K - D) {
                ok = false;
                break;
            }
        }
        if(ok) vv.push_back(v);
        return;
    }
    if(n == N) return;

    //case : select n
    v.push_back(n);
    select_num(n+1);
    v.pop_back();

    //case : do not select n
    select_num(n+1);
}

int main()
{
    select_num(0);
    for(auto& a : vv) {
        for(auto& b : a) cout << b << ' ';
        cout << endl;
    }
    cout << endl << vv.size() << endl;
}