对数组的所有子集进行计数,其中最大的数字是剩余数字的总和

问题描述

|| 我一直在努力应对Greplin挑战的第3级。对于那些不熟悉的人,这是问题所在:   您必须找到数组的所有子集,其中最大的数字是剩余数字的总和。例如,输入以下内容:      (1,2,3,4,6)      子集将是      1 + 2 = 3      1 + 3 = 4      2 + 4 = 6      1 + 2 + 3 = 6      这是您应该拨打的号码清单   运行您的代码密码是   子集数。在上述情况下   答案是4。      3、4、9、14、15、19、28、37、47、50、54、56、59、61、70、73、78、81、92、95、97、99 我能够编写一个解决方案,该解决方案可以构建全部400万个数字以及22个数字的组合,然后对其进行全部测试,这将为我提供正确的答案。问题是需要40多分钟才能完成。在网上搜索似乎好几个人能够编写算法以在不到一秒钟的时间内得到答案。与计算上昂贵的蛮力方法相比,谁能用伪代码解释解决此问题的更好方法?它让我发疯!     

解决方法

        诀窍是,您只需要跟踪做事的方法数量即可。由于数字已排序且为正数,因此这非常容易。这是一个有效的解决方案。 (我的笔记本电脑需要不到0.03秒的时间。)
#! /usr/bin/python

numbers = [
    3,4,9,14,15,19,28,37,47,50,54,56,59,61,70,73,78,81,92,95,97,99]

max_number = max(numbers)
counts = {0: 1}
answer = 0
for number in numbers:
    if number in counts:
        answer += counts[number]
    prev = [(s,c) for (s,c) in counts.iteritems()]
    for (s,c) in prev:
        val = s+number;
        if max_number < val:
            continue
        if val not in counts:
            counts[val] = c
        else:
            counts[val] += c
print answer
    ,        我们知道值是非零的并且从左到右单调增长。 一个想法是枚举可能的总和(从左到右的任何顺序都可以) 然后枚举该值左侧的子集, 因为右边的值不可能参与(它们求和 太大)。我们不必实例化集合;正如我们所考虑的 每个值,查看是否影响总和。可能太大(忽略) 该值,不能在集合中),就在右边(它在集合中的最后一个成员), 或太小,则可能不在集合中。 [这个问题使我第一次使用Python。好玩。] 这是Python代码;根据Cprofile.run,这需要.00772秒 在我的P8700 2.54Ghz笔记本电脑上。
values = [3,99]

def count():
   # sort(values) # force strictly increasing order
   last_value=-1
   duplicates=0
   totalsets=0
   for sum_value in values: # enumerate sum values
      if last_value==sum_value: duplicates+=1
      last_value=sum_value
      totalsets+=ways_to_sum(sum_value,0) # faster,uses monotonicity of values
   return totalsets-len(values)+duplicates

def ways_to_sum(sum,member_index):
   value=values[member_index]
   if sum<value:
      return 0
   if sum>value:
      return ways_to_sum(sum-value,member_index+1)+ways_to_sum(sum,member_index+1)
   return 1
我得到的最终计数是179。(与其他海报的结果匹配。) 编辑:Ways_to_sum可以使用尾递归循环部分实现:
def ways_to_sum(sum,member_index):
   c=0
   while True:
      value=values[member_index]
      if sum<value: return c
      if sum==value: return c+1
      member_index+=1
      c+=ways_to_sum(sum-value,member_index)
运行这需要.005804秒:-}同样的答案。     ,        运行时间不到5毫秒(python)。它使用了动态编程的一种变体,即动态递归。
go
函数计算前
p+1
个元素的子集数量,总计为
target
。由于列表已排序,因此足以对每个元素调用一次函数(如
target
)并将结果相加:
startTime = datetime.now()
li = [3,99]
memo = {}
def go(p,target):
    if (p,target) not in memo:
        if p == 0:
            if target == li[0]:
                memo[(p,target)] = 1
            else:
                memo[(p,target)] = 0
        else:
            c = 0       
            if li[p] == target: c = 1
            elif li[p] < target: c = go(p-1,target-li[p])
            c += go(p-1,target)
            memo[(p,target)] = c
    return memo[(p,target)]

ans = 0
for p in range(1,len(li)):
    ans += go(p-1,li[p])

print(ans)
print(datetime.now()-startTime)
    ,        这有效
public class A {

  static int[] a = {3,99};

  public static void main(String[] args) {
    List<Integer> b = new ArrayList<Integer>();

    int count = 0;
    for (int i = 0; i < a.length; i++) {
        System.out.println(b);
        for (Integer t:b) {
        if(a[i]==t)
        {
        System.out.println(a[i]);
            count++;
            }
        }

        int size = b.size();
        for (int j = 0; j < size; j++) {
        if(b.get(j) + a[i] <=99)
            b.add(b.get(j) + a[i]);
        }
            b.add(a[i]);
    }

    System.out.println(count);

  }
}
伪代码(有解释): 存储以下变量 i。)到现在为止\'count \'个子集 ii。)包含所有可能子集的和的数组b 2.反复遍历数组(例如a)。对于每个元素a [i] i。)遍历数组b并计算a [i]的出现次数。将此添加到\'count \' ii。)遍历数组b,并对每个元素b [j] .add(a [i] + b [j])添加到b,因为这是一个可能的子集和。 (如果a中的a [i] + b [j]> max元素,则可以忽略添加) iii。)在b中添加a [i]。 3.u有计数:)     ,        我在Java中使用了组合生成器类,可以在这里找到: http://www.merriampark.com/comb.htm 遍历组合并查找有效子集用了不到一秒钟的时间。 (我认为使用外部代码不符合挑战,但我也没有适用。)     ,        
public class Solution {

   public static void main(String arg[]) {
    int[] array = { 3,99 };
    int N = array.length;
    System.out.println(N);
    int count = 0;
    for (int i = 1; i < 1 << N; i++) {
        int sum = 0;
        int max = 0;
        for (int j = 0; j < N; j++) {
        if (((i >> j) & 1) == 1) {
            sum += array[j];
            max = array[j];
        }
        }
        if (sum == 2 * max)
        count++;
    }
    System.out.println(count);
    }

    public static boolean isP(int N) {
    for (int i = 3; i <= (int) Math.sqrt(1.0 * N); i++) {
        if (N % i == 0) {
        System.out.println(i);
        // return false;
        }
    }
    return true;
    }
}
希望对您有所帮助,但不要只复制和粘贴。     ,我不想打死人,但是这里发布的大多数解决方案都错过了优化的关键机会,因此执行时间要长6倍。 与其遍历输入数组并搜索与每个值匹配的和,不如只计算一次所有可能的RELEVANT和,然后查看那些和中的哪一个出现在原始输入数组中,效率要高得多。 (“相关”总和是任何子集总和<=数组中的最大值。) 第二种方法的运行速度大约提高了6倍-通常是毫秒而不是毫秒-仅仅是因为它调用递归求和函数的次数大约是其1/6倍! 这种方法的代码和完整的解释可以在以下github存储库中找到(它在PHP中,因为这是给我这个挑战的人所要求的): https://github.com/misterrobinson/greplinsubsets