排序算法问题 已知两个已经排好序的数组, 怎样快速找到这两组数的中位数?
2011-09-23
展开全部
这个比较不好讲清楚,先假设 A 和 B 都是升序的。
这个问题的关键在于给定 k,怎样找到 A 和 B 合并后的第 k 大元素。我们可以这样做:
1. 把 A 平均分为前后两个部分,前部分有 x 个元素,后部分有 n1-x 个元素(由于 A 是有序的,所以后一部分的所有元素大于前一部分)。A[x] = A的后一部分的第一个元素。
2. 同理把 B 也平均分成前后两个部分,前部分有 y 个元素,后部分有 n2-y 个元素。B[y] = B的后一部分的第一个元素。
3. 由于两个数组都是被平均分割的,所以可以近似地认为 x = n1/2, y = n2/2。
这里不妨设 A[x] <= B[y](如果 A[x] > B[y] 处理过程和下面类似):
=============================== 情况1 ============================
由于在 A 中,A[x] 前面有 x 个元素,在 B 中,B[y] 前面有 y 个元素,并且又有 A[x] <= B[y],那么,合并以后,A[x]前面原来那些元素必然也在B[y]前面,也就是说,B[y]前面至少会有 x + y 个元素,我们再规定如果 A, B 中有相同元素,则合并后 A 中的元素排在 B 前面,那么归并以后 A[x] 也会排在 B[y] 前面,于是乎合并之后 B[y] 至少有 x+y+1 个元素。
如果 k <= x+y+1,也就是说,合并后第 k 大的元素必然落在 B[y] 前面。所以,原来在 B 数组中,第二部分(B[y]以及 B[y] 之后)那些元素都不可能包含我们要找到内容(第 k 大元素),所以我们可以把他们排除掉。这样就排除了 B 中一半的内容。
=============================== 情况2 ============================
在 A 中,A[x] 及其后面有 n1-x 个元素,除去 A[x] 之后有 n1-x-1 个元素,B[y] 及其后面有 n2-y 个元素。那么,由于 A[x] <= B[y],所以合并起来之后,B[y] 后面那些元素必然也在 A[x] 后面,则合并后 A[x] 后面至少有 (n1-x-1) + (n2-y) = (n1+n2)-(x+y+1) 个元素。
如果 k > x+y+1,也就说,合并后第 k 大的元素必然落在 A[x] 后面。所以,原来在 A 数组中,第一部分(A[x]之前)以及 A[x] 都不可能包含我们要找的元素,所以我们可以把他们排除掉。这样就排除了 A 中一半的内容。
============================ 下面是总结 ===========================
综上所诉,对于 k <= x+y+1 还是 k > x+y+1 我们都提出了解决的方案,并且每种方案都能把 A 或者 B 的规模减小一半。减小了一半之后,我们将其作为一个新的问题继续使用上面的算法处理,直到 A 或者 B 减小到足够小:
1. A没有了,这样只需要找出 B 中第 k 大的元素,也就是 B[k].
2. B没有了,同上结果就是 A[k].
达到以上两个条件的任意一个分别只需要 O(logn1) 和 O(logn2) 的时间,所以最坏情况下这个算法只需要 O(logn1 + logn2) 就能得出结果。
============================ 下面是程序 ===========================
以下是基于这个算法的程序,具体实现是在 element_at 这个函数中,通过调用 element_at(0, n1-1, 0, n2-1, k) 可返回 A, B 数组合并后第 k 大的元素。
#include <stdio.h>
int n1, n2;
int A[1000];
int B[1000];
int element_at(int l1, int r1, int l2, int r2, int k) {
int x = (l1 + r1) / 2, y = (l2 + r2) / 2;
if (l1 > r1) return B[l2+k-1];
if (l2 > r2) return A[l1+k-1];
if (A[x] <= B[y]) {
if (k <= (x - l1) + (y - l2) + 1) {
return element_at(l1, r1, l2, y-1, k);
} else {
return element_at(x+1, r1, l2, r2, k-(x-l1)-1);
}
} else {
if (k <= (x - l1) + (y - l2) + 1) {
return element_at(l1, x-1, l2, r2, k);
} else {
return element_at(l1, r1, y+1, r2, k-(y-l2)-1);
}
}
return 0;
}
int main() {
int i;
printf("请输入A的大小:");
scanf("%d", &n1);
printf("请输入%d个数,以空格隔开:",n1);
for (i = 0; i < n1; i++) scanf("%d", &A[i]);
printf("请输入B的大小:");
scanf("%d", &n2);
printf("请输入%d个数,以空格隔开:",n2);
for (i = 0; i < n2; i++) scanf("%d", &B[i]);
if ((n1 + n2) & 1) {
printf("中位数是:%d\n", element_at(0, n1-1, 0, n2-1, (n1+n2)/2+1));
} else {
printf("中位数是:%lf\n", (element_at(0, n1-1, 0, n2-1, (n1+n2)/2) + element_at(0, n1-1, 0, n2-1, (n1+n2)/2+1)) / 2.0);
}
return 0;
}
这个问题的关键在于给定 k,怎样找到 A 和 B 合并后的第 k 大元素。我们可以这样做:
1. 把 A 平均分为前后两个部分,前部分有 x 个元素,后部分有 n1-x 个元素(由于 A 是有序的,所以后一部分的所有元素大于前一部分)。A[x] = A的后一部分的第一个元素。
2. 同理把 B 也平均分成前后两个部分,前部分有 y 个元素,后部分有 n2-y 个元素。B[y] = B的后一部分的第一个元素。
3. 由于两个数组都是被平均分割的,所以可以近似地认为 x = n1/2, y = n2/2。
这里不妨设 A[x] <= B[y](如果 A[x] > B[y] 处理过程和下面类似):
=============================== 情况1 ============================
由于在 A 中,A[x] 前面有 x 个元素,在 B 中,B[y] 前面有 y 个元素,并且又有 A[x] <= B[y],那么,合并以后,A[x]前面原来那些元素必然也在B[y]前面,也就是说,B[y]前面至少会有 x + y 个元素,我们再规定如果 A, B 中有相同元素,则合并后 A 中的元素排在 B 前面,那么归并以后 A[x] 也会排在 B[y] 前面,于是乎合并之后 B[y] 至少有 x+y+1 个元素。
如果 k <= x+y+1,也就是说,合并后第 k 大的元素必然落在 B[y] 前面。所以,原来在 B 数组中,第二部分(B[y]以及 B[y] 之后)那些元素都不可能包含我们要找到内容(第 k 大元素),所以我们可以把他们排除掉。这样就排除了 B 中一半的内容。
=============================== 情况2 ============================
在 A 中,A[x] 及其后面有 n1-x 个元素,除去 A[x] 之后有 n1-x-1 个元素,B[y] 及其后面有 n2-y 个元素。那么,由于 A[x] <= B[y],所以合并起来之后,B[y] 后面那些元素必然也在 A[x] 后面,则合并后 A[x] 后面至少有 (n1-x-1) + (n2-y) = (n1+n2)-(x+y+1) 个元素。
如果 k > x+y+1,也就说,合并后第 k 大的元素必然落在 A[x] 后面。所以,原来在 A 数组中,第一部分(A[x]之前)以及 A[x] 都不可能包含我们要找的元素,所以我们可以把他们排除掉。这样就排除了 A 中一半的内容。
============================ 下面是总结 ===========================
综上所诉,对于 k <= x+y+1 还是 k > x+y+1 我们都提出了解决的方案,并且每种方案都能把 A 或者 B 的规模减小一半。减小了一半之后,我们将其作为一个新的问题继续使用上面的算法处理,直到 A 或者 B 减小到足够小:
1. A没有了,这样只需要找出 B 中第 k 大的元素,也就是 B[k].
2. B没有了,同上结果就是 A[k].
达到以上两个条件的任意一个分别只需要 O(logn1) 和 O(logn2) 的时间,所以最坏情况下这个算法只需要 O(logn1 + logn2) 就能得出结果。
============================ 下面是程序 ===========================
以下是基于这个算法的程序,具体实现是在 element_at 这个函数中,通过调用 element_at(0, n1-1, 0, n2-1, k) 可返回 A, B 数组合并后第 k 大的元素。
#include <stdio.h>
int n1, n2;
int A[1000];
int B[1000];
int element_at(int l1, int r1, int l2, int r2, int k) {
int x = (l1 + r1) / 2, y = (l2 + r2) / 2;
if (l1 > r1) return B[l2+k-1];
if (l2 > r2) return A[l1+k-1];
if (A[x] <= B[y]) {
if (k <= (x - l1) + (y - l2) + 1) {
return element_at(l1, r1, l2, y-1, k);
} else {
return element_at(x+1, r1, l2, r2, k-(x-l1)-1);
}
} else {
if (k <= (x - l1) + (y - l2) + 1) {
return element_at(l1, x-1, l2, r2, k);
} else {
return element_at(l1, r1, y+1, r2, k-(y-l2)-1);
}
}
return 0;
}
int main() {
int i;
printf("请输入A的大小:");
scanf("%d", &n1);
printf("请输入%d个数,以空格隔开:",n1);
for (i = 0; i < n1; i++) scanf("%d", &A[i]);
printf("请输入B的大小:");
scanf("%d", &n2);
printf("请输入%d个数,以空格隔开:",n2);
for (i = 0; i < n2; i++) scanf("%d", &B[i]);
if ((n1 + n2) & 1) {
printf("中位数是:%d\n", element_at(0, n1-1, 0, n2-1, (n1+n2)/2+1));
} else {
printf("中位数是:%lf\n", (element_at(0, n1-1, 0, n2-1, (n1+n2)/2) + element_at(0, n1-1, 0, n2-1, (n1+n2)/2+1)) / 2.0);
}
return 0;
}
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询