题外话:这是前几年写的一篇文章,在知乎专栏和慕课网发表过,现在搬到自己的公众号来,作为算法专栏的第一篇文章~
最近看到的一道编程题目:
有一个数组,如1, -5, 8, 3, -4, 15, -8,查找其中连续和最大的相邻串的值。在本例中,最大值为8 + 3 + -4 + 15 = 22.
这道题最容易想到的算法就是暴力搜索:
下面看看go代码:
package main
import (
"fmt"
)
func maxSumOfSubArray(a []int) int {
// 初始化最大和为数组的第一个元素
maxSum := a[0]
n := len(a)
// 第 i 遍搜索从第 i 个元素开始往后搜索
for i := 0; i < n; i++ {
// sum用于记录从第 i 个元素到第 k 个元素的和,i <= k
sum := 0
for k := i; k < n; k++ {
sum += a[k]
if sum > maxSum {
//找到一个比之前找到的最大值更大的连续子序列和
maxSum = sum
}
}
}
return maxSum
}
func main() {
a := []int{1, -5, 8, 3, -4, 15, -8}
fmt.Println("max sum is:", maxSumOfSubArray(a))
}
这个算法简单粗暴易于理解,但效率不高,要找到最大连续子序列和一共需要n + (n - 1) + (n - 2) + ... + 1次访问数组元素,也就是时间复杂度是O(n*n)。那么有没有更好的算法呢?
我们来分析一下。
首先假设我们已经找到了最大连续和子串在数组中的起始位置(i)和结束位置(j),其中i <= j,即最大和maxSum = a[i] + a[i + 1] + ... + a[j],我们来看看这个子串有什么性质:
如果一时想不明白上面的第三条性质,可以用笔在纸上画画图帮助我们分析。根据第二三条性质,我们感觉 a[i - 1]是一个分界点,最大和的子串要么就在a[i - 1]元素之后,要么就在a[i - 1]之前,最大和的子串不可能跨过a[i - 1]这个点。读者可以仔细想一下这是为什么?还是可以用前面的反证法来思考。
下面举2个例子来看看:
第一个例子:假设数组为 1,-2, 3, 4,5,很容易发现-2这个元素满足前述的第2个和第3个性质:
所以-2是这样一个分界点,最大和的字串要么在-2之后要么在之前,-2之前的和是1,之后的和sum = 3 + 4 + 5 = 12,所以这个字串的最大和为12。
我们稍微改变一下数组的元素就可以看到最大和字串在分解点之前的情况:
第二个例子:假设数组为 100,-101, 3, 4,5,很容易发现-101这个元素满足前述的第二个和第三个性质:
所以-101是这样一个分界点,最大和的字串要么在-101之后要么在之前,-101之前的和是100,之后的和sum = 3 + 4 + 5 = 12,所以这个字串的最大和为100。
根据前面的分析我们可以得出结论:
假设对于数组a,我们找到了两个分界点a[i]和a[j],那么整个数组的最大字串和就是max(sum(a[0]...a[i-1]), sum(a[i+1]...a[j-1]), sum(a[j+1]...a[len-1]))。
那么怎么去找这个分界点呢?
我们从前面的第3个性质可以看出如果a[i-1]是分界点,那么a[0]到a[i - 1]之和必定为负数,所以我们就从a[0]开始逐个往后求和,为了便于描述我们把这个和记为sum,sum第一次变成负数时就是我们要找的分界点。可能您会说sum(a[0]...a[i-1])<0并不代表sum(a[m]...a[i-1])<0 (m < i -1)呀?看看找这个分界点的方法,我们是从第一个元素开始求和,分界点是当sum第一次变成负数时找到的元素,也就是说a[0]到a[m-1]之和必定大于0,记为sum1, a[m]到a[i-1]之和记为sum2, 于是有关系sum1 + sum2 = sum < 0 推出sum2 = sum - sum1 < 0.
分析到这里算法基本上就出来了,下面给出go代码:
func maxSumOfSubArray(a []int) int {
maxSum := a[0]
sum := a[0]
for i := 1; i < len(a); i++ {
sum += a[i]
if sum < 0 { // 分界点,重新求和
sum = 0
} else {
if sum > maxSum {
maxSum = sum // 记录最大和
}
}
}
return maxSum
}