前言
在一个条件或者单个属性上进行排序非常简单, Swift 本身就有相关的功能。
下面是对 int 数组进行排序的例子:
let numbers = [3, 5, 6, 1, 8, 2]
let sortedNumbers = numbers.sorted { (lhs, rhs) in
return lhs < rhs
}
// [1, 2, 3, 5, 6, 8]
但有时我们需要根据多个条件或属性来进行排序。为了演示这一点,我们创建一个结构体来作为示例。
这里我们有一个简单的 BlogPost
结构体,它包含帖子标题和两个统计数据,即浏览次数pageView
和会话持续时间sessionDuration
。
struct BlogPost {
let title: String
let pageView: Int
let sessionDuration: Double
}
Sample 数据:
extension BlogPost {
static var examples: [BlogPost] = [
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1),
BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10)
]
}
如果您想查看哪些文章表现良好,可以按照浏览次数对它们直接进行排序。但是很多帖子都不那么流行,页面浏览量也一样。在这种情况下,需要根据另一个条件或属性来进行进一步的排序。
我们将在本文中讨论这种多属性排序。他们有各种各样的方法来解决这个问题。我将展示没有任何复杂概念的最基本的方法。一旦你了解了基本原理,你就可以随心所欲地进阶了。
什么是多条件排序
多条件排序是指我们比较第一个条件的排序,只有当第一个条件相等时,我们才转到下一个条件。我们这样做直到找到一个不相等的条件。
伪代码如下所示:
let sortedObjects = objects.sorted { (lhs, rhs) in
for (lhsCriteria, rhsCriteria) in [(lhsCrtria1, rhsCriteria1), (lhsCrtria2, rhsCriteria2), (lhsCrtria3, rhsCriteria3), ... , (lhsCrtriaN, rhsCriteriaN)] { // <1>
if lhsCriteria == rhsCriteria { // <2>
continue
}
return lhsCriteria < rhsCriteria // <3>
}
}
<1> 我们从最重要的一个(也就是第一个)开始,循环遍历条件列表。
<2> 如果这个顺序条件相等,我们不能根据它来决定顺序,就跳到下一个条件。
<3> 如果我们可以根据条件决定两个对象之间的顺序,我们就停止并返回结果。
如果你很难理解伪代码,不用担心。我不是一个伪代码专业作家。下面的例子应该更清楚一点。
按照两个字段对object数组进行排序
我们使用前面提到的场景,我们希望根据表现对BlogPost
进行排序。
我们的表现取决于页面浏览次数pageView
,如果浏览次数相同,我们再看sessionDuration
。
下面是上一个例子中用到的BlogPost
结构体和对应的sample数据
。
struct BlogPost {
let title: String
let pageView: Int
let sessionDuration: Double
}
extension BlogPost {
static var examples: [BlogPost] = [
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1),
BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10)
]
}
我们衡量表现的方法可以翻译成下面这样的代码:
let popularPosts = BlogPost.examples.sorted { (lhs, rhs) in if lhs.pageView == rhs.pageView { // <1> return lhs.sessionDuration > rhs.sessionDuration }
return lhs.pageView > rhs.pageView // <2>
}
<1>如果博客文章有相同的访问次数,我们使用访问时间。
<2>如果访问次数不相等,我们可以直接根据访问次数来排序(我们使用降序)
排序的结果:
[BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2.0),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10.0),
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3.0),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2.0),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1.0)]
按照多个字段对object数组进行排序
不难发现,根据两个条件来排序非常简单。让我们引入更多的条件。如果博客文章的表现相同,我们按照title
排序。
添加更多的sample数据:
extension BlogPost {
static var examples2: [BlogPost] = [
BlogPost(title: "Zoo", pageView: 5, sessionDuration: 2),
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1),
BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10),
BlogPost(title: "Angero", pageView: 1, sessionDuration: 2)
]
}
两个条件和三个条件没什么区别,我们可以沿用相同的逻辑:
let popularPosts = BlogPost.examples2.sorted { (lhs, rhs) in
if lhs.pageView == rhs.pageView {
if lhs.sessionDuration == rhs.sessionDuration { // <1>
return lhs.title < rhs.title
}
return lhs.sessionDuration > rhs.sessionDuration
}
return lhs.pageView > rhs.pageView
}
<1> 我们添加了另一个if来检查博客文章是否具有相同的会话持续时间,如果它们具有相同的页面浏览次数和会话持续时间,则按标题对它们进行排序。
排序结果:
[BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2.0),
BlogPost(title: "Zoo", pageView: 5, sessionDuration: 2.0),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10.0),
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3.0),
BlogPost(title: "Angero", pageView: 1, sessionDuration: 2.0),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2.0),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1.0)]
问题
我们可以对两个和三个条件使用相同的逻辑。这里唯一的问题是,条件越多,需要的嵌套就越多。
这是一个多条件的例子,可能会导致pyramid of doom
。
let popularPosts = BlogPost.examples2.sorted { (lhs, rhs) in
if lhs.pageView == rhs.pageView {
if lhs.sessionDuration == rhs.sessionDuration {
if lhs.nextCriteria == rhs.nextCriteria {
if lhs.nextCriteria == rhs.nextCriteria {
....
}
...
}
...
}
return lhs.sessionDuration > rhs.sessionDuration
}
return lhs.pageView > rhs.pageView
}
按照N个字段对object数组进行排序
为了避免 pyramid of doom
, 我们再看看之前的伪代码:
let sortedObjects = objects.sorted { (lhs, rhs) in
for (lhsCriteria, rhsCriteria) in [(lhsCrtria1, rhsCriteria1), (lhsCrtria2, rhsCriteria2), (lhsCrtria3, rhsCriteria3), ... , (lhsCrtriaN, rhsCriteriaN)] {
if lhsCriteria == rhsCriteria {
continue
}
return lhsCriteria < rhsCriteria
}
}
上面的代码不是解决类似问题的唯一方式,不过关键思路是相似的。关键思路就是把多个条件打包到一个集合当中去遍历。
extension BlogPost {
static var examples2: [BlogPost] = [
BlogPost(title: "Zoo", pageView: 5, sessionDuration: 2),
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1),
BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10),
BlogPost(title: "Angero", pageView: 1, sessionDuration: 2)
]
}
typealias AreInIncreasingOrder = (BlogPost, BlogPost) -> Bool // <1>
let popularPosts = BlogPost.examples2.sorted { (lhs, rhs) in
let predicates: [AreInIncreasingOrder] = [ // <2>
{ $0.pageView > $1.pageView },
{ $0.sessionDuration > $1.sessionDuration},
{ $0.title < $1.title }
]
for predicate in predicates { // <3>
if !predicate(lhs, rhs) && !predicate(rhs, lhs) { // <4>
continue // <5>
}
return predicate(lhs, rhs) // <5>
}
return false
}
<1>我声明了一个别名 AreInIncreasingOrder
用来匹配排序闭包,这提高了我们对谓词集合声明的可读性
<2> 我们声明了一个谓词集合
<3> 我们遍历这个谓词集合
<4> 这里是关键逻辑,我们想要检查条件是否能决定博文顺序。但是 AreInIncreasingOrder
返回了一个布尔值. 我们应该如何判断他们是否相等? 在回答这个问题之前,我们先检查一下 AreInIncreasingOrder
的定义。
AreInIncreasingOrder
是一个谓词,他会在第一个参数能决定顺序时返回 true
否则返回 false
。两个变量只有在各自都不是升序时才相等。
这意味着无论我们的参数顺序如何,谓词都必须是 false
。换言之 lhs.pageView < rhs.pageView
和 rhs.pageView < lhs.pageView
必须等于false
才能决定顺序相等。这就是我们 !predicate(lhs, rhs) && !predicate(rhs, lhs)
这句代码的意思。
<5> 如果顺序相等,那么 continue
到下一个谓词。
<6> 如果顺序不相等,那么我们可以用这个谓词来排序。
排序结果:
[BlogPost(title: "Akosua", pageView: 5, sessionDuration: 2.0),
BlogPost(title: "Zoo", pageView: 5, sessionDuration: 2.0),
BlogPost(title: "Abena", pageView: 4, sessionDuration: 10.0),
BlogPost(title: "Alice", pageView: 1, sessionDuration: 3.0),
BlogPost(title: "Angero", pageView: 1, sessionDuration: 2.0),
BlogPost(title: "Peter", pageView: 1, sessionDuration: 2.0),
BlogPost(title: "Kofi", pageView: 1, sessionDuration: 1.0)]
结语
最近,我遇到了这个问题,觉得很有趣。这是一项简单的任务,不过需要我花些时间去掌握。
本文中的方法与 Swift 没有强关联。你可以把它应用到任何语言上。您可以改进代码,使其更通用,以支持所需的任何对象或属性,我将此作为您的练习。如果你有什么有趣的发现,你可以在 Twitter 上和我分享你的结果。我很想看到你的实践。