最近在看了《数据结构与算法JavaScript描述》这本书,对大学里学的数据结构做了一次复习(其实差不多忘干净了,哈哈)。如果能将这些知识捡起来,融入到实际工作当中,估计编码水平将是一次质的飞跃。带着这个美好的愿望,开始学习吧O(∩_∩)O~~
我们知道在JS中,常常用来组织数据的无非是数组和对象(这些基础就不介绍了)。但在数据结构中,还有一些抽象的数据类型:列表、栈、队列、链表、字典、散列、集合、二叉树、图等,可以用来更好的对实际场景建模。当然这些数据类型,原生JS不支持,那么就需要通过封装来模拟,其底层还是数组和对象(被看穿喽~),接下来我们挨个来解析吧
一、列表
定义:列表是一组有序的数据,每个列表中的数据项称为元素。元素可以是任意数据类型, 也不事先限定元素个数。
生活中经常使用到列表,通讯录、购物车、十佳榜单等。当不需要在一个很长的序列中查找元素或排序可以使用列表。
列表的封装代码:
function List() {//列表的构造函数
this._dataStore = []; //初始化一个空数组来保存列表元素
this._pos = 0;//当前的位置
}
List.prototype={
constructor:List,
clear:function(){//清空列表
delete this._dataStore;
this._dataStore = []; this._pos = 0;
},
find:function(element){//在列表中查找某一元素,若有返回位置,否则返回-1
for (var i = 0; i < this._dataStore.length; ++i) {
if (this._dataStore[i] === element) {return i;}
};return -1;
},
contains:function(element){//判断给定值是否在列表中
for (var i = 0; i < this._dataStore.length; ++i) {
if (this._dataStore[i] === element) {return true; break;}
};return false;
},
insert:function(element, after){//当前位置插入新元素
var insert_pos = this.find(after);
if (insert_pos > -1) {this._dataStore.splice(insert_pos+1, 0, element);return true;};
return false;
},
append:function(element){this._dataStore[this._dataStore.length] = element;},//末尾添加新元素
remove:function(element){//删除元素
var foundAt = this.find(element);
if (foundAt > -1) {this._dataStore.splice(foundAt,1);return true;};
return false;
},
front:function(){this._pos = 0;},//将当前位置指针设为表首
end:function(){this._pos = this._dataStore.length-1;},//将当前位置指针设为表尾
prev:function(){if (this._pos > 0) {--this._pos;}},//当前位置上移指针
next:function(){if (this._pos < this._dataStore.length-1) {++this._pos;}},//当前位置下移指针
moveTo:function(_position){this._pos = _position;},//移动当前位置指针到指定位置
length:function(){return this._dataStore.length;},//获取列表的中元素的个数
curr_pos:function(){return this._pos;},//返回当前位置指针
getElement:function(){return this._dataStore[this._pos];},//返回当前位置的列表项
toString:function(){return this._dataStore;}//返回列表的字符串形式
}
列表与数组比较类似,只是简单的对数组做了二次封装,用案例来展示一下列表的使用场景,进一步加深理解。
案例:影碟租赁自助查询系统
var moviearr=['肖申克的救赎','教父','教父 2','低俗小说','黄金三镖客','十二怒汉','辛德勒名单','黑暗骑士','指环王:王者归来','搏击俱乐部','星球大战5:帝国反击战','飞越疯人院','指环王:护戒使者','盗梦空间','好家伙','星球大战','七武士','黑客帝国','阿甘正传','上帝之城']//数据
var movieList = new List();//电影列表
for (var i = 0; i < moviearr.length; ++i) {movieList.append(moviearr[i]);}//将数据添加到‘电影列表’
var customerList = new List();//客户列表
function Customer(name, movie) {//客户租赁对象的构造函数
this.name = name;
this.movie = movie;
}
function checkOut(name, movie, movieList, customerList) {//某客户需要租赁某电影,同时维护两个列表
if(movieList.contains(movie)){//若检索电影在列表中,新建客户对象添加到客户列表,同时在电影列表中删除该电影
var c = new Customer(name, movie);
customerList.append(c);
movieList.remove(movie);
}else{console.log(movie + " is not available.");}//若不在电影列表中,则提示不可租赁
//打印维护后的两个列表
console.log('movieList:'+movieList.toString()+'\n customerList:'+JSON.stringify(customerList.toString()))
}
checkOut('gavin','黑客帝国',movieList,customerList)
checkOut('gavin','星球大战',movieList,customerList)
checkOut('zoe','辛德勒名单',movieList,customerList)
checkOut('gulei','黑客帝国',movieList,customerList)
二、栈
定义:栈是一种特殊的列表, 栈内的元素只能通过列表的一端访问, 这一端称为栈顶。
栈是一种后入先出( LIFO, last-in-first-out) 的数据结构,任何不在栈顶的元素都无法访问。 为了得到栈底的元素, 必须先拿掉上面的元素。生活中常见的例子如:餐厅的一摞盘子,只能从上面逐个取,洗净的盘子也只能摞在最上面。
栈的封装代码:
function Stack() {//栈的构造函数
this._dataStore = [];//初始化一个空数组来保存列表元素
this._top = 0;//记录栈顶的位置
}
Stack.prototype={
constructor:Stack,
clear:function(){//清空栈
delete this._dataStore;
this._dataStore = []; this._top = 0;
},
push:function(element){this._dataStore[this._top++] = element;},//向栈内添加元素
pop:function(){return this._dataStore[--this._top];},//从栈内取出元素
peek:function(){return this._dataStore[this._top-1]},//查看栈顶元素
length:function(){return this._top;}//获取列表的中元素的个数
}
相对列表来说,栈的方法不多显得很简洁,同样来几个案例,帮助理解栈的使用场景
案例一:回文
function isPalindrome(word){
var s = new Stack();
for (var i = 0; i < word.length; ++i) {s.push(word[i]);}
var rword = "";
while (s.length() > 0) {rword += s.pop();}
if (word == rword) {return true;}else {return false;}
}
console.log(isPalindrome("hello"));//false
console.log(isPalindrome("racecar"));//true
案例二:递归演示
function factorial(n) {
if (n === 0) {return 1;}else {return n * factorial(n-1);}
}
function fact(n) {
var s = new Stack();
while (n > 1) {s.push(n--);}
var product = 1;
while (s.length() > 0) {product *= s.pop();}
return product;
}
console.log(factorial(5))//120
console.log(fact(5))//120
三、队列
定义:列队也是一种特殊的列表, 不同的是队列只能在队尾插入元素, 在队首删除元素。
列队是一种先进先出( First-In-First-Out, FIFO)的数据结构。排在前面的优先处理,后面的依次排队,直到轮到它。生活中常见的例子如:打印任务池,模拟柜台排队的顾客等。
队列的封装代码:
function Queue() {//队列的构造函数
this._dataStore = [];//初始化一个空数组来保存元素
}
Queue.prototype={
constructor:Queue,
clear:function(){//清空队列
delete this._dataStore;
this._dataStore = []; this._top = 0;
},
enqueue:function(element){this._dataStore.push(element)},//向队尾添加一个元素
dequeue:function(){return this._dataStore.shift();},//删除队首元素
front:function(){return this._dataStore[0];},//读取队首元素
back:function(){return this._dataStore[this._dataStore.length-1];},//读取队尾元素
empty:function(){if(this._dataStore.length === 0){return true;}else{return false;}},//判断队列是否为空
toString:function(){//将队列元素拼接字符串
var retStr = "";
for (var i = 0; i < this._dataStore.length; ++i) {retStr += this._dataStore[i] + ",";}
return retStr;
}
}
列队比栈稍微复杂一点,总体来说也是比较容易理解的。
案例:舞伴分配
function Dancer(name, sex) {
this.name = name;
this.sex = sex;
}
function getDancers(males, females) {
var names = ['F Allison McMillan','M Frank Opitz','M Mason McMillan','M Clayton Ruff','F Cheryl Ferenback','M Raymond Williams','F Jennifer Ingram','M Bryan Frazer','M David Durr','M Danny Martin','F Aurora Adney'];
for(var i = 0; i < names.length; ++i) {
var dancer = names[i].split(" ");
var sex = dancer[0];
var name = dancer[1];
if (sex == "F") {females.enqueue(new Dancer(name, sex));
} else {males.enqueue(new Dancer(name, sex));}
}
}
function dance(males, females) {
console.log("The dance partners are: \n");
while (!females.empty() && !males.empty()) {
var person1 = females.dequeue();
var person2 = males.dequeue();
console.log("Female dancer is: " + person1.name+" and the male dancer is: " + person2.name);
}
}
var maleDancers = new Queue();
var femaleDancers = new Queue();
getDancers(maleDancers, femaleDancers);
dance(maleDancers, femaleDancers);
if (!femaleDancers.empty()) {console.log(femaleDancers.front().name + " is waiting to dance.");}
if (!maleDancers.empty()) {console.log(maleDancers.front().name + " is waiting to dance.");}
在一般情况下,从列表中删除元素是优先删除先入队的元素,但有时候也可能需要使用一种优先队列的数据来模拟,比如医院的急诊,主要通过给队列中每个元素添加一个优先级别,并改写dequeue方法实现。
dequeue:function() {
var priority = this._dataStore[0].code;//code表示优先级别,数值越小优先级越高
for (var i = 1; i < this._dataStore.length; ++i) {priority =Math.min(priority,i);}
return this.dataStore.splice(priority,1);
}
四、链表
定义:链表是由一组节点组成的集合,每个节点都使用一个对象的引用指向下一个节点,这个引用叫做链。
除了对数据的随机访问,链表几乎可以代替一维数组。它与数组的主要区别是:数组的元素靠位置进行引用,链表靠相互指向进行引用。
链表的封装代码:
function Node(element) {//链表中节点的构造函数
this.element = element;
this.next = null;
}
function LList() {//链表的构造函数
this.head = new Node("head");
}
LList.prototype={
constructor:LList,
find:function(item){//查找链表,如果找到则返回该节点,否者返回头节点
var currNode = this.head;
while (currNode.element != item) {currNode = currNode.next;}
return currNode;
},
insert:function(newElement, item){//在找到的节点后,新增一个节点
var newNode = new Node(newElement);//新增节点
var current = this.find(item);//查找节点
newNode.next = current.next;//先将当前节点的next赋值给新节点的next
current.next = newNode;//再将当前节点的next设置为新节点
},
display:function(){
var currNode = this.head;
while (currNode.next!==null){console.log(currNode.next.element);currNode = currNode.next; }
},
findPrev:function(item){//查找链表,返回当前节点的上一个节点
var currNode = this.head;
while (currNode.next!==null && currNode.next.element!==item){ currNode = currNode.next; }
return currNode;
},
remove:function(item){//在链表中删除给定的节点
var prevNode = this.findPrev(item);
if (prevNode.next !== null) { prevNode.next = prevNode.next.next;}
}
}
跟之前的三种数据结构不同,链表没有采用数组作为底层数据存储。而是采用对象节点作为基础,同时每个节点中都含有一个next属性指向另一个对象,与优先队列的中的优先级别code颇为类似。总体来看链表是通过每个节点的next属性,将散列的对象连接到了一起。
如上我们只是实现了单向链表,从头遍历到尾很简单,想要反过来遍历就没那么容易了。我们可以通过给节点增加一个prev属性,指向它的前一个节点,也能实现双向链表。当然,双向链表在新增和删除节点时的操作也要复杂一些,需要同时修改前后节点的next或prev属性。
另外,我们还可以让单向链表的尾节点指向首节点,这样就变成了循环列表。这样需要对链表的一些方法进行改造,防止遍历链表时出现无限循环。
五、字典
定义:字典是一种以键值对形式存储的数据结构。
JS中对象就是以字典的形式设计的,但字典的基础是数组,而不是对象。这样可以进行排序,况且JS中一切皆对象,数组也不例外。
字典的封装代码:
function Dictionary() {//字典的构造函数
this._datastore = new Array();
}
Dictionary.prototype={
constructor:Dictionary,
add:function(key,value){ this._datastore[key]=value; },//增加一条键值对
find:function(key){ return this._datastore[key] },//查找指定key,返回对应value的值
remove:function(key){ delete this._datastore[key] },//删除指定key的键值对
showAll:function(){ //打印字典的所有键值对
//若需排序可以给Object.keys(this._datastore)数组追加sort方法
Object.keys(this._datastore).forEach(function(key){console.log(key+" -> "+this._datastore[key]);}.bind(this))
},
count:function(){//返回字典所含键值对数量
var n = 0;
for(var key in this._datastore) {++n;}
return n;
},
clear:function(){ //清空字典
Object.keys(this._datastore).forEach(function(key){ delete this._datastore[key];}.bind(this))
}
}
字典依然采用数组作为底层数据存储,但是与普通按序号索引的数组不同,它只能以key进行查询。
六、散列
定义:散列是一种常用的数据存储技术, 散列后的数据可以快速地插入或取用。 散列使用的数据结构叫做散列表。
是通过一个散列函数(Hash,哈希)将键映射为一个范围是 0 到散列表长度的数字。
散列的封装代码:
function HashTable() {//散列的构造函数
this._table = new Array(137);//数组的长度应该为质数,即预算散列表的长度
}
HashTable.prototype={
constructor:HashTable,
simpleHash:function(data){//简单的散列函数(返回键字符串的ASCII累加除数组长度的余数)
var total = 0;
for (var i = 0; i < data.length; ++i) {total += data.charCodeAt(i);}
return total % this._table.length;
},
betterHash:function(data){//更好的散列函数算法,减少碰撞
const H = 37;
var total = 0;
for (var i = 0; i < data.length; ++i) {total += H * total + data.charCodeAt(i);}
total = total % this._table.length;
if (total < 0) {total += this._table.length-1;}
return parseInt(total);
},
put:function(data){var pos = this.simpleHash(data);this._table[pos] = data;},//使用简单散列函数
//put:function(key,data){var pos = this.betterHash(key);this._table[pos] = data;},//使用高级散列函数
showDistro:function(){//显示散列表中的数据
var n = 0;
for (var i = 0; i < this._table.length; ++i) {
if (this._table[i] !== undefined) {console.log(i + ": " + this._table[i]);}
}
},
get:function(key){return this._table[this.betterHash(key)];},
}
散列其实是通过一种机制(散列函数),将数据存储到散列表对应的位置上去,当机制跟内容相关时仅出现修改才会改变。(MD5类似散列函数的机制)
当散列函数对于多个输入产生同样的输出时称为碰撞。开链法(用数组存储多个相同输出)和探测法(线性探测下个位置,直到有空值存入)
案列:数据存储
var students = ["David", "Jennifer", "Donnie", "Raymond", "Cynthia", "Mike", "Clayton", "Danny", "Jonathan"];
var hTable = new HashTable();
for (var i = 0; i < students.length; ++i) {hTable.put(students[i]);}
hTable.showDistro();//九条数据,被散列成八条,产生于了一个碰撞
七、集合
定义:是一种不含不同元素的数据结构,这些元素是无序且不重复的。
集合的封装代码:
function Set() {//集合的构造函数
this._dataStore = [];
}
Set.prototype={
constructor:Set,
add:function(data){//向集合中添加元素
if (this._dataStore.indexOf(data) < 0) {this._dataStore.push(data);return true;
} else {return false;}
},
remove:function(data){//从集合中移除元素
var pos = this._dataStore.indexOf(data);
if (pos > -1) {this._dataStore.splice(pos,1);return true;
} else {return false;}
},
contains:function(){//检查一个元素是否在集合中
if (this._dataStore.indexOf(data) > -1) {return true;} else {return false;}
},
size:function(){return this._dataStore.length},//返回集合的长度
union:function(set){//返回与另一个集合的并集
var tempSet = new Set();
for (var i = 0; i < this._dataStore.length; ++i) {tempSet.add(this._dataStore[i]);}
for (var i = 0; i < set.dataStore.length; ++i) {
if (!tempSet.contains(set.dataStore[i])) {tempSet.dataStore.push(set.dataStore[i]);}
}
return tempSet;
},
intersect:function(set){//返回与另一个集合的交集
var tempSet = new Set();
for (var i = 0; i < this._dataStore.length; ++i) {
if (set.contains(this._dataStore[i])) {tempSet.add(this._dataStore[i]);}
}
return tempSet;
},
subset:function(set){//判断集合是否其他集合的子集
if (this.size() > set.size()) {return false;
} else {
this._dataStore.foreach(function(member){if (!set.contains(member)) {return false;}})
}
return true;
},
difference:function(set){//返回与另一个集合的补集
var tempSet = new Set();
for (var i = 0; i < this._dataStore.length; ++i) {
if (!set.contains(this._dataStore[i])) {tempSet.add(this._dataStore[i]);}
}
return tempSet;
},
show:function(){return this._dataStore;},//显示集合中的元素
}
集合的数据结构比较简单,主要实现了添加元素时检查唯一性,以及交集、并集、补集的方法和子集的检查。
八、二叉树和二叉查找树
定义:树由一组以边连接的节点组成,二叉树是子节点不超过两个的特殊树。
二叉树的封装代码:
function Node2(data, left, right) {//二叉树中节点的构造函数
this.data = data;
this.left = left;
this.right = right;
this.show = function(){return this.data;};
}
function BST(){//二叉查找树的构造函数
this.root = null;
}
BST.prototype={
constructor:BST,
insert:function(data){//插入节点
var n = new Node2(data, null, null);
if (this.root == null) {
this.root = n;
} else {
var current = this.root;
var parent;
while (true) {
parent = current;
if (data < current.data) {
current = current.left;if (current == null) {parent.left = n;break;}
} else {
current = current.right;if (current == null) {parent.right = n;break;}
}
}
}
},
inOrder:function(node){
if (!(node == null)) {
this.inOrder(node.left);
console.log(node.show() + " ");
this.inOrder(node.right);
}
},
getMin:function(){//获取最小的数,即最左节点
var current = this.root;
while (!(current.left == null)) {current = current.left;}
return current.data;
},
getMax:function(){//获取最大的数,即最右节点
var current = this.root;
while (!(current.right == null)) {current = current.right;}
return current.data;
},
find:function(data){//查找指定的值
var current = this.root;
while (current != null) {
if (current.data == data) {return current;
} else if (data < current.data) {current = current.left;
} else {current = current.right;}
}
return null;
},
remove:function(data){ root = this.removeNode(this.root, data);},//调用removeNode删除节点
removeNode:function(node,data){ //删除节点
if (node == null) {return null;}
if (data == node.data) {
if (node.left == null && node.right == null) {return null;} // 没有子节点的节点
if (node.left == null) {return node.right;} // 没有左子节点的节点
if (node.right == null) {return node.left;} // 没有右子节点的节点
// 有两个子节点的节点
var tempNode = getSmallest(node.right);
node.data = tempNode.data;
node.right = removeNode(node.right, tempNode.data);
return node;
} else if (data < node.data) {
node.left = removeNode(node.left, data);
return node;
} else {
node.right = removeNode(node.right, data);
return node;
}
}
}
二叉树有点类似链表的数据结构,采用节点的左右属性来指向两个子节点。
九、图和图算法
定义:图是由边的集合即顶点的集合组成的。常用于地图和航班等信息数据的建模。
图的封装代码:
function Graph(v) {//图的构造函数,v表示顶点的数量
this.vertices = v;
this.edges = 0;
this.adj = [];
for (var i = 0; i < this.vertices; ++i) {
this.adj[i] = [];
this.adj[i].push("");
}
this.marked = [];//遍历标志位
for (var i = 0; i < this.vertices; ++i) {this.marked[i] = false;}
this.edgeTo = [];//路径查找时,存储两个顶点之间的边
}
Graph.prototype={
constructor:Graph,
addEdge:function(v,w){//增加一条从顶点v到顶点w的边
this.adj[v].push(w);
this.adj[w].push(v);
this.edges++;
},
showGraph:function(){var p='';//显示当前图的结构
for (var i = 0; i < this.vertices; ++i) { p+='顶点'+i+' ->';
for (var j = 0; j < this.vertices; ++j) {
if (this.adj[i][j] !== undefined){ p+=this.adj[i][j]+' ';}
};p+='\n';
}console.log(p)
},
dfs:function(v){//深度优先搜索
this.marked[v] = true;
if (this.adj[v] !== undefined) {console.log("深度优先: " + v);}
for(var w in this.adj[v]) {
if(!this.marked[this.adj[v][w]]){this.dfs(this.adj[v][w]);}
}
},
bfs:function(s){//广度优先搜索
var queue = [];
this.marked[s] = true;
queue.push(s); // 添加到队尾
while (queue.length > 0) {
var v = queue.shift(); // 从队首移除
if (v!==''&&v !== undefined) {console.log("广度优先: " + v);}
for(var w in this.adj[v]) {
if (!this.marked[this.adj[v][w]]) {
this.marked[this.adj[v][w]] = true;
this.edgeTo[this.adj[v][w]] = v;
queue.push(this.adj[v][w]);
}
}
}
},
pathTo:function(v){//获取最短路径,即顶点v到顶点0的边(必须先广度搜索生成edgeTo)
var source = 0;
if (!this.marked[v]) {return undefined;}
var path = [];
for (var i = v; i != source; i = this.edgeTo[i]) {path.push(i);}
path.push(source);
return path;
}
}
在对图数据模型进行搜索时,有深度优先和广度优先两种。当进行最短路径查找时,就是广度优先搜索的过程。