前言:在上一篇文章中我们向大家介绍string中的一些核心接口的用法,我们学会了如何使用。那么本篇文章我们就来自己实现一个string,了解它的底层。 需要查看上一篇文章的请点击:string核心接口的使用
先声明一下:string的实现分成两个文件一个是声明文件,一个是是实现文件,本篇着重呈现各种接口的实现部分,声明部分可以到我的gitee仓库里获取。 要查看所有模拟实现的string接口请点击:string接口总览
//无参的默认构造
string::string()
:_str(new char[1]{'\0'})
,_size(0)
,_capacity(0)
{}
//带参的构造
string::string(const char* str)
:_size(strlen(str))
//,_size(strlen(str))
//,_capacity(strlen(str))
{
cout << "构造" << endl;
_capacity = _size;
_str = new char[_size+1];//开跟str一样大的空间 还要加1 给\0预留空间
memcpy(_str, str, _size+1);
}带参的构造中有一个细节:不要使用三个strlen 因为strlen效率不高。因为初始化列表有一个按照声明顺序初始化的逻辑,所以初始化列表与声明顺序是有关联关系的,如果实在不好在初始化列表初始化那就在函数体内部初始化。
//析构函数
string::~string()
{
delete[] _str;
_str = nullptr;
_size = 0;
_capacity = 0;
}//拷贝构造
string::string(const string& s)
{
//开辟新空间
_str = new char[s._capacity+1];
//拷贝旧数据
memcpy(_str, s._str, s._size+1);
_size = s._size;
_capacity = s._capacity;
}拷贝构造要注意开辟空间和拷贝数据的时候一定不要忘记给
\0预留一个空间,因为**string**内部的**_size(有效数据个数)**它指向的是最后一个数据的下一个位置的数据也就是**\0**,而且字符串一般以**\0**作为结束的标识符。
string& string::operator=(string& s)
{
//防止给自己赋值
if (this != &s)
{
//开新空间拷贝旧数据
char* tmp = new char[s._size + 1];
memcpy(tmp, s._str, s._size + 1);
delete[] _str;
_str = tmp;
_size = s._size;
_capacity = s._capacity;
}
return *this;
}对于拷贝构造和赋值重载还有一些现代写法,现代写法相比于传统的写法更加简洁。内部的逻辑其实就是调用std里面的swap交换底层的成员变量来实现的,如果想了解请点击:代码仓库
之前在类和对象时我们说过如果一个有资源的类我们在没有显示写拷贝构造和赋值重载的时候,使用编译器默认生成的拷贝构造那么完成的就是浅拷贝:

如果我们自己写了拷贝构造和赋值重载那么完成的就是深拷贝:

在前面的文章中我们说过迭代器是像指针一样的东西,它不一定是指针,也可以是指针。为什么这么说呢?string的迭代器的实现我们采取的就是使用指针的方式。 1.定义在**
string.h**中的迭代器的声明
//string的迭代器 底层使用char*来实现
typedef char* iterator;
typedef const char* const_iterator;
iterator begin();
iterator end();
//cosnt迭代器
const_iterator begin() const;
const_iterator end() const;注意:const迭代器,使用用const修饰底层的char,也就是修饰底层的元素不能修改。*
2.迭代器的实现
//普通迭代器
string::iterator string::begin()
{
//返回首元素 头指针
return _str;
}
string::iterator string::end()
{
//返回尾指针
return _str + _size;
}
//const迭代器
//这里修饰的就是this指针
string::const_iterator string::begin() const
{
return _str;
}
string::const_iterator string::end() const
{
return _str + _size;
}在上面string迭代器的实现中我们是采用原生指针的方式来实现迭代器的,而string库里面的迭代器就不是指针了。实际上string的迭代器是下面这一个:

size_t string::size() const
{
return _size;
}void string::clear()
{
_str[0] = '\0';
_size = 0;
}注意清空数组不是该数组的元素而是更改有效数据个数
_size!
void string::reserve(size_t n)
{
if (n > _capacity)
{
//扩容逻辑:先根据n重新开一块空间 然后将旧数据拷贝到新空间 释放旧空间
char* tmp = new char[n+1];
memcpy(tmp, _str, _size+1);
delete[] _str;
_str = tmp;//指向新空间
_capacity = n;
}
}注意事项:
n>_capacity**的判断逻辑是为了让外部也能够调用这个函数,因为外部所传的**n**不一定比**_capacity**大,**reserve**对于缩容是不靠谱的所以要判断。memcpy**,因为**strcpy碰到\0就停止了**。 并且strcpy会将\0写入到_size位置如果在开空间的时候没有给\0预留空间,delete的时候就会报错——内存越界写入。delete[] _str**是释放**_str**内部的资源,**_str**这个指针还是可以使用的!**//尾插
void string::push_back(char ch)
{
//所有的插入都要先判断空间是否足够
if (_size >= _capacity)
{
//扩容 直接扩二倍
size_t newcapacity = 0 ? 4 : 2 * _capacity;
reserve(newcapacity);
}
//空间足够直接在_size位置处插入
_str[_size] = ch;
_size++;
//处理\0
_str[_size] = '\0';
}尾插的注意事项:尾插后记得手动补上
\0。
//追加一个字符串
void string::append(const char* str)
{
size_t len = strlen(str);
if (len+_size>=_capacity)
{
//扩容
size_t newcapacity = 2 * _capacity > len + _size ? 2 * _capacity : len + _size;
reserve(newcapacity);
}
memcpy(_str + _size, str, len+1);//拷贝len+1个 给\0预留空间
_size += len;
}追加的逻辑与尾插类似,不同点就是追加的是一个字符串,
_size要加上一个字符串长度。
//加等直接调用对应的函数
string& string::operator+=(char ch)
{
push_back(ch);
return *this;
}
string& string::operator+=(const char* str)
{
append(str);
return *this;
}这里的加等函数,底层直接调用对应的
push_back和append函数即可,注意返回的*this,因为成员函数的第一个参数默认是this指针,这个指针存的是调用这个函数对象的地址,所以返回*this就是返回这个对象!
const char* string::c_str() const
{
return _str;
}
c_str返回的就是string底层的那个字符数组_str,也就是C语言格式字符数组。
//从pos位置处查找一个字符
size_t string::find(char ch, size_t pos) const
{
assert(pos < _size);
for (size_t i = pos;i < _size;i++)
{
if (_str[i] == ch)//这里注意不能写'ch' ch本身就是一个字符变量
{
return i;
}
}
return npos;
}
//从pos位置处查找一个字符串
size_t string::find(const char* str, size_t pos) const
{
assert(pos < _size);
//底层使用strstr来实现
const char* p1 = strstr(_str + pos, str);//p1是_str加上字串的起始位置
if (p1 == nullptr)
{
//如果在_str中找不到一个具体的下标 就返回整型的最大值npos
return npos;
}
else
{
//p1-_str就是子串的起始位置
return p1 - _str;
}
}上面的第二个返回值为什么返回**
p1-_str**的原因如下:

//截取子串
string string::substr(size_t pos, size_t len) const
{
//同样分成两种情况 一种是直接截取完 一种是截取一部分
if (pos == npos || _size - pos <= len)
{
len = _size - pos;//pos到_size之间 总共就只有len个长度的数据
}
string ret;
ret.reserve(len);
for (size_t i = 0;i < len;i++)
{
ret += _str[i + pos];
}
//传值返回 所以需要拷贝构造
return ret;
}这里有一个地方值得注意:
substr的返回值是一个string,也就是传值返回。而传值返回如果在我们没有写拷贝构造的情况下适用编译器自动生成的拷贝构造,完成的就是浅拷贝,所以我们需要显式写拷贝构造!!!
那就有人要问了为什么不是传引用返回,不是指针返回呢?下面就来画图分析分析:

注意:还有一些有关插入函数的接口可以到我的代码仓库里面看哦。代码仓库:查看其余的函数具体实现请点击这里!
char& string::operator[](size_t i)
{
//返回底层字符数组的第i个字符
assert(i < _size);
return _str[i];
}
const char& string::operator[](size_t i) const
{
//加了const修饰 只读
assert(i < _size);
return _str[i];
}
operator[]是STL容器中都会实现的一个接口,因为它能随意访问容器底层的任意元素,非常便捷。
ostream& operator<<(ostream& out, const string& s)
{
//注意这里不能直接调用c_str 因为c_str返回原生的char* 碰到\0就停止了
//如果我们往string后面插入了\0那就是大坑了 会出现乱码
//out << s.c_str();
//所以要一个一个的输出
for (size_t i = 0;i < s.size();i++) //这里传的是const sting 如果size()接口
//没有加上const 那么const string是调用不了的
{
out<<s[i];
}
return out;
}
istream& operator>>(istream& in, string& s)
{
//为了避免插入之前对象的内容会与我们输入的内容重合
//在提取之前先清空一下
s.clear();
char buff[128];//中转站 这样可以减少扩容的次数
int i = 0;
char ch = in.get();//cin与scanf一样碰到空格就自动结束提取了
//所以这里使用get接口能够获取到空格换行等
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[i] = '\0';
//满127就加等到s上
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}getline与流插入类似就是指定的分隔符不同在这里就不呈现代码了,比较操作符重载也很简单,只要实现小于和等于其他的复用就可以。这些函数的实现都可以去我的gitee代码仓库里面查找哦! 代码仓库:查看其余的函数具体实现请点击这里!
| 以上就是本篇文章的所有内容了,感谢各位大佬观看,制作不易还望各位大佬点赞支持一下!有什么问题可以加我私信交流! |
|:----|