前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >面试官:字节流可以处理一切文件为什么还需要字符流呢?

面试官:字节流可以处理一切文件为什么还需要字符流呢?

原创
作者头像
JavaBuild
发布2024-06-15 08:25:42
1030
发布2024-06-15 08:25:42
举报
文章被收录于专栏:Java成长计划

一、写在开头

在计算机领域中百分之九十以上的程序拥有着和外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出),所谓输入就是外部数据导入计算机内存中的过程,输出则是将内存或者说程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。

二、什么是IO流

这种输入输出往往遵循着先入先出,顺序存取的特点,像水流一般,因此我们称这样的操作为流(Stream),如下我们根据不同的标准,将IO流分为几个门类:

根据数据流向:

  1. 输入流:数据流向程序
  2. 输出流:数据从程序流出。

根据处理单位:

  1. 字节流:一次读入或读出是8位二进制;
  2. 字符流:一次读入或读出是16位二进制
  3. JDK 中后缀是 Stream 是字节流;后缀是 Reader,Writer 是字符流。

根据功能点:

  1. 节点流:直接与数据源相连,读入或写出;
  2. 处理流:与节点流一块使用,在节点流的基础上,再套接一层。

三、输入与输出

在java.io包中多达40多个类,它们的基类来源于InputStream、OutputStream、Reader、Writer这四个,我们一一看过。

3.1 InputStream(字节输入流)

InputStream作为所有字节输入流的父类,主要作用是将外部数据读取到内存中,主要方法如下(JDK8):

  1. read():返回输入流中下一个字节的数据。返回的值介于 0 到 255 之间。如果未读取任何字节,则代码返回 -1 ,表示文件结束。
  2. read(byte b ) : 从输入流中读取一些字节存储到数组 b 中。如果数组 b 的长度为零,则不读取。如果没有可用字节读取,返回 -1。如果有可用字节读取,则最多读取的字节数最多等于 b.length , 返回读取的字节数。这个方法等价于 read(b, 0, b.length)。
  3. read(byte b[], int off, int len):在read(byte b ) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. skip(long n):忽略输入流中的 n 个字节 ,返回实际忽略的字节数。
  5. available():返回输入流中可以读取的字节数。
  6. close():关闭输入流释放相关的系统资源。
  7. markSupported() :该输入流是否支持mark()和reset()方法。
  8. mark(int readlimit) :标志输入流的当前位置,随后调用reset()方法将该流重新定位到最近标记的位置;参数readlimit表示:在标记位置失效前可以读取字节的最大限制。
  9. reset() :将此流重新定位到最后一次对此输入流调用 mark 方法时的位置。

我们使用FileInputStream(文件字节输入流)进行如上方法的使用测试:

代码语言:java
复制
public class Test {
    public static void main(String[] args) throws IOException {
        try (InputStream fis = new FileInputStream("E:\\input.txt")) {
            System.out.println("可读取字节数:"
                    + fis.available());
            int content;
            long skip = fis.skip(3);
            System.out.println("忽略字节数:" + skip);
            System.out.print("剩余全量字节:");
            while ((content = fis.read()) != -1) {
                System.out.print((char) content);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

输出:

代码语言:java
复制
可读取字节数:20
忽略字节数:3
剩余全量字节:name is JavaBuild

3.2 OutputStream(字节输出流)

outputstream作为所有字节输出流的父类,主要则是将内存或者说程序中的数据以字节流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。它的使用方法相比较字节输入流要少:

  1. write(int b):将特定字节写入输出流。
  2. write(byte b ) : 将数组b 写入到输出流,等价于 write(b, 0, b.length) 。
  3. write(byte[] b, int off, int len) : 在write(byte b ) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. flush():刷新此输出流并强制写出所有缓冲的输出字节。
  5. close():关闭输出流释放相关的系统资源。

我们同样以FileOutputStream为例进行上述方法的测试:

代码语言:java
复制
public class Test {
    public static void main(String[] args) throws IOException {
        try (FileOutputStream output = new FileOutputStream("E://output.txt")) {
            byte[] array = "JavaBuild".getBytes();
            //将一个字节数组写入本地E盘的外部文件output.txt中
            output.write(array);

            //换行方式1:Windows下的换行符为"\r\n"
            output.write("\r\n".getBytes());
            //换行方式2:推荐使用,具有良好的跨平台性
            String newLine = System.getProperty("line.separator");
            output.write(newLine.getBytes());

            //输出字节,这里的数字会被转为asicc码中对应的字符
            output.write(64);
            output.write(56);
            output.write(56);
            output.write(56);
            //关闭输出流
            output.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

效果:

这里可以直接输出单字节数据,也可以输出指定的字节数组。输出字节时以int类型输出,最终根据ASCII表转为字符。如十进制64的转为@符号。

3.3 Reader(字符输入流)

在讲解字符流之前,我们来解释一个面试问题:“为什么有了字节流了还需要使用更耗时的字符流”

确实,字节作为信息存储的最小单元,我们可以通过字节流实现所有信息的输入与输出,但有时候会存在一些问题,比如中文输入时的编码问题,将上述3.1中的测试代码稍微改一下,执行结果如下,中文在控制台输出时乱码了。当然我们可以通过设置编码来规避这个问题,但有时候不晓得编码时,乱码真的会带来潜在风险!

字符流与字节流的区别:

  • 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。
  • 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于效率提升不明显。

说了这么多,我们现在来看一下Reader这个字符输入流提供的主要方法吧,其实和InputStream差不多,只不过一个是以字节为单位的读取,一个是以字符为单位。

  1. read() : 从输入流读取一个字符。
  2. read(char[] cbuf) : 从输入流中读取一些字符,并将它们存储到字符数组 cbuf中,等价于 read(cbuf, 0, cbuf.length) 。
  3. read(char[] cbuf, int off, int len):在read(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. skip(long n):忽略输入流中的 n 个字符 ,返回实际忽略的字符数。
  5. close() : 关闭输入流并释放相关的系统资源。

我们将上述3.1中的测试代码稍作加工,采用FileReader流进行输入,打印结果:

可以看到即便有中文,输出在控制台也没有乱码,因为字符流默认采用的是 Unicode 编码。

那么字符流是如何实现txt文件读取的呢?通过FileReader类的继承关系我们可以看到它继承了InputStreamReader,这是一个字节转字符输入流,所以说从根本上,字符流底层依赖的还是字节流!

代码语言:java
复制
// 字节流转换为字符流的桥梁
public class InputStreamReader extends Reader {
}
// 用于读取字符文件
public class FileReader extends InputStreamReader {
}

3.4 Writer(字符输出流)

writer是将内存或者说程序中的数据以字符流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。

常用方法也和OutputStream相似:

  1. write(int c) : 写入单个字符。
  2. write(char[] cbuf):写入字符数组 cbuf,等价于write(cbuf, 0, cbuf.length)。
  3. write(char[] cbuf, int off, int len):在write(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. write(String str):写入字符串,等价于 write(str, 0, str.length()) 。
  5. write(String str, int off, int len):在write(String str) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  6. append(CharSequence csq):将指定的字符序列附加到指定的 Writer 对象并返回该 Writer 对象。
  7. append(char c):将指定的字符附加到指定的 Writer 对象并返回该 Writer 对象。
  8. flush():刷新此输出流并强制写出所有缓冲的输出字符。
  9. close():关闭输出流释放相关的系统资源。

我们同样以FileWriter为例,去测试一下:

代码语言:java
复制
public class Test {
    public static void main(String[] args) throws IOException {
        try (FileWriter fw = new FileWriter("E:\\outwriter.txt")) {
           fw.write("大家好!!!");
           fw.append("我是JavaBuild");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

我正在参与2024腾讯技术创作特训营最新征文,快来和我瓜分大奖!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、写在开头
  • 二、什么是IO流
  • 三、输入与输出
    • 3.1 InputStream(字节输入流)
      • 3.2 OutputStream(字节输出流)
        • 3.3 Reader(字符输入流)
          • 3.4 Writer(字符输出流)
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档