今天一个友询问FileInputStrem方法的read()和read(byte b) 方法为什么都用-1来判断读文件结束的问题,在此和大家一起学习下。

  •   关于FileInputStream

    它用于读取本地文件中的字节数据,继承自InputStream类,由于所有的文件都是以字节为向导,因此它适用于操作于任何形式的文件。

关于其最重要的两个方法Read()和Read(byte b) 怎么使用呢?首先我们来查看API文档:

  •   read()

API文档:

public int read() throws IOException从此输入流中读取一个数据字节。如果没有输入可用,则此方法将阻塞。
指定者:
类 InputStream 中的 read
返回:
下一个数据字节;如果已到达文件末尾,则返回 -1。 

解读:

  1、此方法是从输入流中读取一个数据的字节,通俗点讲,即每调用一次read方法,从FileInputStream中读取一个字节。

  2、返回下一个数据字节,如果已达到文件末尾,返回-1,这点除看难以理解,通过代码测试理解不难。

3、如果没有输入可用,则此方法将阻塞。这不用多解释,大家在学习的时候,用到的Scannner sc = new Scanner(System.in);其中System.in就是InputStream(为什么?不明白的,请到System.class查阅in是个什么东西!!),大家都深有体会,执行到此句代码时,将等待用户输入。

  既然说可以测试任意形式的文件,那么用两种不同格式的,测试文件data1.txt和data2.txt,里面均放入1个数字"1",两文件的格式分别为:ANSI和Unicode。

编写一下代码测试:

package com.gxlee;

import java.io.FileInputStream;
import java.io.IOException;

public class Test {
    public static void main(String[] args) throws IOException {

     FileInputStream fis = new FileInputStream("data1.txt");//ANSI格式
     for (int i = 0; i < 5; i++) {
         System.out.println(fis.read());
     }

     fis.close();
     System.out.println("------------------");
     fis = new FileInputStream("data2.txt");//Unicode格式
     for (int i = 0; i < 5; i++) {
         System.out.println(fis.read());
     }
     fis.close();
    }
}

  文件里不是只有一个数字吗,为什么循环5次,什么鬼?稍后知晓,先看输出结果:

49
-1
-1
-1
-1------------------
255
254
49
0
-1

  结果怎么会是这样呢?

  1.因为ANSI编码没有文件头,因此数字字符1只占一个字节,并且1的Ascii码为49因此输出49,而Unicode格式有2个字节的文件头,并且以2个字节表示一个字符,对于Ascii字符对应的字符则是第2位补0,因此1的Unicode码的两位十进制分别为49和0;

附:文本文件各格式文件头:ANSI类型:什么都没有,UTF-8类型:EF  BB  BF,UNICODE类型:FF FE,UNICODE BIG ENDIAN类型:FE FF

  2.从返回的结果来看,返回的是当前的字节数据,API文档中原文为:"下一个数据字节,如果已到达文件末尾,则返回 -1。"(英文原文为:the next byte of data, or -1 if the end of the file is reached),应该理解成:此时的指针在下一个数据字节的开始位置。如下图示意:

因此对于未知长度的文件即可通过读取到的内容是否为-1来确定读取是否结束,以下是代码片段:

int b;
 while(-1!=(b=fis.read())){
    System.out.println(b);
}
  • read(byte b)

同样看API:

public int read(byte[] b) throws IOException从此输入流中将最多 b.length 个字节的数据读入一个 byte 数组中。在某些输入可用之前,此方法将阻塞。
覆盖:
类 InputStream 中的 read
参数:
b - 存储读取数据的缓冲区。
返回:
读入缓冲区的字节总数,如果因为已经到达文件末尾而没有更多的数据,则返回 -1。 

解读:

1、最多b.length个字节的数据读入一个byte数据组中,即,最多将byte数组b填满;

2、返回读入缓冲的字节总数,如果因为已经到达文件末尾而没有更多的数据,则返回-1。这里即这为朋友的问题点,为什么用-1来判断文件的结束。他的理由为,假设3个字节源数据,用2个字节的数组来缓存,当第2次读取的时候到达了文件的结尾,此时应该返回-1了,岂不是只读取到了2个字节?

同样,我们来测试:

  测试文件,data.txt,文件格式ANSI,文件内容123,测试代码:

package com.gxlee;

import java.io.FileInputStream;
import java.io.IOException;
import java.util.Arrays;

public class Test {
    public static void main(String[] args) throws IOException {
     FileInputStream fis = new FileInputStream("data.txt");//ANSI格式
     byte[] b = new byte[2];
     for (int i = 0; i < 3; i++) {
         System.out.print("第"+(i+1)+"次读取返回的结果:"+fis.read(b));
         System.out.println(",读取后数组b的内容为:"+Arrays.toString(b));
    }
     fis.close();
    }
}

输出结果:

第1次读取返回的结果:2,读取后数组b的内容为:[49, 50]
第2次读取返回的结果:1,读取后数组b的内容为:[51, 50]
第3次读取返回的结果:-1,读取后数组b的内容为:[51, 50]

   测试数据文件采用的是ANSI格式,放入3个数字,因此为3个字节,这里测试读3次,从代码中可以看出,b为一个byte数组,大小为2,即每次可以存放2个字节。那么问题来了,第一次读取的时候读到2个字节返回很好理解,而第2次的时候,由于只剩下一个字节,此处到了文件的结尾,按照朋友对API文档的理解,应该返回-1才对?
   API文档只是对源代码的一种文字说明,具体的意思视阅读者的理解能力有偏差,那么我们来看源代码吧?

 public int read(byte b[]) throws IOException {
    return readBytes(b, 0, b.length);
 }

  又调用了 readBytes方法,继续看该方法的源码:

private native int readBytes(byte b[], int off, int len) throws IOException;

  晴天霹雳,是个被native修饰的方法,因此没办法继续一步看代码了。没啥好说的,用个代码类继承FileInputStream,覆盖read(byte b)方法,看代码即能理解:

package com.gxlee;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

public class MyFileInputStream extends FileInputStream{

    public MyFileInputStream(String name) throws FileNotFoundException {
        super(name);
    }

    @Override
    public int read(byte[] b) throws IOException {
        int getData = read();
        if (getData==-1) {
            return -1;
        }else{
            b[0] = (byte)getData;
            for (int i = 1; i < b.length; i++) {
                getData = read();
                if(-1==getData)
                    return i;
                b[i] = (byte)getData;
            }
        }
        return b.length;
    }
}

原测试代码做小小的改动:

package com.gxlee;

import java.io.FileInputStream;
import java.util.Arrays;

public class Test {
    public static void main(String[] args) throws Exception {
        FileInputStream fis = new MyFileInputStream("data.txt");//ANSI格式
         byte[] b = new byte[2];
         for (int i = 0; i < 3; i++) {
             System.out.print("第"+(i+1)+"次读取返回的结果:"+fis.read(b));
             System.out.println(",读取后数组b的内容为:"+Arrays.toString(b));
        }
         fis.close();
        }
}

输出结果与原结果一致:

第1次读取返回的结果:2,读取后数组b的内容为:[49, 50]
第2次读取返回的结果:1,读取后数组b的内容为:[51, 50]
第3次读取返回的结果:-1,读取后数组b的内容为:[51, 50]

图示:

大家对指针的理解,各自把握。

测试读取文本内容:

package com.gxlee;

import java.io.FileInputStream;

public class Test {
    public static void main(String[] args) throws Exception {
        FileInputStream fis = new MyFileInputStream("data.txt");//ANSI格式
         byte[] b = new byte[2];
         int len ;
         while (-1!=(len = fis.read(b))) {
             System.out.println(new String(b,0,len));
        }

         fis.close();
     }
}

  准确输出文件内容:

12
3

 原创内容,欢迎指点!

最新文章

  1. iOS的一像素线
  2. WPF快速入门系列(5)——深入解析WPF命令
  3. Linux 查看端口被占用情况
  4. C#壓縮文件幫助類 使用ICSharpCode.SharpZipLib.dll
  5. MSChart使用
  6. 最全的ORACLE-SQL笔记
  7. PHP中mktime() 函数对于日期运算和验证
  8. 聊天工具mychat
  9. 筛选实现C++实现筛选法
  10. Java静态语句块、语句块、构造方法执行顺序
  11. php curl 的几个实例
  12. Unix代码段和数据段
  13. openjudge(二)
  14. android开发中使用到的一些设计者模式
  15. MQTT 单个订阅消息量过大处理
  16. hadoop tez 结合搭建以及测试异常解决
  17. declare -A color
  18. Java8 Collectors.toMap的坑
  19. [django]form不清空问题解决
  20. SQL SERVER 2008 彻底卸载干净方法 (转)

热门文章

  1. react相关
  2. oracle 界面分页
  3. jquery mobile将页面内容当成弹框进行显示
  4. java eclipse 连接数据库全过程
  5. Mongodb增加权限管理
  6. 转:Gulp的目标是取代Grunt
  7. 禁用USB存储设备(不重启)
  8. C++ 单向链表反转
  9. CSS定位属性Position详解
  10. Open Wifi SSID Broadcast vulnerability