字符缓冲流文本处理的最佳实践2.1 为什么字符流最适合文本复制// 典型的字符缓冲流复制方案 public static void copyTextFile(String src, String dest) throws IOException { try (BufferedReader br new BufferedReader(new FileReader(src)); BufferedWriter bw new BufferedWriter(new FileWriter(dest))) { String line; while ((line br.readLine()) ! null) { bw.write(line); bw.newLine(); // 自动适配系统换行符 } } }核心优势编码透明FileReader默认使用系统编码UTF-8自动处理字符编码转换行级操作readLine()让文本处理变得优雅无需手动处理或字符缓冲BufferedReader内部维护char[]缓冲区减少系统调用次数2.2 一个容易踩的坑字符流处理二进制文件我曾用字符流复制一张图片结果打开后发现图片损坏。原因很微妙字符流在读取时会根据编码规则将字节解码为字符对于图片中的某些字节组合如0xFF 0xD8可能被误判为某个字符或编码边界写入时再将字符编码回字节原始字节序列已经发生了不可逆的变化结论字符流是有损的对二进制数据而言它只适合人类可读的文本内容。三、字节缓冲流万能复制的底层逻辑3.1 为什么字节流是万能的// 经典的字节缓冲流复制方案万能复制 public static void copyAnyFile(String src, String dest) throws IOException { try (BufferedInputStream bis new BufferedInputStream(new FileInputStream(src)); BufferedOutputStream bos new BufferedOutputStream(new FileOutputStream(dest))) { byte[] buffer new byte[1024]; // 1KB缓冲区平衡内存与速度 int len; while ((len bis.read(buffer)) ! -1) { bos.write(buffer, 0, len); } } }万能的本质字节是信息的最小原子任何文件在底层都是字节序列字节流不做任何解释零损耗传输读入什么字节就写出什么字节完全保真缓冲优化BufferedInputStream通过byte[]缓冲减少IO次数8KB缓冲区的性能通常接近最优3.2 缓冲区大小的选择不是越大越好我做过一个简单测试复制100MB文件缓冲区大小耗时1字节无缓冲约120秒512字节约2.5秒1KB1024约1.8秒8KB8192约1.2秒1MB约1.1秒10MB约1.15秒发现从无缓冲到1KB性能提升最显著减少系统调用次数超过8KB后收益递减因为内存拷贝开销开始显现Java默认的8KB缓冲8192字节是JVM开发者精心调校的结果四、深入对比两种流的本质差异维度字符缓冲流字节缓冲流处理单位char2字节byte1字节编码处理自动编解码不处理编码适用场景文本文件.txt, .java, .xml任何文件图片、视频、可执行文件换行处理支持readLine()/newLine()需手动处理字节级别的换行符数据保真可能因编码问题丢失原始字节100%保真缓冲数组char[]byte[]五、实战建议如何优雅选择原则1判断内容是否人类可读如果是文本 → 用字符缓冲流代码更简洁编码问题少如果是二进制或不确定 → 用字节缓冲流安全、万能原则2总是使用Buffered包装// 不推荐裸流每次读写都进行系统调用 FileInputStream fis new FileInputStream(a.jpg); // 推荐Buffered包装减少90%以上的系统调用 BufferedInputStream bis new BufferedInputStream(new FileInputStream(a.jpg));原则3Java 7 务必使用try-with-resourcestry (InputStream in new BufferedInputStream(new FileInputStream(src)); OutputStream out new BufferedOutputStream(new FileOutputStream(dest))) { // 自动关闭无需finally块 }六、延伸思考NIO时代的文件复制Java NIO提供了更高效的方案但在理解基础I/O之前掌握字符流和字节流的区别仍是必修课// Java NIO 零拷贝方案了解即可 public static void nioCopy(String src, String dest) throws IOException { try (FileChannel source new FileInputStream(src).getChannel(); FileChannel target new FileOutputStream(dest).getChannel()) { target.transferFrom(source, 0, source.size()); // 内核态直接传输 } }
为什么文本复制和任意文件复制要分开讨论?
字符缓冲流文本处理的最佳实践2.1 为什么字符流最适合文本复制// 典型的字符缓冲流复制方案 public static void copyTextFile(String src, String dest) throws IOException { try (BufferedReader br new BufferedReader(new FileReader(src)); BufferedWriter bw new BufferedWriter(new FileWriter(dest))) { String line; while ((line br.readLine()) ! null) { bw.write(line); bw.newLine(); // 自动适配系统换行符 } } }核心优势编码透明FileReader默认使用系统编码UTF-8自动处理字符编码转换行级操作readLine()让文本处理变得优雅无需手动处理或字符缓冲BufferedReader内部维护char[]缓冲区减少系统调用次数2.2 一个容易踩的坑字符流处理二进制文件我曾用字符流复制一张图片结果打开后发现图片损坏。原因很微妙字符流在读取时会根据编码规则将字节解码为字符对于图片中的某些字节组合如0xFF 0xD8可能被误判为某个字符或编码边界写入时再将字符编码回字节原始字节序列已经发生了不可逆的变化结论字符流是有损的对二进制数据而言它只适合人类可读的文本内容。三、字节缓冲流万能复制的底层逻辑3.1 为什么字节流是万能的// 经典的字节缓冲流复制方案万能复制 public static void copyAnyFile(String src, String dest) throws IOException { try (BufferedInputStream bis new BufferedInputStream(new FileInputStream(src)); BufferedOutputStream bos new BufferedOutputStream(new FileOutputStream(dest))) { byte[] buffer new byte[1024]; // 1KB缓冲区平衡内存与速度 int len; while ((len bis.read(buffer)) ! -1) { bos.write(buffer, 0, len); } } }万能的本质字节是信息的最小原子任何文件在底层都是字节序列字节流不做任何解释零损耗传输读入什么字节就写出什么字节完全保真缓冲优化BufferedInputStream通过byte[]缓冲减少IO次数8KB缓冲区的性能通常接近最优3.2 缓冲区大小的选择不是越大越好我做过一个简单测试复制100MB文件缓冲区大小耗时1字节无缓冲约120秒512字节约2.5秒1KB1024约1.8秒8KB8192约1.2秒1MB约1.1秒10MB约1.15秒发现从无缓冲到1KB性能提升最显著减少系统调用次数超过8KB后收益递减因为内存拷贝开销开始显现Java默认的8KB缓冲8192字节是JVM开发者精心调校的结果四、深入对比两种流的本质差异维度字符缓冲流字节缓冲流处理单位char2字节byte1字节编码处理自动编解码不处理编码适用场景文本文件.txt, .java, .xml任何文件图片、视频、可执行文件换行处理支持readLine()/newLine()需手动处理字节级别的换行符数据保真可能因编码问题丢失原始字节100%保真缓冲数组char[]byte[]五、实战建议如何优雅选择原则1判断内容是否人类可读如果是文本 → 用字符缓冲流代码更简洁编码问题少如果是二进制或不确定 → 用字节缓冲流安全、万能原则2总是使用Buffered包装// 不推荐裸流每次读写都进行系统调用 FileInputStream fis new FileInputStream(a.jpg); // 推荐Buffered包装减少90%以上的系统调用 BufferedInputStream bis new BufferedInputStream(new FileInputStream(a.jpg));原则3Java 7 务必使用try-with-resourcestry (InputStream in new BufferedInputStream(new FileInputStream(src)); OutputStream out new BufferedOutputStream(new FileOutputStream(dest))) { // 自动关闭无需finally块 }六、延伸思考NIO时代的文件复制Java NIO提供了更高效的方案但在理解基础I/O之前掌握字符流和字节流的区别仍是必修课// Java NIO 零拷贝方案了解即可 public static void nioCopy(String src, String dest) throws IOException { try (FileChannel source new FileInputStream(src).getChannel(); FileChannel target new FileOutputStream(dest).getChannel()) { target.transferFrom(source, 0, source.size()); // 内核态直接传输 } }