使用C比较巨大的文件

C&C++ 2019-10-12

我有两个大文本文件,每个文件有超过1000万行.如何使用C比较文件并在文件中获取不同的行.

我尝试将一个文件加载到内存中并对内存进行排序,并使用二叉树逻辑来比较文件.它比较并给了我20秒的结果.但它消耗更多的内存. (文本文件大约500 MB).

我想比较两个文件而不消耗更多内存,良好的性能和对硬盘的影响最小.

解决方法

你可以使用两遍法.

第一遍,你读取文件但只存储行的哈希值和行起始位置,然后你可以根据哈希值比较文件,你只能在第二遍中读取行再次完成比较,当两行具有相同的哈希值时.这样可以节省内存消耗和cpu时间,两次读取一些行会有点损失.

相关文章

宿舍管理系统——单链表+结构体实现入住、退房和查询功能（C语言版）

本程序的编译和运行环境如下（如果有运行方面的问题欢迎在评...

使用Windows API 编写按行分配的计算矩阵向量相乘的并行程序

水了一学期的院选修，万万没想到期末考试还有比较硬核的编程...

C语言实现一个走迷宫小游戏（深度优先算法）

补充一下，先前文章末尾给出的下载链接的完整代码含有部分C&...

模N取余法实现大整数进制转换 ——C语言版（2-16进制均可）

思路如标题所说采用模N取余法，难点是这个除法过程如何实现。...

C语言输出格式工整的日历——2乘6样式（详见本文）

本篇博客有更新！！！更新后效果图如下：文章末尾的完整代码...

通过调试来理解形参与实参的区别

刚开始学习模块化程序设计时，估计大家都被形参和实参搞迷糊...