问题描述
我需要将 Cobol 文件读入 VB.net。以下是文档中对数据类型的描述:
All Magnetic tape files are recorded in 9-track,8OOBPI mode with odd parity. They are created IBM equipment disk operating system. IBM System 360 Standard.
Binary - Data is coded in pure binary code.
BCD - Data is coded in binary coded decimal format. (Primarily
for files created by the IBM 1401 System).
EBCDIC - Data is coded in extended binary coded decimal interchange code. :(An IBM developed code.)
Packed - Data is coded in packed decimal format.
File Format:
1-2 Record Count [Numeric] (Binary)
3-4 Filler (Binary)
5-5 Record Type [B or R] (EBCDIC)
6-10 Sales Location Numeric [9 digit number] (Packed)
11-13 Sales Identifier (3 character Alpha) (EBCDIC]
etc
所以,我知道我应该将整个文件读入一个字节数组,这就是我知道要做的事情的极限...... A) 我看到另一篇关于 EBCDIC 对话的帖子使用
System.Text.Encoding.GetEncoding(37)
但它是针对整个文件的。如果我通过它运行整个文件,我会看到可理解的文本,但当然其他字段是垃圾。我不知道正确解码单个字段的语言。 B) 我不知道如何处理 PURE 二进制格式。 C) 我不知道如何阅读 Packed,尤其是作为单个字段
我为 PURE BINARY 尝试了多种解码选项,但我为第一个字段获得的数字与文档中规定的行长度不一致。
解决方法
压缩十进制格式:
对于 s9(5)V9(4) comp-3,123.45 以字节格式表示为
00 12 34 50 0c
每个数字用 4 位表示,末尾有一个 4 位符号 (c),3 后面是假定的十进制数。
大多数语言都提供了将字节/字节转换为字符串的例程,即字节 x'34' -->> 字符串 '34'。所以你可以:
- 将字节转换为字符串表示
- 添加小数点
- 去掉末尾的符号字符并在前面添加适当的符号
还有其他方法:
- 创建一个翻译数组并进行数组查找。 (参见 https://github.com/bmTas/JRecord/blob/master/Source/JRecord_Project/JRecord_Common/src/main/java/net/sf/JRecord/Types/smallBin/TypePackedDecimal9.java 示例)
- 一次处理 4 位
其他领域
- 第一个字段(二进制)可能是一个大端二进制整数或另一个压缩十进制。 .net 中可能内置了一个实用程序来执行此操作。
- 一次一个字段将字符字段从 ebcdic 转换为 ascii
在 VBA 中,您不需要读取整个文件,您可以逐条读取它。我想你可以在 vb.net 中做同样的事情
有用的工具
这些工具可能对测试有用。
-
RecordEditor 应该能够显示文件。 布局向导应该能够确定文件的格式。或者使用下面的 Cobol 字帖
-
Java 程序 CobolToCsv 应该能够将文件转换为 Csv
01 tape-record. 05 record-count pic s9(3) comp. 05 filler pic x(2). 05 record-type pic x. 05 Sales-Location pic s9(9) comp-3. 05 Sales-Identifier pic x(3).