查找字符串的编码方式

问题描述

我正在处理一个 xml 文件,其中的数字使用不同的方法进行编码。 标题说 "xml version="1.0" encoding="utf-8"" ,但我发现不仅使用了 utf8。 以下字符串我相信使用了相同的编码方法。但我无法弄清楚使用的方法。请参见下面的字符串是相应的小数和括号中的单位。字符串可能包含也可能不包含单位。

40413CA4FCA42AED  5.000 (ksi)
40A2C00000000000  0.15 (kcf)  
40A2200000000000  0.145 (kcf)
40DB627A7915AB7E  4067.135889 (ksi)
3FC999999999999A  0.2 (no unit)
400D99D5D4C224D1  0.5366563 (ksi)

下面是我用来解释这些字符串的python代码。在 6 个字符串中,我得到了一个正确的 0.2

import struct
# define double_to_hex (or float_to_hex)
def double_to_hex(f):
    return hex(struct.unpack('<Q',struct.pack('<d',f))[0])
print(double_to_hex(0.5366563))

有什么建议吗?

解决方法

我猜是单位不匹配。

import struct
import pandas as pd
import io   

mydata = '''hxstr decval unit
40413CA4FCA42AED 5.000 (ksi)
40A2C00000000000 0.15 (kcf)
40A2200000000000 0.145 (kcf)
40DB627A7915AB7E 4067.135889 (ksi)
3FC999999999999A 0.2 (nou)
400D99D5D4C224D1 0.5366563 (ksi)
'''

df = pd.read_csv( io.StringIO(mydata),sep=" ")
for index,row in df.iterrows():
    print( 
      row.hxstr,row.unit,struct.unpack(
        '>d',bytes.fromhex(row.hxstr))[0] / float(row.decval)) 

结果显示相同单位的比率大致相同:

40413CA4FCA42AED (ksi) 6.894757
40A2C00000000000 (kcf) 16000.0
40A2200000000000 (kcf) 16000.000000000002
40DB627A7915AB7E (ksi) 6.89475699994749
3FC999999999999A (nou) 1.0
400D99D5D4C224D1 (ksi) 6.894757187574625

这里

  • 6.894757 ksi 的比率类似于以下转换(前提是 ksi 表示 每平方英寸千磅 em>): 1 ksi = 6.8947572932 MPa (Megapascal),
  • 1.0 无单位的比例似乎是正确的,但是
  • 16000.0 kcf 的比率我无法识别......