如何在protobuf中调试无效的utf-8?

问题描述

我正在使用一些 tensorflow 代码并尝试加载一个经过训练的检查点,但它失败了,出现了这样的 protobuf 错误

[libprotobuf ERROR google/protobuf/wire_format_lite.cc:577] String field 'tensorflow.TensorShapeProto.Dim.name' contains invalid UTF-8 data when parsing a protocol buffer. Use the 'bytes' type if you intend to send raw bytes. 
Traceback (most recent call last):
  [...]
  File "/home/sopi/miniconda3/envs/magenta2/lib/python3.7/site-packages/tensorflow/python/framework/ops.py",line 3053,in _as_graph_def
    graph.ParseFromString(compat.as_bytes(data))
google.protobuf.message.DecodeError: Error parsing message

为了调试显然产生无效 utf-8 的训练代码,我想知道有问题的无效数据实际上是什么样的。由于 ParseFromString() 是在 C++ 中实现的,因此单步执行 pdb 中的代码并没有让我走得很远。

如何找出无效的 utf-8 数据?甚至是字节数组中发生错误的位置?

在这种情况下,graph一个 tensorflow.core.framework.graph_pb2.GraphDef,它是 google.protobuf.message.Message 的子类。但我的问题一般涉及 protobuf 解析,我认为没有什么特别之处GraphDef 在这方面)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...