符号和编码:这是什么符号?

问题描述

我正在处理一个充满数据的大文本文件。那里的不同数据块被看起来有点奇怪和怪异的符号(或一对相似的符号)所分散。 我需要找出它是什么符号,以便在读取数据文件时正确地(!)将其用于拆分数据块。你能帮我吗?

这是一对符号在Stackoverflow“询问问题”编辑字段中的外观:

接下来,我添加一些图片,以了解符号在不同位置之间的不同之处:

在原始数据文件

enter image description here

在Brackets Editor中(所有可用的编码都相同)

enter image description here

在“勇敢的浏览器”搜索栏中

enter image description here

在Visual Studio 2019中

enter image description here

在Stackoverflow中(输入时和在发布的问题中有所不同)编辑字段

enter image description here

将其转换为以下内容之一

enter image description here

在使用带有Encoding.UTF8编码的C#读取符号时,控制台将给出下一个结果:

enter image description here

但是当使用Encoding.Unicode时,控制台会提供无限的smth集合,如下所示:

enter image description here

要使我的C#代码识别并响应这些符号,我到底要写些什么?

解决方法

我用这个unicode char finder来找出字符是什么。

按顺序排列...

U + 0003:文本结尾[ETX]

U + 0001:航向开始[SOH]