问题描述
我正在处理一个充满数据的大文本文件。那里的不同数据块被看起来有点奇怪和怪异的符号(或一对相似的符号)所分散。 我需要找出它是什么符号,以便在读取数据文件时正确地(!)将其用于拆分数据块。你能帮我吗?
这是一对符号在Stackoverflow“询问问题”编辑字段中的外观:
接下来,我添加一些图片,以了解符号在不同位置之间的不同之处:
在原始数据文件中
在Brackets Editor中(所有可用的编码都相同)
在“勇敢的浏览器”搜索栏中
在Visual Studio 2019中
在Stackoverflow中(输入时和在发布的问题中有所不同)编辑字段
将其转换为以下内容之一
在使用带有Encoding.UTF8编码的C#读取符号时,控制台将给出下一个结果:
但是当使用Encoding.Unicode时,控制台会提供无限的smth集合,如下所示:
要使我的C#代码识别并响应这些符号,我到底要写些什么?