ClickHouse失败,错误为“ DirectoryMonitor:额外信息的校验和不匹配:数据已损坏”


我的二进制文件在数据内部带有曲线(我的错)。 ClickHouse无法将其插入表中并停止处理其他数据。我只是打开二进制文件进行编辑,并修复了错误的字段。之后,ClickHouse提取文件并给出了有关无效校验和的错误

default.affiliate_program.DirectoryMonitor: Code: 40,e.displayText() = 
DB::Exception: Checksum of extra info doesn't match: corrupted data. Reference: cb322c17e14d6816abfcdc16842e7bdd. Actual: f4afe41e77b9a92bfa4048648a3aebbb.,

之后,ClickHouse将文件传输到损坏的文件夹中,然后继续。 是否可以更改校验和,或者改写我处理过的文件的其他方式?


无法更改Distributed table的.bin文件。它具有内置的校验和,因此需要重新计算它,但是很麻烦。

database.table.DirectoryMonitor: Code: 164,e.displayText() = 
DB::Exception: Received from **:9000. 
DB::Exception: default: Cannot execute query in readonly mode. Stack trace:

0. Poco::Exception::Exception(std::__1::basic_string<char,std::__1::char_traits<char>,std::__1::allocator<char> > const&,int) @ 0x10519be0 in /usr/bin/clickhouse
1. DB::Exception::Exception(std::__1::basic_string<char,int) @ 0x8f5072d in /usr/bin/clickhouse


..数据块仅被写入 本地文件系统。 ..您应该检查是否已发送数据 通过检查文件列表(等待发送的数据)成功 在表格目录中:/ var / lib / clickhouse / data / database / table /。”

(有关详细信息,请参见Distributed Table Engine

让我们看一下 / var / lib / clickhouse / data / database / table / 文件夹,并检查“挂起”的bin文件以查找问题的原因:

sudo vim /var/lib/clickhouse/data/database/table/default@../3757.bin

bin文件的顶部是原始sql-query和查询设置。在我的情况下, readonly 设置为1(请参阅最后一行)是不允许执行插入的问题根源(格式bin-file将来可以更改,并且输出将有所不同):

εû×^L<88>^H¡©^Cõ^FINSERT INTO database.table({column_list}) VALUES^V


  1. 修复根本原因(在我的情况下,需要正确定义 default -profile)并检查测试插入是否正确

  2. 在群集的每个节点上做

  • 将“挂起”的二进制文件从/var/lib/clickhouse/data/database/table/default@../移动到/var/lib/clickhouse/user_files/

  • 从CH打开文件并重新插入

# check data availability
SELECT count()
FROM file('*.bin','Distributed')

# re-insert data
INSERT INTO database.table
FROM file('*.bin','Distributed')
# FROM file('3757.bin','Distributed')
  • 从原始文件夹/var/lib/clickhouse/user_files/中删除已处理的“挂起”文件