如何摆脱Prawn生成的PDF中的怪异盒子字符?

问题描述

我正在运行Rails 6应用程序,用户可以在其中将其内容转换为PDF。

我正在使用Prawn生成PDF。

大多数PDF看起来不错,但其中一些包含空白(?)框字符。我根本不了解它们的来源,也无法询问我们的用户。这是其中一个PDF文件的屏幕截图:

enter image description here

如何摆脱那些方框字符?

我的猜测是我们的用户正在从其文字处理器(例如MS Word)复制内容,并且这些内容包含隐藏的格式,标签等。

我该如何摆脱呢?

解决方法

好的,解决此问题非常简单。我只是没有意识到 tab 是造成麻烦的原因,并且Prawn无法(显然)处理它们。

为了使Prawn开心,我在模型中做到了这一点:

class Project < ApplicationRecord

   before_save :replace_tabs

   def replace_tabs
     number_of_spaces = 4
     description.gsub!("\t",' ' * number_of_spaces)
   end

end