如何标记来自不同语言或不同 unicode 块的字符串,以便它在浏览器中正确呈现?

问题描述

我在 VSC 中创建了一个 HTML 文件。它在页面顶部附近有一串孟加拉语。 在 Chrome 中打开时,有时(看似随机)孟加拉语突然呈现为中文和问号:

"爨踶�爨��爨�爨伍�爨��爨��爨�爨�..."
文字符串是孟加拉语:
“একবারস্বামীজিট্রেনেকরেযাচ্ছিলেন,তিনিসন্যাসীদেরগেরুয়া......”

奇怪的是,即使是标准字母也会被损坏,来自:
"Ēkbár sbámīji ṭrēnē karē yácchilēn,tini sanyasi's"
到:
"���kb叩r sb叩m朝ji 耕�r�n� kar� y叩cchil�n,tini sanyasi�s

即使没有进行任何更改,稍后它也可能会正确打开!这似乎取决于缓存。如果我在同一个字符串中的孟加拉语之前包含一个英语句子,整个事情就会完美呈现。如果我使用在线编译器(使用相同的 chrome 浏览器),它也会完美呈现(不更改 HTML 中的任何内容)。
是否有一些方法可以标记孟加拉语 unicode 块并将字母表包含在我的 HTML 缓存中以确保不会发生这种情况?

解决方法

DanieD 已正确指出问题已通过指示 utf-8 编码的元标记解决。

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...