如何标记来自不同语言或不同 unicode 块的字符串，以便它在浏览器中正确呈现？

问题描述

我在 VSC 中创建了一个 HTML 文件。它在页面顶部附近有一串孟加拉语。在 Chrome 中打开时，有时（看似随机）孟加拉语突然呈现为中文和问号：

"爨踶�爨��爨�爨伍�爨��爨��爨�爨�..."
原文字符串是孟加拉语：
“একবারস্বামীজিট্রেনেকরেযাচ্ছিলেন，তিনিসন্যাসীদেরগেরুয়া......”

奇怪的是，即使是标准字母也会被损坏，来自：
"Ēkbár sbámīji ṭrēnē karē yácchilēn,tini sanyasi's"
到：
"��kb叩r sb叩m朝ji 耕�r�n� kar� y叩cchil�n,tini sanyasi�s

即使没有进行任何更改，稍后它也可能会正确打开！这似乎取决于缓存。如果我在同一个字符串中的孟加拉语之前包含一个英语句子，整个事情就会完美呈现。如果我使用在线编译器（使用相同的 chrome 浏览器），它也会完美呈现（不更改 HTML 中的任何内容）。
是否有一些方法可以标记孟加拉语 unicode 块并将字母表包含在我的 HTML 缓存中以确保不会发生这种情况？

解决方法

DanieD 已正确指出问题已通过指示 utf-8 编码的元标记解决。

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

caching caching html preload preload preload unicode unicode-string

如何标记来自不同语言或不同 unicode 块的字符串，以便它在浏览器中正确呈现？

问题描述

解决方法

相关问答