如何编写一个算法，根据假名读数为日本汉字生成假名读数

问题描述

我目前正在编写日语单词和汉字的多语言在线词典。我目前的问题是为表达式、句子和单词中的汉字组合生成假名。我在每种情况下都有假名和汉字读法（分开），但我没有可靠的算法来工作，它根据假名读法为每个汉字组合生成读数。
我不需要每个汉字的准确读数，根据我拥有的数据，这显然是不可能的，但应该可以确定所有汉字复合物的读数，因为我有假名的完整句子/单词/表达。

我有： kanji = 私は学生です
kana = わたしはがくせいです

我想自动分配
私到わたし
和
学生到がくせい。

我尝试遍历汉字字符串并检查假名和汉字之间的字符是否“改变”，然后查找直到假名字符串中的这个位置。这种方法适用于所有没有汉字后跟平假名音节的句子，平假名音节与汉字阅读结束时相同。
我的另一个想法是替换假名中汉字串中的所有平假名化合物，并将左侧的假名化合物作为汉字的读数。这显然不适用于每种情况。

我怎样才能写出这样一个算法，在任何情况下都适用？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

cjk kanji split split split string string