如何编写一个算法,根据假名读数为日本汉字生成假名读数

问题描述

我目前正在编写日语单词和汉字的多语言在线词典。我目前的问题是为表达式、句子和单词中的汉字组合生成假名。我在每种情况下都有假名和汉字读法(分开),但我没有可靠的算法来工作,它根据假名读法为每个汉字组合生成读数。
我不需要每个汉字的准确读数,根据我拥有的数据,这显然是不可能的,但应该可以确定所有汉字复合物的读数,因为我有假名的完整句子/单词/表达。

我有: kanji = 私は学生です
kana = わたしはがくせいです

我想自动分配
私到わたし

学生到がくせい。

我尝试遍历汉字字符串并检查假名和汉字之间的字符是否“改变”,然后查找直到假名字符串中的这个位置。这种方法适用于所有没有汉字后跟平假名音节的句子,平假名音节与汉字阅读结束时相同。
我的另一个想法是替换假名中汉字串中的所有平假名化合物,并将左侧的假名化合物作为汉字的读数。这显然不适用于每种情况。

我怎样才能写出这样一个算法,在任何情况下都适用?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)