作为标题,我想知道是否有一种方便的方法可以从汉字中获取平假名文本,然后自动将其插入到汉字上方(如furigana)。
例如,我的数据库:
1 | 私はA-sanです。
我想在网站上显示如下文本:
我正在编写php代码,下面是我的想法
function modify_text($text) {
foreach ($word in text){
if ($word is kanji){
//find hiragana
//do html to convert text to furigana
我试图使用regex来匹配满足以下条件的东西:
不包含"//“字符串
含汉字
捡起那些汉字
我从一个文件中逐行读取:
f = open("test.js", 'r')
lines = f.readlines()
for line in lines:
matches = regex.findall(line)
if matches:
print(matches)
首先,我尝试使用以下模式来匹配汉字:
re.compile(r"[\u4e00-\u9fff]+")
它可以工作,并给我输出: