From bd9d0cded144e58ae7b56488aa1558838d7933e8 Mon Sep 17 00:00:00 2001
From: Alan Jui <AlanJui.1960@gmail.com>
Date: Fri, 8 Mar 2024 22:03:52 +0800
Subject: [PATCH] =?UTF-8?q?=E9=87=8D=E6=A7=8B=E5=BD=99=E6=95=B4=E6=96=B0?=
 =?UTF-8?q?=E6=A8=99=E9=9F=B3=E7=94=A8=E6=A8=A1=E7=B5=84=E3=80=82?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 mod_Han_Ji_Piau_Tsu_Im.py | 676 ++++++++++++++++++++++++++++++++++++++
 1 file changed, 676 insertions(+)
 create mode 100644 mod_Han_Ji_Piau_Tsu_Im.py

diff --git a/mod_Han_Ji_Piau_Tsu_Im.py b/mod_Han_Ji_Piau_Tsu_Im.py
new file mode 100644
index 0000000..10163af
--- /dev/null
+++ b/mod_Han_Ji_Piau_Tsu_Im.py
@@ -0,0 +1,676 @@
+# 漢字標注音
+import re
+import pandas as pd
+
+
+#==========================================================
+# 將「台羅拼音」(TL-Ping-Im) 分解成： 聲母、韻母和調號.
+#----------------------------------------------------------
+# 1. 使用正則表達式（regular expression）匹配聲母。這裡，聲母是由
+#    特定字符組成的，例如 "b", "tsh", "ts" 等。
+#
+# 2. 韻母是在聲母之後、調號之前的部分。為了找到韻母，我們首先計算聲母的
+#    長度（len(siann_bu)），然後從音節的開頭去掉聲母部分，並在音節的
+#    末尾去掉調號部分。
+#
+# 3. 調號是音節最後一個字符。
+#
+# 4. 調號可省略規則：
+#    當「韻母」為「舒聲韻」時，若「聲調」未標示，則代表「第一聲」；
+#    當「韻母」為「入聲韻」時，若「聲調」未標示，則代表「第四聲」。
+#==========================================================
+
+def within_tiau_ho(ping_im):
+    """
+    判斷注音符號中是否含有「聲調」.
+
+    若最後一個字元不是數值，表示使用者可能引用「略去聲調」不寫規則.
+    """
+    last_char = ping_im[-1]
+    return last_char.isdigit()
+
+
+def TL_Tshiat_Siann_Un_Tiau(ping_im):
+    # 正規表達式，用於表達所有可能的聲母。
+    siann_pattern = re.compile(r"(b|tsh|ts|g|h|j|kh|k|l|m|ng|n|ph|p|s|th|t|q)?")
+    # 透過 match 方法，找到「注音」之中的「聲母」。然後再利用 group
+    # 方法，將注音群分「聲母」與「韻母」。
+    siann_match = siann_pattern.match(ping_im)
+
+    if siann_match:
+        siann_bu = siann_match.group()
+    else:
+        siann_bu = ""
+
+    # 依據「注音符號」中是否有含「聲調」，決定取得韻母與調號的方式。
+    valid_un_bu_endings = [
+        'un', 'ian', 'im', 'ui', 'ee', 'an', 'ong', 'uai', 'ing', 'uan',
+        'oo', 'iau', 'ei', 'iong', 'o', 'ai', 'in', 'iang', 'am', 'ua',
+        'ang', 'iam', 'au', 'ia', 'ue', 'ann', 'u', 'a', 'i', 'iu', 'enn',
+        'uinn', 'io', 'inn', 'ionn', 'iannh', 'uann', 'ng', 'e', 'ainn',
+        'onn', 'm', 'uang', 'uainn', 'uenn', 'iaunn', 'om', 'aunn', 'onn',
+        'iunn'
+    ]
+
+    if within_tiau_ho(ping_im):
+        # 若注音符號最後一個字元為「數值」，表「聲調」。即
+        un_bu = ping_im[len(siann_bu): -1]
+        tiau = ping_im[-1]
+    else:
+        un_bu = ping_im[len(siann_bu):]
+        if un_bu in valid_un_bu_endings:
+            tiau = '1'
+        else:
+            tiau = '4'
+
+    result = []
+    result += [siann_bu]
+    result += [un_bu]
+    result += [tiau]
+    return result
+
+#==========================================================
+# 自漢字的「注音碼」，分析出：聲母、韻母、調號
+#==========================================================
+
+#siann_pattern_POJ = re.compile(r"(b|chh|ch|g|h|j|kh|k|l|m|ng|n|ph|p|s|th|t|q)")
+siann_pattern = re.compile(r"(b|tsh|ts|g|h|j|kh|k|l|m|ng|n|ph|p|s|th|t|q)")
+
+def split_chu_im(chu_im):
+    result = []
+
+    siann_bu = siann_pattern.match(chu_im).group()
+    un_bu = chu_im[ len(siann_bu):len(chu_im)-1 ]
+    diau = chu_im[ len(chu_im)-1 ]
+
+    result += [siann_bu]
+    result += [un_bu]
+    result += [diau]
+    return result
+
+
+#==========================================================
+# 韻母處理
+#==========================================================
+un_mu_dict = {
+    'sip_ngoo_im_un_id': ['1', '1', '2', '2', '3', '3', '4', '4', '5', '5', '6', '6', '7', '7', '8', '8', '9', '9', '10', '10', '11', '11', '12', '12', '13', '13', '14', '14', '15', '15', '16', '16', '17', '17', '18', '18', '19', '19', '20', '20', '21', '21', '22', '22', '23', '23', '24', '24', '25', '25', '26', '26', '27', '27', '28', '28', '29', '29', '30', '30', '31', '31', '32', '32', '33', '33', '34', '34', '35', '35', '36', '36', '37', '37', '38', '38', '39', '39', '40', '40', '41', '41', '42', '42', '43', '43', '44', '44', '45', '45', '46', '46', '47', '47', '48', '48', '49', '49', '50', '50'],
+    'sip_ngoo_im': ['君', '君', '堅', '堅', '金', '金', '規', '規', '嘉', '嘉', '干', '干', '公', '公', '乖', '乖', '經', '經', '觀', '觀', '沽', '沽', '嬌', '嬌', '稽', '稽', '恭', '恭', '高', '高', '皆', '皆', '巾', '巾', '姜', '姜', '甘', '甘', '瓜', '瓜', '江', '江', '兼', '兼', '交', '交', '迦', '迦', '檜', '檜', '監', '監', '艍', '艍', '膠', '膠', '居', '居', '丩', '丩', '更', '更', '褌', '褌', '茄', '茄', '梔', '梔', '薑', '薑', '驚', '驚', '官', '官', '鋼', '鋼', '伽', '伽', '閒', '閒', '姑', '姑', '姆', '姆', '光', '光', '閂', '閂', '糜', '糜', '嘄', '嘄', '箴', '箴', '爻', '爻', '扛', '扛', '牛', '牛'],
+    'un_code': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'ee', 'eeh', 'an', 'at', 'ong', 'ok', 'uai', 'uaih', 'ing', 'ik', 'uan', 'uat', 'oo', 'ooh', 'iau', 'iauh', 'ei', 'eih', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'ua', 'uah', 'ang', 'ak', 'iam', 'iap', 'au', 'auh', 'ia', 'iah', 'ue', 'ueh', 'ann', 'ahnn', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'enn', 'ehnn', 'uinn', 'uinnh', 'io', 'ioh', 'inn', 'ihnn', 'ionn', 'ionnh', 'iann', 'iannh', 'uann', 'uannh', 'ng', 'ngh', 'e', 'eh', 'ainn', 'ainnh', 'onn', 'onnh', 'm', 'mh', 'uang', 'uak', 'uainn', 'uaihnn', 'uenn', 'uennh', 'iaunn', 'iauhnn', 'om', 'op', 'aunn', 'aunnh', 'onn', 'ohnn', 'iunn', 'iunnh'],
+    'TPS': ['ㄨㄣ', 'ㄨㆵ', 'ㄧㄢ', 'ㄧㄚㆵ', 'ㄧㆬ', 'ㄧㆴ', 'ㄨㄧ', 'ㄨㄧㆷ', 'ㄝ', 'ㄝㆷ', 'ㄢ', 'ㄚㆵ', 'ㆲ', 'ㆦㆻ', 'ㄨㄞ', 'ㄨㄞㆷ', 'ㄧㄥ', 'ㄧㆻ', 'ㄨㄢ', 'ㄨㄚㆵ', 'ㆦ', 'ㆦㆷ', 'ㄧㄠ', 'ㄧㄠㆷ', 'ㄟ', 'ㄟㆷ', 'ㄧㆲ', 'ㄧㆦㆻ', 'ㄜ', 'ㄜㆷ', 'ㄞ', 'ㄞㆷ', 'ㄧㄣ', 'ㄧㆵ', 'ㄧㄤ', 'ㄧㄚㆻ', 'ㆰ', 'ㄚㆴ', 'ㄨㄚ', 'ㄨㄚㆷ', 'ㄤ', 'ㄚㆻ', 'ㄧㆰ', 'ㄧㄚㆴ', 'ㄠ', 'ㄠㆷ', 'ㄧㄚ', 'ㄧㄚㆷ', 'ㄨㆤ', 'ㄨㆤㆷ', 'ㆩ', 'ㆩㆷ', 'ㄨ', 'ㄨㆷ', 'ㄚ', 'ㄚㆷ', 'ㄧ', 'ㄧㆷ', 'ㄧㄨ', 'ㄧㄨㆷ', 'ㆥ', 'ㆥㆷ', 'ㄨㆪ', 'ㄨㆪㆷ', 'ㄧㄜ', 'ㄧㄜㆷ', 'ㆪ', 'ㆪ', 'ㄧㆧ', 'ㄧㆧㆷ', 'ㄧㆩ', 'ㄧㆩㆷ', 'ㄨㆩ', 'ㄨㆩㆷ', 'ㆭ', 'ㆭㆷ', 'ㆤ', 'ㆤㆷ', 'ㆮ', 'ㆮㆷ', 'ㆧ', 'ㆧㆷ', 'ㆬ', 'ㆬㆷ', 'ㄨㄤ', 'ㄨㄚㆻ', 'ㄨㆮ', 'ㄨㆮㆷ', 'ㄨㆥ', 'ㄨㆥㆷ', 'ㄧㆯ', 'ㄧㆯㆷ', 'ㆱ', 'ㆦㆴ', 'ㆯ', 'ㆯㆷ', 'ㆧ', 'ㆧㆷ', 'ㄧㆫ', 'ㄧㆫㆷ'],
+    'IPA': ['un', 'ut̚', 'ian', 'iat̚', 'im', 'ip̚', 'ui', 'ui?', 'ɛ', 'ɛ?', 'an', 'at̚', 'ɔŋ', 'ɔk̚', 'uai', 'uai?', 'ɪŋ', 'ik̚', 'uan', 'uat̚', 'ɔ', 'ɔu?', 'iaʊ', 'iau?', 'ei', 'ei?', 'iɔŋ', 'iɔk̚', 'o', 'ə?', 'ai', 'ai?', 'in', 'it̚', 'iaŋ', 'iak̚', 'am', 'ap̚', 'ua', 'ua?', 'aŋ', 'ak̚', 'iam', 'iap̚', 'aʊ', 'au?', 'ia', 'ia?', 'ue', 'ue?', 'ã', 'ã?', 'u', 'u?', 'a', 'a?', 'i', 'i?', 'iu', 'iu?', 'ẽ', 'ẽ?', 'ũĩ', 'ũĩ?', 'io', 'iə?', 'ĩ', 'ĩ?', 'ĩɔ̃', 'ĩɔ̃?', 'ĩã', 'iãh', 'ũã', 'ũã?', 'ŋ̍', 'ŋ̍h', 'e', 'e?', 'ãĩ', 'ãĩ?', 'ɔ̃', 'ɔ̃?', 'm̩', 'm̩h', 'uaŋ', 'uak̚', 'ũãĩ', 'uãĩ?', 'ũẽ', 'ũẽ?', 'ĩãũ', 'ĩãũ?', 'ɔm', 'ɔp̚', 'ãũ', 'ãũ?', 'õ', 'õh', 'ĩũ', 'iũh'],
+    'POJ': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'ee', 'eeh', 'an', 'at', 'ong', 'ok', 'oai', 'oaih', 'eng', 'ek', 'oan', 'oat', 'o͘', 'o͘h', 'iau', 'iauh', 'ei', 'eih', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'oa', 'oah', 'ang', 'ak', 'iam', 'iap', 'au', 'auh', 'ia', 'iah', 'oe', 'oeh', 'aⁿ', 'ahⁿ', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'eⁿ', 'ehⁿ', 'uiⁿ', 'uihⁿ', 'io', 'ioh', 'iⁿ', 'iⁿh', 'ioⁿ', 'iohⁿ', 'iaⁿ', 'iahⁿ', 'oaⁿ', 'oahⁿ', 'ng', 'ngh', 'e', 'eh', 'aiⁿ', 'aihⁿ', 'oⁿ', 'ohⁿ', 'm', 'mh', 'oang', 'oak', 'oaiⁿ', 'oaiⁿh', 'oeⁿ', 'oehⁿ', 'iauⁿ', 'iauⁿh', 'om', 'op', 'auⁿ', 'auhⁿ', 'oⁿ', 'ohⁿ', 'iuⁿ', 'iuhⁿ'],
+    'TL': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'ee', 'eh', 'an', 'ap', 'ong', 'ok', 'uai', 'uaih', 'ing', 'ik', 'uan', 'uat', 'oo', 'ooh', 'iau', 'iauh', 'e', 'eh', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'ua', 'uah', 'ang', 'ak', 'iam', 'iap', 'au', 'auh', 'ia', 'iah', 'ue', 'ueh', 'ann', 'annh', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'enn', 'ennh', 'uinn', 'uinnh', 'io', 'ioh', 'inn', 'innh', 'ionn', 'ionnh', 'iann', 'iannh', 'uann', 'uannh', 'ng', 'ngh', 'e', 'eh', 'ainn', 'ainnh', 'onn', 'onnh', 'm', 'mh', 'uang', 'uak', 'uainn', 'uainnh', 'uenn', 'uennh', 'iaunn', 'iaunnh', 'om', 'op', 'aunn', 'aunnh', 'onn', 'onnh', 'iunn', 'iunnh'],
+    'BP': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'e', 'eh', 'an', 'at', 'ong', 'ok', 'uai', 'uaih', 'ing', 'ik', 'uan', 'uat', 'oo', 'ooh', 'iao', 'iaoh', 'e', 'eh', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'ua', 'uah', 'ang', 'ak', 'iam', 'iap', 'ao', 'aoh', 'ia', 'iah', 'ue', 'ueh', 'na', 'nah', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'ne', 'neh', 'nui', 'nuih', 'io', 'ioh', 'ni', 'nih', 'nioo', 'niooh', 'nia', 'niah', 'nua', 'nuah', 'ng', 'ngh', 'e', 'eh', 'nai', 'naih', 'noo', 'nooh', 'm', 'mh', 'uang', 'uak', 'nuai', 'nuaih', 'nue', 'nueh', 'niao', 'niaoh', 'om', 'op', 'nao', 'naoh', 'no', 'noh', 'niu', 'niuh'],
+}
+df_un_bu = pd.DataFrame(un_mu_dict)
+# un_mu_dict = {
+#     'un_code': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'ee', 'eeh', 'an', 'at', 'ong', 'ok', 'oai', 'oaih', 'eng', 'ek', 'oan', 'oat', 'oo', 'ooh', 'iau', 'iauh', 'ei', 'eih', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'oa', 'oah', 'ang', 'ak', 'iam', 'iap', 'au', 'auh', 'ia', 'iah', 'oe', 'oeh', 'ann', 'ahnn', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'enn', 'ehnn', 'uinn', 'uinnh', 'io', 'ioh', 'inn', 'ihnn', 'ionn', 'ionnh', 'iann', 'iannh', 'oann', 'oannh', 'ng', 'ngh', 'e', 'eh', 'ainn', 'ainnh', 'onn', 'onnh', 'm', 'mh', 'oang', 'oak', 'oainn', 'oaihnn', 'oenn', 'oennh', 'iaunn', 'iauhnn', 'om', 'op', 'aunn', 'aunnh', 'onn', 'ohnn', 'iunn', 'iunnh'],
+#     'IPA': ['un', 'ut̚', 'ian', 'iat̚', 'im', 'ip̚', 'ui', 'ui?', 'ɛ', 'ɛ?', 'an', 'at̚', 'ɔŋ', 'ɔk̚', 'uai', 'uai?', 'ɪŋ', 'ik̚', 'uan', 'uat̚', 'ɔ', 'ɔu?', 'iaʊ', 'iau?', 'ei', 'ei?', 'iɔŋ', 'iɔk̚', 'o', 'ə?', 'ai', 'ai?', 'in', 'it̚', 'iaŋ', 'iak̚', 'am', 'ap̚', 'ua', 'ua?', 'aŋ', 'ak̚', 'iam', 'iap̚', 'aʊ', 'au?', 'ia', 'ia?', 'ue', 'ue?', 'ã', 'ã?', 'u', 'u?', 'a', 'a?', 'i', 'i?', 'iu', 'iu?', 'ẽ', 'ẽ?', 'ũĩ', 'ũĩ?', 'io', 'iə?', 'ĩ', 'ĩ?', 'ĩɔ̃', 'ĩɔ̃?', 'ĩã', 'iãh', 'ũã', 'ũã?', 'ŋ̍', 'ŋ̍h', 'e', 'e?', 'ãĩ', 'ãĩ?', 'ɔ̃', 'ɔ̃?', 'm̩', 'm̩h', 'uaŋ', 'uak̚', 'ũãĩ', 'uãĩ?', 'ũẽ', 'ũẽ?', 'ĩãũ', 'ĩãũ?', 'ɔm', 'ɔp̚', 'ãũ', 'ãũ?', 'õ', 'õh', 'ĩũ', 'iũh'],
+#     'sip_ngoo_im': ['君', '君', '堅', '堅', '金', '金', '規', '規', '嘉', '嘉', '干', '干', '公', '公', '乖', '乖', '經', '經', '觀', '觀', '沽', '沽', '嬌', '嬌', '稽', '稽', '恭', '恭', '高', '高', '皆', '皆', '巾', '巾', '姜', '姜', '甘', '甘', '瓜', '瓜', '江', '江', '兼', '兼', '交', '交', '迦', '迦', '檜', '檜', '監', '監', '艍', '艍', '膠', '膠', '居', '居', '丩', '丩', '更', '更', '褌', '褌', '茄', '茄', '梔', '梔', '薑', '薑', '驚', '驚', '官', '官', '鋼', '鋼', '伽', '伽', '閒', '閒', '姑', '姑', '姆', '姆', '光', '光', '閂', '閂', '糜', '糜', '嘄', '嘄', '箴', '箴', '爻', '爻', '扛', '扛', '牛', '牛'],
+#     'POJ': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'ee', 'eeh', 'an', 'at', 'ong', 'ok', 'oai', 'oaih', 'eng', 'ek', 'oan', 'oat', 'o͘', 'o͘h', 'iau', 'iauh', 'ei', 'eih', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'oa', 'oah', 'ang', 'ak', 'iam', 'iap', 'au', 'auh', 'ia', 'iah', 'oe', 'oeh', 'aⁿ', 'ahⁿ', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'eⁿ', 'ehⁿ', 'uiⁿ', 'uihⁿ', 'io', 'ioh', 'iⁿ', 'iⁿh', 'ioⁿ', 'iohⁿ', 'iaⁿ', 'iahⁿ', 'oaⁿ', 'oahⁿ', 'ng', 'ngh', 'e', 'eh', 'aiⁿ', 'aihⁿ', 'oⁿ', 'ohⁿ', 'm', 'mh', 'oang', 'oak', 'oaiⁿ', 'oaiⁿh', 'oeⁿ', 'oehⁿ', 'iauⁿ', 'iauⁿh', 'om', 'op', 'auⁿ', 'auhⁿ', 'oⁿ', 'ohⁿ', 'iuⁿ', 'iuhⁿ'],
+#     'TL': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'ee', 'eh', 'an', 'ap', 'ong', 'ok', 'uai', 'uaih', 'ing', 'ik', 'uan', 'uat', 'oo', 'ooh', 'iau', 'iauh', 'e', 'eh', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'ua', 'uah', 'ang', 'ak', 'iam', 'iap', 'au', 'auh', 'ia', 'iah', 'ue', 'ueh', 'ann', 'annh', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'enn', 'ennh', 'uinn', 'uinnh', 'io', 'ioh', 'inn', 'innh', 'ionn', 'ionnh', 'iann', 'iannh', 'uann', 'uannh', 'ng', 'ngh', 'e', 'eh', 'ainn', 'ainnh', 'onn', 'onnh', 'm', 'mh', 'uang', 'uak', 'uainn', 'uainnh', 'uenn', 'uennh', 'iaunn', 'iaunnh', 'om', 'op', 'aunn', 'aunnh', 'onn', 'onnh', 'iunn', 'iunnh'],
+#     'BP': ['un', 'ut', 'ian', 'iat', 'im', 'ip', 'ui', 'uih', 'e', 'eh', 'an', 'at', 'ong', 'ok', 'uai', 'uaih', 'ing', 'ik', 'uan', 'uat', 'oo', 'ooh', 'iao', 'iaoh', 'e', 'eh', 'iong', 'iok', 'o', 'oh', 'ai', 'aih', 'in', 'it', 'iang', 'iak', 'am', 'ap', 'ua', 'uah', 'ang', 'ak', 'iam', 'iap', 'ao', 'aoh', 'ia', 'iah', 'ue', 'ueh', 'na', 'nah', 'u', 'uh', 'a', 'ah', 'i', 'ih', 'iu', 'iuh', 'ne', 'neh', 'nui', 'nuih', 'io', 'ioh', 'ni', 'nih', 'nioo', 'niooh', 'nia', 'niah', 'nua', 'nuah', 'ng', 'ngh', 'e', 'eh', 'nai', 'naih', 'noo', 'nooh', 'm', 'mh', 'uang', 'uak', 'nuai', 'nuaih', 'nue', 'nueh', 'niao', 'niaoh', 'om', 'op', 'nao', 'naoh', 'no', 'noh', 'niu', 'niuh'],
+#     'TPS': ['ㄨㄣ', 'ㄨㆵ', 'ㄧㄢ', 'ㄧㄚㆵ', 'ㄧㆬ', 'ㄧㆴ', 'ㄨㄧ', 'ㄨㄧㆷ', 'ㄝ', 'ㄝㆷ', 'ㄢ', 'ㄚㆵ', 'ㆲ', 'ㆦㆻ', 'ㄨㄞ', 'ㄨㄞㆷ', 'ㄧㄥ', 'ㄧㆻ', 'ㄨㄢ', 'ㄨㄚㆵ', 'ㆦ', 'ㆦㆷ', 'ㄧㄠ', 'ㄧㄠㆷ', 'ㄟ', 'ㄟㆷ', 'ㄧㆲ', 'ㄧㆦㆻ', 'ㄜ', 'ㄜㆷ', 'ㄞ', 'ㄞㆷ', 'ㄧㄣ', 'ㄧㆵ', 'ㄧㄤ', 'ㄧㄚㆻ', 'ㆰ', 'ㄚㆴ', 'ㄨㄚ', 'ㄨㄚㆷ', 'ㄤ', 'ㄚㆻ', 'ㄧㆰ', 'ㄧㄚㆴ', 'ㄠ', 'ㄠㆷ', 'ㄧㄚ', 'ㄧㄚㆷ', 'ㄨㆤ', 'ㄨㆤㆷ', 'ㆩ', 'ㆩㆷ', 'ㄨ', 'ㄨㆷ', 'ㄚ', 'ㄚㆷ', 'ㄧ', 'ㄧㆷ', 'ㄧㄨ', 'ㄧㄨㆷ', 'ㆥ', 'ㆥㆷ', 'ㄨㆪ', 'ㄨㆪㆷ', 'ㄧㄜ', 'ㄧㄜㆷ', 'ㆪ', 'ㆪ', 'ㄧㆧ', 'ㄧㆧㆷ', 'ㄧㆩ', 'ㄧㆩㆷ', 'ㄨㆩ', 'ㄨㆩㆷ', 'ㆭ', 'ㆭㆷ', 'ㆤ', 'ㆤㆷ', 'ㆮ', 'ㆮㆷ', 'ㆧ', 'ㆧㆷ', 'ㆬ', 'ㆬㆷ', 'ㄨㄤ', 'ㄨㄚㆻ', 'ㄨㆮ', 'ㄨㆮㆷ', 'ㄨㆥ', 'ㄨㆥㆷ', 'ㄧㆯ', 'ㄧㆯㆷ', 'ㆱ', 'ㆦㆴ', 'ㆯ', 'ㆯㆷ', 'ㆧ', 'ㆧㆷ', 'ㄧㆫ', 'ㄧㆫㆷ'],
+#     'sip_ngoo_im_id': ['1', '1', '2', '2', '3', '3', '4', '4', '5', '5', '6', '6', '7', '7', '8', '8', '9', '9', '10', '10', '11', '11', '12', '12', '13', '13', '14', '14', '15', '15', '16', '16', '17', '17', '18', '18', '19', '19', '20', '20', '21', '21', '22', '22', '23', '23', '24', '24', '25', '25', '26', '26', '27', '27', '28', '28', '29', '29', '30', '30', '31', '31', '32', '32', '33', '33', '34', '34', '35', '35', '36', '36', '37', '37', '38', '38', '39', '39', '40', '40', '41', '41', '42', '42', '43', '43', '44', '44', '45', '45', '46', '46', '47', '47', '48', '48', '49', '49', '50', '50'],
+# }
+
+# 自 DataFrame 取出，欄標題名為：un_code 的部份，並將之轉換成 list
+un_list = df_un_bu["un_code"].values.tolist()
+sip_ngoo_im_un_bu_list = df_un_bu["sip_ngoo_im_un_id"].values.tolist()
+sip_ngoo_im_un_bu = df_un_bu["sip_ngoo_im"].values.tolist()
+
+tiau_hu_dict = {
+    1: "",
+    2: "\u0301",
+    3: "\u0300",
+    4: "",
+    5: "\u0302",
+    6: "\u030C",
+    7: "\u0304",
+    8: "\u030D",
+    9: "\u030B",
+}
+
+#==========================================================
+# 找韻母的「索引編號」
+#==========================================================
+
+def get_un_idx(un_bu):
+    try:
+        un_idx = un_list.index(un_bu)
+    except ValueError:
+        un_idx = -1
+        print(f'Un-bu: {un_bu} does not exist')
+
+    return un_idx
+
+def get_sip_ngoo_im_idx(un_bu_index):
+    try:
+        sip_ngoo_im_idx = int(sip_ngoo_im_un_bu_list[un_bu_index])
+    except ValueError:
+        sip_ngoo_im_idx = -1
+        print(f'Sip-Ngoo-Im-Un-Bu Index: "{un_bu_index}" does not exist')
+
+    return sip_ngoo_im_idx
+
+
+
+#==========================================================
+# 聲母處理
+#==========================================================
+siann_bu_dict = {
+    'siann_id': ['1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18'],
+    'sip_ngoo_im_siann_id': ['l', 'n', 'p', 'k', 'kh', 't', 'ph', 'th', 'ts', 'j', 's', 'q', 'b', 'm', 'g', 'ng', 'tsh', 'h'],
+    'sip_ngoo_im': ['柳', '柳', '邊', '求', '去', '地', '頗', '他', '曾', '入', '時', '英', '門', '門', '語', '語', '出', '喜'],
+    'siann_code': ['l', 'n', 'p', 'k', 'kh', 't', 'ph', 'th', 'ts', 'j', 's', 'q', 'b', 'm', 'g', 'ng', 'tsh', 'h'],
+    'IPA': ['l', 'n', 'p', 'k', 'kʰ', 't', 'pʰ', 'tʰ', 'ʦ', 'ʣ', 's', ' ', 'b', 'm', 'ɡ', 'ŋ', 'ʦʰ', 'h'],
+    'TPS': ['ㄌ', 'ㄋ', 'ㄅ', 'ㄍ', 'ㄎ', 'ㄉ', 'ㄆ', 'ㄊ', 'ㄗ', 'ㆡ', 'ㄙ', ' ', 'ㆠ', 'ㄇ', 'ㆣ', 'ㄫ', 'ㄘ', 'ㄏ'],
+    'POJ': ['l', 'n', 'p', 'k', 'kh', 't', 'ph', 'th', 'ch', 'j', 's', ' ', 'b', 'm', 'g', 'ng', 'chh', 'h'],
+    'TL': ['l', 'n', 'p', 'k', 'kh', 't', 'ph', 'th', 'ts', 'j', 's', ' ', 'b', 'm', 'g', 'ng', 'tsh', 'h'],
+    'BP': ['l', 'ln', 'b', 'g', 'k', 'd', 'p', 't', 'z', 'zz', 's', ' ', 'bb', 'bbn', 'gg', 'ggn', 'c', 'h'],
+}
+df_siann_bu = pd.DataFrame(siann_bu_dict)
+# siann_bu_dict = {
+#     'siann_code': [ 'b', 'ch', 'chh', 'g', 'h', 'j', 'k', 'kh', 'l', 'm', 'n', 'ng', 'p', 'ph', 's', 't', 'th', 'q'],
+#     'IPA': [ 'b', 'ʦ', 'ʦʰ', 'ɡ', 'h', 'ʣ', 'k', 'kʰ', 'l', 'm', 'n', 'ŋ', 'p', 'pʰ', 's', 't', 'tʰ', ' '],
+#     'sip_ngoo_im': [ '門', '曾', '出', '語', '喜', '入', '求', '去', '柳', '毛', '耐', '雅', '邊', '頗', '時', '地', '他', '英'],
+#     'POJ': [ 'b', 'ch', 'chh', 'g', 'h', 'j', 'k', 'kh', 'l', 'm', 'n', 'ng', 'p', 'ph', 's', 't', 'th', ' '],
+#     'TL': [ 'b', 'ts', 'tsh', 'g', 'h', 'j', 'k', 'kh', 'l', 'm', 'n', 'ng', 'p', 'ph', 's', 't', 'th', ' '],
+#     'BP': [ 'bb', 'z', 'c', 'gg', 'h', 'zz', 'g', 'k', 'l', 'bbn', 'ln', 'ggn', 'b', 'p', 's', 'd', 't', ' '],
+#     'TPS': [ 'ㆠ', 'ㄗ', 'ㄘ', 'ㆣ', 'ㄏ', 'ㆡ', 'ㄍ', 'ㄎ', 'ㄌ', 'ㄇ', 'ㄋ', 'ㄫ', 'ㄅ', 'ㄆ', 'ㄙ', 'ㄉ', 'ㄊ', ' '],
+# }
+
+# 自 DataFrame 取出，欄標題名為：siann_code 的部份，並將之轉換成 list
+siann_list = df_siann_bu["siann_code"].values.tolist()
+sip_ngoo_im_siann_bu = df_siann_bu["sip_ngoo_im"].values.tolist()
+
+#==========================================================
+# 找聲母的「索引編號」
+#==========================================================
+
+def get_siann_idx(siann_bu):
+    siann_idx = siann_list.index(siann_bu)
+
+    return siann_idx
+
+
+# 將字串轉換成 List
+# Python code to convert string to list character-wise
+def convert_string_to_list(string):
+    list1=[]
+    list1[:0]=string
+    return list1
+
+
+"""
+十五音注音
+"""
+
+sip_ngoo_im_un_bu_2_un_code_dict = {
+    '君' : [ 'un', 'ut' ],
+    '堅' : [ 'ian', 'iat' ],
+    '金' : [ 'im', 'ip' ],
+    '規' : [ 'ui', 'uih' ],
+    '嘉' : [ 'ee', 'eeh' ],
+    '干' : [ 'an', 'at' ],
+    '公' : [ 'ong', 'ok' ],
+    '乖' : [ 'uai', 'uaih' ],
+    '經' : [ 'ing', 'ik' ],
+    '觀' : [ 'uan', 'uat' ],
+    '沽' : [ 'oo', 'ooh' ],
+    '嬌' : [ 'iau', 'iauh' ],
+    '稽' : [ 'ei', 'eih' ],
+    '恭' : [ 'iong', 'iok' ],
+    '高' : [ 'o', 'oh' ],
+    '皆' : [ 'ai', 'aih' ],
+    '巾' : [ 'in', 'it' ],
+    '姜' : [ 'iang', 'iak' ],
+    '甘' : [ 'am', 'ap' ],
+    '瓜' : [ 'ua', 'uah' ],
+    '江' : [ 'ang', 'ak' ],
+    '兼' : [ 'iam', 'iap' ],
+    '交' : [ 'au', 'auh' ],
+    '迦' : [ 'ia', 'iah' ],
+    '檜' : [ 'ue', 'ueh' ],
+    '監' : [ 'ann', 'ahnn' ],
+    '艍' : [ 'u', 'uh' ],
+    '膠' : [ 'a', 'ah' ],
+    '居' : [ 'i', 'ih' ],
+    '丩' : [ 'iu', 'iuh' ],
+    '更' : [ 'enn', 'ehnn' ],
+    '褌' : [ 'uinn', 'uinnh' ],
+    '茄' : [ 'io', 'ioh' ],
+    '梔' : [ 'inn', 'ihnn' ],
+    '薑' : [ 'ionn', 'ionnh' ],
+    '驚' : [ 'iann', 'iannh' ],
+    '官' : [ 'uann', 'uannh' ],
+    '鋼' : [ 'ng', 'ngh' ],
+    '伽' : [ 'e', 'eh' ],
+    '閒' : [ 'ainn', 'ainnh' ],
+    '姑' : [ 'onn', 'onnh' ],
+    '姆' : [ 'm', 'mh' ],
+    '光' : [ 'uang', 'uak' ],
+    '閂' : [ 'uainn', 'uaihnn' ],
+    '糜' : [ 'uenn', 'uennh' ],
+    '嘄' : [ 'iaunn', 'iauhnn' ],
+    '箴' : [ 'om', 'op' ],
+    '爻' : [ 'aunn', 'aunnh' ],
+    '扛' : [ 'onn', 'ohnn' ],
+    '牛' : [ 'iunn', 'iunnh' ],
+}
+
+sip_ngoo_im_tiau_dict = {
+    1: "一",
+    2: "二",
+    3: "三",
+    4: "四",
+    5: "五",
+    7: "七",
+    8: "八",
+}
+
+sip_ngoo_im_trandication_tiau_dict = {
+    "上平": 1,
+    "上上": 2,
+    "上去": 3,
+    "上入": 4,
+    "下平": 5,
+    "下上": 6,
+    "下去": 7,
+    "下入": 8,
+}
+
+def get_siann_code_by_siann_bu(sian_bu):
+    index = sip_ngoo_im_siann_bu.index(sian_bu)
+    return siann_list[index]
+
+def get_un_code_by_un_bu(un_bu, tiau):
+    if tiau == 4 or tiau == 8:
+        # 韻母為入聲韻
+        un_bu_code = sip_ngoo_im_un_bu_2_un_code_dict[un_bu][1]
+    else:
+        # 韻母為舒聲韻
+        un_bu_code = sip_ngoo_im_un_bu_2_un_code_dict[un_bu][0]
+    return un_bu_code
+
+def convert_trandication_tiau(tiau):
+    return sip_ngoo_im_trandication_tiau_dict[tiau]
+
+def get_sip_ngoo_im_un_bu(idx):
+    return df_un_bu["sip_ngoo_im"][idx]
+
+def get_sip_ngoo_im_siann_bu(idx):
+    return df_siann_bu["sip_ngoo_im"][idx]
+
+def get_sip_ngoo_im_tiau_ho(idx):
+    return sip_ngoo_im_tiau_dict[idx]
+
+def get_sip_ngoo_im_chu_im(siann_idx, un_idx, tiau_ho):
+    sni_un = get_sip_ngoo_im_un_bu(un_idx)
+    sni_tiau = get_sip_ngoo_im_tiau_ho(int(tiau_ho))
+    sni_siann = get_sip_ngoo_im_siann_bu(siann_idx)
+
+    return(f"{sni_un}{sni_tiau}{sni_siann}")
+
+"""
+方音符號(TPS)
+"""
+
+TPS_mapping_dict = {
+    'p': 'ㆴ˙',
+    't': 'ㆵ˙',
+    'k': 'ㆻ˙',
+    'h': 'ㆷ˙',
+}
+
+TPS_remap_dict = {
+    'ㄗㄧ': 'ㄐㄧ',
+    'ㄘㄧ': 'ㄑㄧ',
+    'ㄙㄧ': 'ㄒㄧ',
+    'ㆡㄧ': 'ㆢㄧ',
+}
+
+TPS_tiau_dict = {
+    1: "",
+    2: "ˋ",
+    3: "˪",
+    4: "",
+    5: "ˊ",
+    7: "˫",
+    8: "\u02D9",
+}
+
+def get_TPS_un_bu(idx):
+    return df_un_bu["TPS"][idx]
+
+def get_TPS_siann_bu(idx):
+    return df_siann_bu["TPS"][idx]
+
+def get_TPS_tiau_ho(idx):
+    return TPS_tiau_dict[idx]
+
+def get_TPS_chu_im(siann_idx, un_idx, tiau_ho):
+    sni_un = get_TPS_un_bu(un_idx)
+    sni_tiau = get_TPS_tiau_ho(int(tiau_ho))
+    sni_siann = get_TPS_siann_bu(siann_idx)
+
+    TPS_chu_im = f"{sni_siann}{sni_un}{sni_tiau}"
+
+    pattern = r"(ㄗㄧ|ㄘㄧ|ㄙㄧ|ㆡㄧ)"
+    searchObj = re.search( pattern, TPS_chu_im, re.M|re.I)
+    if searchObj:
+        key_value = searchObj.group(1)
+        TPS_chu_im = TPS_chu_im.replace(key_value,
+                                        TPS_remap_dict[key_value])
+
+    return TPS_chu_im
+
+"""
+白話字（POJ）
+順序：《o＞e＞a＞u＞i＞ng＞m》；而 ng 標示在字母 n 上。
+例外
+oai、oan、oat、oah 標在 a 上。
+oeh 標在 e 上。
+"""
+pattern1 = r"(oai|oan|oah|oeh|ee|ei)"
+pattern2 = r"(o|e|a|u|i|ng|m)"
+
+def get_POJ_tiau_hu(goan_im, tiau):
+    goan_im_with_tiau_hu = f"{goan_im}{tiau_hu_dict[int(tiau)]}"
+    return goan_im_with_tiau_hu
+
+def get_POJ_un_bu(idx):
+    return df_un_bu["POJ"][idx]
+
+def get_POJ_siann_bu(idx):
+    return df_siann_bu["POJ"][idx]
+
+def get_POJ_chu_im(siann_idx, un_idx, tiau):
+    un = get_POJ_un_bu(un_idx)
+    siann = get_POJ_siann_bu(siann_idx)
+
+    POJ_chu_im = f"{siann}{un}"
+
+    # pattern1 = r"(oai|oan|oah|oeh)"
+    searchObj = re.search(pattern1, POJ_chu_im, re.M|re.I)
+    if searchObj:
+        found = searchObj.group(1)
+        un_chars = list(found)
+        idx = 0
+        if found == 'ee' or found == 'ei':
+            idx = 0
+        else:
+            # found = oai/oan/oah/oeh
+            idx = 1
+        goan_im = un_chars[idx]
+        un_chars[idx] = get_POJ_tiau_hu(goan_im, tiau)
+        un_str = "".join(un_chars)
+        POJ_chu_im = POJ_chu_im.replace(found, un_str)
+    else:
+        # pattern2 = r"(o|e|a|u|i|ng|m)"
+        searchObj2 = re.search(pattern2, POJ_chu_im, re.M|re.I)
+        if searchObj2:
+            found = searchObj2.group(1)
+            goan_im = found
+            new_un = get_POJ_tiau_hu(goan_im, tiau)
+            POJ_chu_im = POJ_chu_im.replace(found, new_un)
+
+    return POJ_chu_im
+
+"""
+閩拼（BP）
+
+【調號標示規則】
+
+當一個音節有多個字母時，調號得標示在響度最大的字母上面（通常在韻腹）。由規則可以判定確切的字母：
+
+ - 響度優先順序： a > oo > (e = o) > (i = u)〈低元音 > 高元音 > 無擦通音 > 擦音 > 塞音〉
+ - 二合字母 iu 及 ui ，調號都標在後一個字母上；因為前一個字母是介音。
+ - m 作韻腹時則標於字母 m 上。
+ - 二合字母 oo 及 ng，標於前一個字母上；比如 ng 標示在字母 n 上。
+ - 三合字母 ere，標於最後的字母 e 上。
+"""
+
+# 將「傳統八聲調」轉換成閩拼使用的調號
+BP_tiau_remap_dict = {
+    1: 1, # 陰平: 44
+    2: 3, # 上聲：53
+    3: 5, # 陰去：21
+    4: 7, # 上聲：53
+    5: 2, # 陽平：24
+    7: 6, # 陰入：3?
+    8: 8, # 陽入：4?
+}
+
+BP_tiau_hu_dict = {
+    1: "\u0304",    # 陰平
+    2: "\u0341",    # 陽平
+    3: "\u030C",    # 上声
+    5: "\u0300",    # 陰去
+    6: "\u0302",    # 陽去
+    7: "\u0304",    # 陰入
+    8: "\u0341",    # 陽入
+}
+
+def get_BP_un_bu(idx):
+    return df_un_bu["BP"][idx]
+
+def get_BP_siann_bu(idx):
+    return df_siann_bu["BP"][idx]
+
+def get_BP_tiau_remap(tiau_ho):
+   return BP_tiau_remap_dict[int(tiau_ho)]
+
+def get_BP_tiau_hu(goan_im, BP_tiau):
+    goan_im_with_tiau_hu = f"{goan_im}{BP_tiau_hu_dict[int(BP_tiau)]}"
+    return goan_im_with_tiau_hu
+
+def get_BP_chu_im_simple(siann_idx, un_idx, tiau):
+    un = get_BP_un_bu(un_idx)
+    siann = get_BP_siann_bu(siann_idx)
+
+    # 將「傳統八聲調」轉換成閩拼使用的調號
+    BP_tiau = get_BP_tiau_remap(tiau)
+
+    BP_chu_im = f"{siann}{un}{BP_tiau}"
+
+    return BP_chu_im
+
+def get_BP_chu_im(siann_idx, un_idx, tiau):
+    un = get_BP_un_bu(un_idx)
+    siann = get_BP_siann_bu(siann_idx).strip()
+
+    # 當聲母為「空白」，韻母為：i 或 u 的調整
+    un_chars = list(un)
+    if siann == "":
+        if un_chars[0] == "i":
+            siann = "y"
+        elif un_chars[0] == "u":
+            siann = "w"
+
+    # 將「傳統八聲調」轉換成閩拼使用的調號
+    BP_tiau = get_BP_tiau_remap(int(tiau))
+
+    BP_chu_im = f"{siann}{un}"
+
+    pattern = r"(a|oo|ere|iu|ui|ng|e|o|i|u|m)"
+    searchObj = re.search(pattern, BP_chu_im, re.M|re.I)
+
+    if searchObj:
+        found = searchObj.group(1)
+        un_chars = list(found)
+        idx = 0
+        if found == "iu" or found == "ui":
+            idx = 1
+        elif found == "oo" or found == "ng":
+            idx = 0
+        elif found == "ere":
+            idx = 2
+
+        goan_im = un_chars[idx]
+        un_chars[idx] = get_BP_tiau_hu(goan_im, BP_tiau)
+        un_str = "".join(un_chars)
+        BP_chu_im = BP_chu_im.replace(found, un_str)
+
+    return BP_chu_im
+
+"""
+羅馬拼音（TL）
+順序：《o＞e＞a＞u＞i＞ng＞m》；而 ng 標示在字母 n 上。
+"""
+def get_TL_tiau_hu(goan_im, tiau):
+    goan_im_with_tiau_hu = f"{goan_im}{tiau_hu_dict[int(tiau)]}"
+    return goan_im_with_tiau_hu
+
+def get_TL_un_bu(idx):
+    return df_un_bu["TL"][idx]
+
+def get_TL_siann_bu(idx):
+    return df_siann_bu["TL"][idx]
+
+def get_TL_chu_im(siann_idx, un_idx, tiau):
+    un = get_TL_un_bu(un_idx)
+    siann = get_TL_siann_bu(siann_idx)
+
+    TL_chu_im = f"{siann}{un}"
+
+    pattern = r"(oo|ee|ei|o|e|a|u|i|ng|m)"
+    searchObj = re.search(pattern, TL_chu_im, re.M|re.I)
+
+    if searchObj:
+        found = searchObj.group(1)
+        un_chars = list(found)
+        goan_im = un_chars[0]
+        un_chars[0] = get_TL_tiau_hu(goan_im, tiau)
+        un_str = "".join(un_chars)
+        TL_chu_im = TL_chu_im.replace(found, un_str)
+
+    return TL_chu_im
+
+# import psycopg2
+
+# han_ji = "昔人已乘黃鶴去，此地空餘黄鶴樓。"
+
+# conn = psycopg2.connect(database="alanjui", user="alanjui", host="127.0.0.1", port="5432")
+# cur = conn.cursor()
+
+# # 將漢字 string 轉換成 list
+# han_ji_list = convert_string_to_list(han_ji)
+
+# #=========================================================
+# # 將整段讀入的漢字，逐一加注音
+# #=========================================================
+# # 取用每一個漢字，自【字庫】資料庫查找其【注音碼】
+# for search_han_ji in han_ji_list:
+#     # 若取出之字為標點符號，則跳過，並繼續取下一個漢字。
+#     # piau_tiam = r"[，、：；。？！（）「」【】《》“]"
+#     piau_tiam = r"[﹐，；：？！\uFF0C\uFF08-\uFF09\u2013-\u2014\u2026\\u2018-\u201D\u3000\u3001-\u303F]"
+#     searchObj = re.search(piau_tiam, search_han_ji, re.M|re.I)
+#     if searchObj:
+#         continue
+
+#     # SQL 查詢指令：自字庫查找某漢字之注音碼
+#     #sql = f"select id, han_ji, chu_im, freq, siann, un, tiau from han_ji where han_ji='{search_han_ji}'"
+#     sql =   "SELECT id, han_ji, chu_im, freq, siann, un, tiau "\
+#             "FROM han_ji "\
+#             f"WHERE han_ji='{search_han_ji}' "\
+#             "ORDER BY freq DESC;"
+#     cur.execute(sql)
+#     query_rows = cur.fetchall()
+
+#     # 漢字能否查到注音碼，將有不同的處理作業
+#     if not query_rows:
+#         # 問題發生：找不到漢字的注音碼
+#         print(f"Can not find 【{search_han_ji}】in Han-Ji-Khoo!!")
+#         continue
+#     else:
+#         # 漢字查到注音；遇漢字有多種讀音，需於【字庫表】留紀錄
+#         ji_soo = len(query_rows)
+#         for ji_found in range(ji_soo):
+#             # 若查到注音的漢字，有兩個以上；則需記錄漢字的 ID 編碼
+#             han_ji_id = query_rows[ji_found][0]
+#             #===========================================
+#             # 將【漢字】的【注音碼】，分解出：聲母、韻母、調號
+#             #===========================================
+#             chu_im = query_rows[ji_found][2]
+#             chu_im_code = split_chu_im(chu_im)
+#             siann_bu = chu_im_code[0].strip()
+#             un_bu = chu_im_code[1]
+#             tiau_ho = chu_im_code[2]
+
+#             # 取得聲母之聲母碼
+#             if siann_bu != "":
+#                 siann_index = get_siann_idx(siann_bu)
+
+#             # 取得韻母之韻母碼
+#             un_index = get_un_idx(un_bu)
+#             if un_index == -1:
+#                 # 記錄沒找到之韻母
+#                 print(f"Can not find 【{search_han_ji}】in Han-Ji-Khoo!!")
+
+#             # 取得韻母在十五音的索引編碼
+#             sip_ngoo_im_index = get_sip_ngoo_im_idx(un_index)
+
+#             #=========================================================
+#             # 將已注音之漢字加入【漢字注音表】
+#             #=========================================================
+#             print(f"-----------------------------------------------------------------")
+#             print(f"漢字：{search_han_ji} ==> 注音碼：{chu_im_code} ==> 【聲母】：{siann_bu}  【韻母】：{un_bu}  【調號】：{tiau_ho}")
+#             print(f"聲母編碼：{siann_index} ／ 韻母編碼：{un_index} ／ 韻母十五音序號：{sip_ngoo_im_index}")
+
+# conn.close()
+
+# %%
+# """
+# 漢字注音測試案例
+# han_ji_dict_POJ = {
+#     "雨": "qu2",
+#     "狐": "hoo5",
+#     "虺": "qui2",
+#     "有": "qiu2",
+#     "鏢": "pio1",
+#     "語": "gi2",
+#     "臺": "tai5",
+#     "野": "qia2",
+#     "欠": "khiam3",
+#     "德": "tek4",
+#     "元": "goan5",
+#     "字": "ji7",
+#     "俗": "siok8",
+#     "聲": "siann1",
+#     "生": "chhinn1"
+# }
+# """
+# han_ji_dict = {
+#     "雨": "qu2",
+#     "狐": "hoo5",
+#     "虺": "qui2",
+#     "有": "qiu2",
+#     "鏢": "pio1",
+#     "語": "gi2",
+#     "臺": "tai5",
+#     "野": "qia2",
+#     "欠": "khiam3",
+#     "德": "tik4",
+#     "元": "guan5",
+#     "字": "ji7",
+#     "俗": "siok8",
+#     "聲": "siann1",
+#     "生": "tshinn1"
+# }
+
+# for han_ji in han_ji_dict:
+#     chu_im = han_ji_dict[han_ji]
+#     result = split_chu_im(chu_im)
+
+#     siann_bu = result[0]    # siann
+#     un_bu = result[1]    # un
+#     tiau_ho = result[2]   # tiau
+
+#     siann_idx = get_siann_idx(siann_bu)
+#     un_idx = get_un_idx(un_bu)
+
+#     # BP_chu_im = ji.get_BP_chu_im_simple(siann_idx, un_idx, tiau_ho)
+#     # BP_chu_im = get_BP_chu_im(siann_idx, un_idx, tiau_ho)
+#     chu_im_with_hu_ho = get_TL_chu_im(siann_idx, un_idx, tiau_ho)
+#     print(f"漢字：{han_ji} ==> 注音碼：{chu_im} ==> 注音符號：{chu_im_with_hu_ho}")