Replies: 3 comments 6 replies
-
另外請問一下,這些詞庫中與八股文重複的詞,我應該是要拿掉呢?還是留著無妨? |
Beta Was this translation helpful? Give feedback.
2 replies
-
如果兩個詞庫有交集,可以用交集部分訓練一個隨機森林模型,例如,基於新詞庫詞頻預測八股文詞頻,然後使用預測詞頻替換新詞庫中的原有詞頻,應可大體保證最佳體驗 |
Beta Was this translation helpful? Give feedback.
1 reply
-
怎樣比較好,取決於來源詞庫的數據質量。 |
Beta Was this translation helpful? Give feedback.
3 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
請問各位:
最近我開始轉換自己的字典來使用。
包含酷音輸入法、小麥輸入法等有詞頻的檔案。另外也轉換了其他無詞頻的資料,如道路、村里和地區資料庫來讓輸入法更正確。
沒有詞頻的資料相對簡單,轉換後我只要使用
use_preset_vocabulary: true
讓他去參照八股文中的詞頻即可。那麼這些有詞頻的字典檔呢?
我應該把
use_preset_vocabulary: true
拿掉?還是要保留?針對字典檔本身,我應該做什麼樣的調整會讓他的輸入效果比較好呢?
保留詞頻,和八股文是否會有衝突呢?
Beta Was this translation helpful? Give feedback.
All reactions