Skip to content

Commit 63d4715

Browse files
authored
add novel model
1 parent 40b25f0 commit 63d4715

File tree

1 file changed

+12
-0
lines changed

1 file changed

+12
-0
lines changed

model/README.md

+12
Original file line numberDiff line numberDiff line change
@@ -25,3 +25,15 @@
2525
* webpage_slda.model # Sentence-LDA模型参数, 存储格式为libSVM格式
2626
* webpage_twe_lda.model # TWE模型参数, 二进制存储, 包括词向量与主题向量
2727
* vocab_info.txt # 词表文件, 中文编码采用UTF-8
28+
29+
### 小说主题模型
30+
31+
使用百度万级别小说数据训练,词表规模243617,LDA模型主题数为500,SentenceLDA(SLDA)模型主题数为500。
32+
模型包括LDA、SentenceLDA(SLDA), Topical Word Embedding (TWE), 其中模型均存放于model/novel目录中
33+
34+
* lda.conf # LDA模型inference所需配置文件
35+
* slda.conf # Sentence-LDA模型inference所需配置文件
36+
* novel_lda.model # LDA模型参数, 存储格式为libSVM格式
37+
* novel_slda.model # Sentence-LDA模型参数, 存储格式为libSVM格式
38+
* novel_twe_lda.model # TWE模型参数, 二进制存储, 包括词向量与主题向量
39+
* vocab_info.txt # 词表文件, 中文编码采用UTF-8

0 commit comments

Comments
 (0)