RNN-Transducer

A Pytorch Implementation of Transducer Model for End-to-End Speech Recognition

Environment

pytorch >= 0.4
warp-transducer

Train

python train.py -config config/aishell.yaml

Eval

python eval.py -config config/aishell.yaml

Experiments

The details of our RNN-Transducer are as follows.

model:
    enc:
        type: lstm
        hidden_size: 320
        n_layers: 4
        bidirectional: True
    dec:
        type: lstm
        hidden_size: 512
        n_layers: 1
    embedding_dim: 512
    vocab_size: 4232
    dropout: 0.2

All experiments are conducted on AISHELL-1. During decoding, we use beam search with width of 5 for all the experiments. A character-level 5-gram language model from training text, is integrated into beam searching by shallow fusion.

MODEL	DEV(CER)	TEST(CER)
RNNT+pretrain+LM	10.13	11.82

Acknowledge

Thanks to warp-transducer.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
config		config
rnnt		rnnt
README.md		README.md
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RNN-Transducer

Environment

Train

Eval

Experiments

Acknowledge

About

Releases

Packages

Languages

chmenet/rnn-transducer

Folders and files

Latest commit

History

Repository files navigation

RNN-Transducer

Environment

Train

Eval

Experiments

Acknowledge

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages