生成扩散模型的Keras实现
- 模型主体依然式U-Net格式,但是经过自己的简化(如特征拼接改为相加、去掉了Attention等),加快了收敛速度
- 在单张3090下,训练半天可以初见效果,训练3天的效果如下:
- tensorflow 1.15
- keras 2.3.1
- bert4keras (当前Github最新版本,不能用pip安装的版本)
- loss不能用mse
- 归一化不能用BN
- 步数t的编码可以直接用Embedding层
QQ交流群:808623966,微信群请加机器人微信号spaces_ac_cn