-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[WIP] Export to tflite int8 #9
base: onnx_2_1
Are you sure you want to change the base?
Conversation
エラーの_tensor_constant_9はMul -> div -> Powに繋がっている。 |
mask decoderは下記のエラーになる。
|
is_per_channel = Falseにした場合も、Convはper channelで量子化される。 |
キャリブレーション用のデータセットを作成する機能を足さないといけない。 |
下記の例では、torchを使用せずに、tensorflowの方で量子化している。 |
tensorflowで量子化すると、layernormもint8になる。 tensorflow (layernormがint8になる) |
全てのモデルにキャリブレーション機能を追加。とりあえず、COCOデータセットの100枚でキャリブレーションをかける。 |
テスト方法
出力
|
tensorflowではなくtorchで量子化し、layernormをFloatで実行したモデル。キャリブレーション条件は同一。 |
高速化のため、FULLY_INTEGER_QUANTIZATIONのモデルの構築の検討。
Windowsだとedge-ai-torchの依存ライブラリが入らないので、WSLが必要。
現段階では、下記の変換エラーが発生する。