diff --git a/pytorchvideo/models/hub/vision_transformers.py b/pytorchvideo/models/hub/vision_transformers.py
index 3970427a..3131257d 100644
--- a/pytorchvideo/models/hub/vision_transformers.py
+++ b/pytorchvideo/models/hub/vision_transformers.py
@@ -62,7 +62,7 @@ def mvit_base_16x4(
     """
     Multiscale Vision Transformers model architecture [1] trained with an 16x4
     setting on the Kinetics400 dataset. Model with pretrained weights has top1
-    accuracy of 79.0%.
+    accuracy of 78.9%.
 
     [1] Haoqi Fan, Bo Xiong, Karttikeya Mangalam, Yanghao Li, Zhicheng Yan, Jitendra
     Malik, Christoph Feichtenhofer, "Multiscale Vision Transformers"