apple
/

aimv2-large-patch14-native

@@ -101,7 +101,7 @@ class AIMv2ViTPreprocessor(nn.Module):
         tokens = self.patchifier(x)
         pos_embed = get_sincos_pos_embed(
             H // self.patch_h, W // self.patch_w, embed_dim=self.embed_dim
-        )
         tokens = tokens + pos_embed
         return tokens

         tokens = self.patchifier(x)
         pos_embed = get_sincos_pos_embed(
             H // self.patch_h, W // self.patch_w, embed_dim=self.embed_dim
+        ).to(tokens.device)
         tokens = tokens + pos_embed
         return tokens