Aria

Sleeping

m-ric HF staff commited on Dec 9, 2024

Commit

a0b9c5e

verified ·

1 Parent(s): 7a3273b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -55,7 +55,7 @@ def model_inference(
             ]
     prompt = processor.apply_chat_template(resulting_messages, add_generation_prompt=True)
     inputs = processor(text=prompt, images=[images], return_tensors="pt")
-    inputs = {k: v.to("cuda") for k, v in inputs.items()}
     generation_args = {
         "max_new_tokens": max_new_tokens,
         "repetition_penalty": repetition_penalty,

             ]
     prompt = processor.apply_chat_template(resulting_messages, add_generation_prompt=True)
     inputs = processor(text=prompt, images=[images], return_tensors="pt")
+    inputs.to("cuda", dtype=torch.bfloat16)
     generation_args = {
         "max_new_tokens": max_new_tokens,
         "repetition_penalty": repetition_penalty,