robinqu
/

tritontest

stable-diffusion

stable-diffusion-diffusers

Model card Files Files and versions Metrics Training metrics Community

tritontest / test1.py

robinqu's picture

End of training

e58ac13 over 1 year ago

history blame contribute delete

986 Bytes

	import torch

	model = torch.nn.Linear(2, 3).to("cuda").eval()


	import numpy as np
	from pytriton.decorators import batch

	@batch
	def infer_fn(**inputs: np.ndarray):
	(input1_batch,) = inputs.values()
	input1_batch_tensor = torch.from_numpy(input1_batch).to("cuda")
	output1_batch_tensor = model(input1_batch_tensor) # Calling the Python model inference
	output1_batch = output1_batch_tensor.cpu().detach().numpy()
	return [output1_batch]


	from pytriton.model_config import ModelConfig, Tensor
	from pytriton.triton import Triton

	# Connecting inference callback with Triton Inference Server
	with Triton() as triton:
	# Load model into Triton Inference Server
	triton.bind(
	model_name="Linear",
	infer_func=infer_fn,
	inputs=[
	Tensor(dtype=np.float32, shape=(-1,)),
	],
	outputs=[
	Tensor(dtype=np.float32, shape=(-1,)),
	],
	config=ModelConfig(max_batch_size=128)
	)
	triton.serve()