Spaces:

fffiloni
/

Open-Sora-Plan-v1-0-0

Paused

App Files Files Community

Open-Sora-Plan-v1-0-0 / opensora /models /ae /videobase /modeling_videobase.py

fffiloni

Upload 244 files

b3f324b verified 11 months ago

raw

history blame

3.03 kB

	import torch
	from diffusers import ModelMixin, ConfigMixin
	from torch import nn
	import os
	import json
	import pytorch_lightning as pl
	from diffusers.configuration_utils import ConfigMixin
	from diffusers.models.modeling_utils import ModelMixin
	from typing import Optional, Union
	import glob

	class VideoBaseAE(ModelMixin, ConfigMixin):
	_supports_gradient_checkpointing = False

	def __init__(self, args, *kwargs) -> None:
	super().__init__(args, *kwargs)

	@classmethod
	def load_from_checkpoint(cls, model_path):
	with open(os.path.join(model_path, "config.json"), "r") as file:
	config = json.load(file)
	state_dict = torch.load(os.path.join(model_path, "pytorch_model.bin"), map_location="cpu")
	if 'state_dict' in state_dict:
	state_dict = state_dict['state_dict']
	model = cls(config=cls.CONFIGURATION_CLS(**config))
	model.load_state_dict(state_dict)
	return model

	@classmethod
	def download_and_load_model(cls, model_name, cache_dir=None):
	pass

	def encode(self, x: torch.Tensor, args, *kwargs):
	pass

	def decode(self, encoding: torch.Tensor, args, *kwargs):
	pass

	class VideoBaseAE_PL(pl.LightningModule, ModelMixin, ConfigMixin):
	config_name = "config.json"

	def __init__(self, args, *kwargs) -> None:
	super().__init__(args, *kwargs)

	def encode(self, x: torch.Tensor, args, *kwargs):
	pass

	def decode(self, encoding: torch.Tensor, args, *kwargs):
	pass

	@property
	def num_training_steps(self) -> int:
	"""Total training steps inferred from datamodule and devices."""
	if self.trainer.max_steps:
	return self.trainer.max_steps

	limit_batches = self.trainer.limit_train_batches
	batches = len(self.train_dataloader())
	batches = min(batches, limit_batches) if isinstance(limit_batches, int) else int(limit_batches * batches)

	num_devices = max(1, self.trainer.num_gpus, self.trainer.num_processes)
	if self.trainer.tpu_cores:
	num_devices = max(num_devices, self.trainer.tpu_cores)

	effective_accum = self.trainer.accumulate_grad_batches * num_devices
	return (batches // effective_accum) * self.trainer.max_epochs

	@classmethod
	def from_pretrained(cls, pretrained_model_name_or_path: Optional[Union[str, os.PathLike]], **kwargs):
	ckpt_files = glob.glob(os.path.join(pretrained_model_name_or_path, '*.ckpt'))
	if ckpt_files:
	# Adapt to PyTorch Lightning
	last_ckpt_file = ckpt_files[-1]
	config_file = os.path.join(pretrained_model_name_or_path, cls.config_name)
	model = cls.from_config(config_file)
	print("init from {}".format(last_ckpt_file))
	model.init_from_ckpt(last_ckpt_file)
	return model
	else:
	return super().from_pretrained(pretrained_model_name_or_path, **kwargs)