Spaces:

soiz
/

write2txt

Running

write2txt / app.py

Update app.py

a5c2cef verified 3 months ago

1.03 kB

	import gradio as gr
	from transformers import TrOCRProcessor, VisionEncoderDecoderModel
	from PIL import Image

	# OCRモデルとプロセッサの準備
	processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-stage1")
	model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-stage1")

	# OCR実行関数
	def ocr_image(image):
	# 画像をモデルに入力し、文字起こしを実行
	pixel_values = processor(images=image, return_tensors="pt").pixel_values
	generated_ids = model.generate(pixel_values)
	generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
	return generated_text

	# Gradioインターフェースの構築
	interface = gr.Interface(
	fn=ocr_image, # 実行関数
	inputs=gr.Image(type="pil", tool="editor"), # カメラからの画像入力
	outputs="text", # 出力形式（テキスト）
	live=True # ライブプレビューの有効化
	)

	# アプリの起動
	interface.launch()