Spaces:

Shabdobhedi
/

medical-chatbot-using-Llama3-8b-8192

Sleeping

Upload 3 files

9a20526 verified 3 months ago

883 Bytes

	from langchain.document_loaders import PyPDFLoader, DirectoryLoader
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from langchain.embeddings import HuggingFaceEmbeddings


	# Extract data from the PDF
	def load_pdf(data):
	loader = DirectoryLoader(data,
	glob="*.pdf",
	loader_cls=PyPDFLoader)

	documents = loader.load()

	return documents


	# Create text chunks
	def text_split(extracted_data):
	text_splitter = RecursiveCharacterTextSplitter(
	chunk_size=500, chunk_overlap=20)
	text_chunks = text_splitter.split_documents(extracted_data)

	return text_chunks


	# download embedding model
	def download_hugging_face_embeddings():
	embeddings = HuggingFaceEmbeddings(
	model_name='sentence-transformers/all-MiniLM-L6-v2')
	return embeddings