Sentinel-AI-Beta-Test

Sleeping

Shreyas094 commited on Jul 24, 2024

Commit

495c1d2

verified ·

1 Parent(s): 63d903a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,6 +11,7 @@ from langchain_community.vectorstores import FAISS
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from llama_parse import LlamaParse
 # Environment variables and configurations
 huggingface_token = os.environ.get("HUGGINGFACE_TOKEN")
@@ -25,7 +26,7 @@ llama_parser = LlamaParse(
     language="en",
 )
-def load_document(file: NamedTemporaryFile, parser: str = "pypdf") -> List[dict]:
     """Loads and splits the document into pages."""
     if parser == "pypdf":
         loader = PyPDFLoader(file.name)
@@ -33,7 +34,7 @@ def load_document(file: NamedTemporaryFile, parser: str = "pypdf") -> List[dict]
     elif parser == "llamaparse":
         try:
             documents = llama_parser.load_data(file.name)
-            return [{"page_content": doc.text, "metadata": {"source": file.name}} for doc in documents]
         except Exception as e:
             print(f"Error using Llama Parse: {str(e)}")
             print("Falling back to PyPDF parser")

 from langchain_community.document_loaders import PyPDFLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from llama_parse import LlamaParse
+from langchain_core.documents import Document
 # Environment variables and configurations
 huggingface_token = os.environ.get("HUGGINGFACE_TOKEN")
     language="en",
 )
+def load_document(file: NamedTemporaryFile, parser: str = "pypdf") -> List[Document]:
     """Loads and splits the document into pages."""
     if parser == "pypdf":
         loader = PyPDFLoader(file.name)
     elif parser == "llamaparse":
         try:
             documents = llama_parser.load_data(file.name)
+            return [Document(page_content=doc.text, metadata={"source": file.name}) for doc in documents]
         except Exception as e:
             print(f"Error using Llama Parse: {str(e)}")
             print("Falling back to PyPDF parser")