Spaces:

TarunEnma
/

RetreivalData

Sleeping

TarunEnma commited on May 20, 2024

Commit

589eae5

verified ·

1 Parent(s): 79e0ecb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,41 +5,24 @@ from langchain.vectorstores import Chroma
 from langchain.chains import RetrievalQA
 from langchain.embeddings.sentence_transformer import SentenceTransformerEmbeddings
-# Define a simple Document class
-class Document:
-    def __init__(self, page_content):
-        self.page_content = page_content
-# Custom TextLoader class
-class TextLoader:
-    def __init__(self, file):
-        self.file = file
-    def load(self):
-        content = self.file.read().decode("utf-8")
-        # Return a list of Document objects
-        return [Document(content)]
-# Streamlit interface
-st.title("Please upload files that are txt format")
-uploaded_file = st.file_uploader("Choose a text file", type=["txt"])
-if uploaded_file is not None:
-    # Use the uploaded file directly
-    text_loader = TextLoader(uploaded_file)
-    documents = text_loader.load()
-    text_splitter = CharacterTextSplitter(chunk_size=200, chunk_overlap=0)
-    texts = text_splitter.split_documents(documents)
-    st.write(texts)
-# embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
-# db = Chroma.from_documents(texts, embeddings)
-# db._collection.get(include=['embeddings'])
-# retriever = db.as_retriever(search_kwargs={"k": 1})
-# docs = retriever.get_relevant_documents("What is the capital of india?")
-# st.write("Answer")
-# st.text(docs)
-# # st.write("File content:")
-# # st.text(file_content)

 from langchain.chains import RetrievalQA
 from langchain.embeddings.sentence_transformer import SentenceTransformerEmbeddings
+loader = TextLoader('India.txt')
+documents =loader.load()
+text_splitter = CharacterTextSplitter (chunk_size=200,
+chunk_overlap=0)
+texts= text_splitter.split_documents(documents)
+embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
+db = Chroma.from_documents(texts, embeddings)
+db._collection.get(include=['embeddings'])
+retriever = db.as_retriever(search_kwargs={"k": 1})
+docs = retriever.get_relevant_documents("What is the capital of india?")
+st.write("Answer")
+st.text(docs)
+# st.write("File content:")
+# st.text(file_content)