File size: 885 Bytes
3859ad7
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import pickle
from sentence_transformers import SentenceTransformer

# Inicjalizacja modelu
model = SentenceTransformer("quanthome/paraphrase-multilingual-MiniLM-L12-v2")

# Odczyt pliku i przetwarzanie jego zawartości
try:
    with open('wcag.txt', "r", encoding='utf-8', errors='ignore') as wsad:
        dane = wsad.readlines()
except FileNotFoundError:
    print("Plik 'wcag.txt' nie został znaleziony.")
    dane = []

# Sprawdzenie, czy dane zostały załadowane poprawnie
if dane:
    embeddings = model.encode(dane)

    # Powiązanie wektorów z tekstami
    vector_map = {line.strip(): embedding for line, embedding in zip(dane, embeddings)}

    # Zapisanie słownika do pliku
    with open('vector_map.pkl', 'wb') as f:
        pickle.dump(vector_map, f)

    print("Słownik został zapisany do pliku 'vector_map.pkl'.")
else:
    print("Brak danych do przetworzenia.")