denis-gordeev's picture
Add new SentenceTransformer model
1f88efa verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:48868
  - loss:ContrastiveLoss
base_model: sergeyzh/rubert-tiny-turbo
widget:
  - source_sentence: |-
      помоги подобрать игровой смартфон
      с оперативной памятью больше 16 гб и ценой до 10 тысяч рублей
    sentences:
      - >-
        {'long_web_name': 'Процессор AMD Ryzen 9 7900X OEM', 'price': 39253.0,
        'url':
        'https://megamarket.ru/catalog/details/processor-amd-ryzen-9-7900x-am5-oem-600009583854/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/185/447/212/112/35/600009583854b0.jpeg',
        'id': '600009583854_170473', 'description': 'Процессор AMD Ryzen 9 7900X
        – это мощное решение для игровых систем и рабочих станций. В основе
        модели используются высококачественные компоненты и передовые
        технологии, что в связке с большим числом физических ядер и виртуальных
        потоков может обеспечить непревзойденно высокую вычислительную мощность
        в любых сценариях использования компьютера.Поддерживаемые AMD Ryzen 9
        7900X частоты могут варьироваться от 4.7 до 5.6 ГГц. Благодаря этому, а
        также свободному множителю данная модель отличается высоким уровнем
        быстродействия и большим потенциалом для его дальнейшего развития.Объем
        поддерживаемой временной памяти может достигать 128 ГБ. Также
        вычислительный модуль поддерживает работу с интерфейсом PCI-E 5
        поколения, что открывает широкие возможности для создания
        бескомпромиссной компьютерной системы для работы и развлечений.Помимо
        высокой производительности процессор также отличается тепловыделением,
        которое не превышает 170 Вт. Для охлаждения могут использоваться как
        воздушные, так и водяные системы. Установка на материнскую плату
        производится при помощи сокета AM5.', 'rating': 4.84, 'review_count':
        79}
      - >-
        {'long_web_name': 'Аксессуар для видеокарты NVIDIA RTX LOW PROFILE
        BRACKET A2000', 'price': 783.0, 'url':
        'https://megamarket.ru/catalog/details/planka-dlya-videokarty-rtx-low-profile-bracket-a2000-12gb-nvidia-100046937787/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/109/972/170/425/191/5/100046937787b0.jpg',
        'id': '100046937787', 'description': '', 'rating': 0.0, 'review_count':
        0}
      - >-
        {'long_web_name': 'Миксер Kitfort KT-1343-1', 'price': 13770.0, 'url':
        'https://megamarket.ru/catalog/details/mikser-kitfort-kt-1343-1-100024025979/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1696368414/100024025979b0.jpg',
        'id': '100024025979', 'description': 'Ультрасовременный и мощный
        стационарный планетарный миксер Kitfort КТ-1343-1 поможет вам смешать
        ингредиенты, взбить яйца или сливки, приготовить картофельное пюре,
        соус, крем, мусс, замесить жидкое тесто для блинов и тугое тесто для
        пельменей и пирогов.', 'rating': 4.87, 'review_count': 168}
  - source_sentence: Найди смартфон от 50-ти тысяч до 30к рублей
    sentences:
      - >-
        {'long_web_name': 'Конверт для компакт-дисков, 8 шт', 'price': 207.0,
        'url':
        'https://megamarket.ru/catalog/details/konvert-dlya-kompakt-diskov-8-sht-600003175886/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-13/734/904/142/101/213/600003175886b0.jpeg',
        'id': '600003175886_1022', 'description': '', 'rating': 4.72,
        'review_count': 14}
      - >-
        {'long_web_name': 'Ультрабук Huawei MateBook D 14 Gray (NbD-WDI9)',
        'price': 44940.0, 'url':
        'https://megamarket.ru/catalog/details/i-nb-huawei-nbd-wdi9-1115g4-8-256gb-sg-100055338519/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/870/310/738/102/122/9/100055338519b0.jpg',
        'id': '100055338519', 'description': '<p>Ультрабук Huawei MateBook D 14
        i3 1115G4/8/256Gb DOS Space Gray (NbD-WDI9) — это мощный портативный
        компьютер, который легко помещается в сумку или рюкзак. Его удобно брать
        с собой в офис, университет или путешествие.</p>\n<h2>Помогает работать
        продуктивнее</h2>\n<p>Устройство оснащено процессором Intel Core i3
        1115G4 с двумя ядрами и тактовой частотой 4,1 ГГц. Оперативная память
        объемом 8 Гб обеспечивает стабильную работу даже при запуске нескольких
        приложений одновременно. Другие технические
        параметры:</p>\n<ul>\n<li>внутренний накопитель SSD на 256 Гб позволяет
        хранить большое количество файлов;</li>\n<li>матрица IPS с разрешением
        Full HD дает четкое изображение;</li>\n<li>веб-камера 720p HD передает
        качественную картинку;</li>\n<li>емкий аккумулятор на 56 Вт·ч
        обеспечивает автономную работу в течение 10,5
        часов.</li>\n</ul>\n<p>Корпус выполнен из алюминия — прочного материала,
        устойчивого к механическим повреждениям. Устройство весит всего 1,3 кг,
        а толщина составляет 1,6 см — оно не занимает много места в сумке. На
        задней панели расположен сканер отпечатков пальцев — для быстрого входа
        в систему.</p>', 'rating': 4.72, 'review_count': 50}
      - >-
        {'long_web_name': 'Смартфон Xiaomi Redmi 13C 4/128GB Glacier White',
        'price': 13490.0, 'description': '', 'rating': 3.9, 'review_count': 10}
  - source_sentence: Покажи самсунг до 50к
    sentences:
      - >-
        {'long_web_name': 'Powerline-адаптер TP-Link TL-WPA4220KIT(EU)',
        'price': 6169.0, 'url':
        'https://megamarket.ru/catalog/details/powerline-adapter-tp-link-tl-wpa4220kit-eu--100000031379/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1696368/100000031379b0.jpg',
        'id': '100000031379', 'description': '<p>TP-Link TL-WPA4220KIT —
        Powerline-адаптер, с помощью которого можно расширить зону охвата
        интернет-сети в доме или офисе. Устройство использует для этого
        электропроводку. Все, что от вас требуется:</p><ul><li>вставить адаптер,
        подключенный к интернету, в ближайшую розетку;</li><li>подключить
        дополнительный адаптер к компьютеру, телевизору, игровой приставке с
        помощью кабеля Ethernet либо по Wi-Fi.</li></ul><p>Устройство
        обеспечивает передачу данных на расстояние до 300 метров. Скорость при
        этом достигает 500 Мбит/с: этого достаточно не только для проверки
        электронного почтового ящика или веб-серфинга, но и для просмотра
        HD-видео по сети.</p><h2>Расширяйте сеть простым нажатием
        кнопки</h2><p>На корпусе адаптера находится кнопка Wi-Fi Clone. Нажмите
        ее, и устройство автоматически скопирует имя сети, а также пароль
        основного роутера. При дальнейшем использовании адаптера вам не нужно
        будет вводить эти данные, он установит соединение с сетью
        автоматически.</p><h2>Быстрый Wi-Fi</h2><p>Адаптер можно использовать
        для обеспечения соединения по Wi-Fi в удаленных от роутера частях дома
        или офиса. Скорость передачи данных при этом может достигать 300
        Мбит/с.</p>', 'rating': 4.68, 'review_count': 28}
      - >-
        {'long_web_name': 'Бокс внешний для жесткого диска UGREEN CM400 10903
        USB-C to M.2 NGFF 5G', 'price': 1743.0, 'url':
        'https://megamarket.ru/catalog/details/boks-vneshniy-dlya-zhestkogo-diska-ugreen-cm400-10903-usb-c-to-m2-ngff-5g-s-kabelem-seryy-600010937220/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/141/145/820/231/381/5/600010937220b0.png',
        'id': '600010937220', 'description': 'Вход: Micro USB 3.0 (мама). Выход:
        M.2 B-Key(SATA 3.0). SATA 3.0, скорость до 6 Гбит/с, совместимость с
        SATA 2.0/1.0. Micro USB 3.0, скорость до 5 Гбит/с, совместимость с USB
        2.0 и 1.1. Поддержка 4х размеров (2230/2242/2260/2280) M.2 (NGFF)B -KEY
        твердотельные накопители. До 2 ТБ. Поддерживает протокол передачи данных
        UASP. Защита от короткого замыкания. Встроенная схема защиты от
        электростатического разряда, устойчивая к статическому напряжению 4 кВ.
        Поддержка функции обнаружения S.M.A.R.T. Поддержка функции TRIM.
        Установка без инструментов. Кабель Micro USB 3.0 - USB A. Длина кабеля:
        50 см. Совместимость с Windows, Mac OS, Linux, Chrome OS, PS4, PS3,
        Xbox, маршрутизатором, телефонами OTG. Алюминиевый корпус.
        Размер:Д119xШ37xВ12 мм', 'rating': 4.12, 'review_count': 17}
      - >-
        {'long_web_name': 'Смартфон Realme RMX3710 C55 128Gb 6Gb черный
        моноблок', 'price': 14999.0, 'description': '', 'rating': 4.9,
        'review_count': 230, 'extra_info': ''}
  - source_sentence: Помоги выбрать утюг для мамы до 15к рублей
    sentences:
      - >-
        {'long_web_name': 'Защитное стекло на Samsung A52 с рамкой', 'price':
        307.0, 'url':
        'https://megamarket.ru/catalog/details/zashitnoe-steklo-na-samsung-a52-s-ramkoy-600014092980/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/157/296/486/423/114/1/600014092980b0.jpg',
        'id': '600014092980', 'description': '<p>Закаленное стекло на Samsung
        A52 стекло G-Rhino с черной рамкой - вариант усиленной защиты на весь
        экран, приближенного к материалу Gorilla Glass, неотъемлемая деталь для
        Вашего смартфона. Химически упрочнённое бронь-стекло G Rhino с полной
        проклейкой, способно сохранить гаджет при падении от царапин, сколов,
        трещин, всевозможных случайных механических повреждений, а также защитит
        от износа и загрязнений, отпечатков пальцев и жирных пятен. Подходит под
        любые виды чехлов и не трескается при длительном использовании. Толщина
        атрибута в несколько раз превосходит традиционную пленку. Благодаря
        тому, что броне-стекло равномерно покрывает всю поверхность телефона,
        оно плотно приклеивается к дисплею и не влияет на его сенсорную
        чувствительность. Мы рекомендуем устанавливать вместе с «бронёй»
        ударопрочный чехол для продления службы вашей техники. Устанавливается
        максимально просто: достаточно расположить ровно бронестекло, провести
        пальцем по центру, и оно само приклеится, также установка
        продемонстрирована в видео карточки данного товара. В набор входят
        влажные и сухие салфетки, а также специальные наклейки для удаления
        пыли. Благодаря прочной упаковке, ваш заказ будет доставлен в
        целостности. Также предлагаем посмотреть классическую и керамическую
        бронезащиту, которые можно увидеть в рекомендациях. Если задумываетесь о
        подарке для близкого Вам человека  идеально будет приобрести у нас в
        комплекте бампер(накладка) и защитные стёклышки PRO. В нашем магазине
        самый большой ассортимент аксессуаров для любых смартфонов, мы
        оперативно пополняем наш сайт новинками. Если вы не смогли определиться
        с выбором, то мы всегда ответим Вам в разделе Вопросы.</p>', 'rating':
        4.2, 'review_count': 5}
      - >-
        {'long_web_name': 'Чехол-накладка для Xiaomi Redmi 12C черный,
        Microfiber Case, BoraSCO', 'price': 486.0, 'url':
        'https://megamarket.ru/catalog/details/chehol-nakladka-dlya-xiaomi-redmi-12c-chernyy-microfiber-case-borasco-600011628021/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/210/478/671/542/416/12/600011628021b0.jpeg',
        'id': '600011628021_14552', 'description': 'Удобный и эластичный чехол
        Microfiber Case – идеальное решение для Вашего смартфона. Внутренняя
        сторона чехла из мягкой микрофибры защитит корпус устройства, а внешняя
        силиконовая поверхность с покрытием Soft Touch приятна на ощупь. Чехол
        точно повторяет контуры телефона, плотно прилегает к кнопкам, сохраняя
        максимальное удобство в управлении. Имеет все необходимые отверстия для
        доступа к функциональным портам, и разъемам смартфона.', 'rating': 0.0,
        'review_count': 0}
      - >-
        {'long_web_name': 'Смартфон Samsung Galaxy S23 256GB Black', 'price':
        67800.0, 'url':
        'https://megamarket.ru/catalog/details/smartfon-samsung-galaxy-s23-256gb-black-100065875645/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-31/916/659/281/817/100065875645b0.jpg',
        'id': '100065875645', 'description': 'Смартфон Samsung Galaxy S23 256GB
        Black. Восьмиядерный процессор Qualcomm Snapdragon 8 Gen 2 с графическим
        ускорителем Adreno 740 и 8 Гб оперативной памяти. Безрамочный экран
        диагональю 6,1 дюйма, выполненный по технологии Dynamic AMOLED 2X.
        Разрешение — 2340x1080 пикселей, частота обновления — 120 Гц. Плотность
        пикселей 425 ppi. Стекло Corning Gorilla Glass Victus 2 — защищает
        дисплей от ударов и появления царапин. Технология Dolby Atmos — объемный
        звук в фильмах, играх и при прослушивании музыки. Влагозащита по
        стандарту IP68. Трехмодульная основная камера 50/12/10 Мп с автофокусом,
        светодиодной вспышкой и AI распознаванием сцен — снимает фотографии и
        записывает видео в условиях разного освещения. Фронтальная камера — 12
        Мп. Внутреннее хранилище объемом 256 Гб для установки приложений,
        хранения медиафайлов и документов. Поддержка двух nano-SIM и eSIM.
        Навигационные системы GPS, ГЛОНАСС, Beidou, Galileo и QZSS — позволяют
        быстро сориентироваться в незнакомом месте, проложить маршрут до нужной
        точки. Встроенные модули Wi-Fi, Bluetooth и NFC — для обмена данными с
        совместимыми устройствами. Время автономной работы — до 70 часов.
        Аккумулятор 3900 мАч с поддержкой быстрой и беспроводной зарядки.
        Биометрическая защита с авторизацией через распознавание лица или
        отпечаток пальца.', 'rating': 5.0, 'review_count': 24}
  - source_sentence: расскажи о камерах смартфонов
    sentences:
      - >-
        {'long_web_name': 'Смартфон Samsung Galaxy S23 FE 256GB Graphite
        (SM-S711B/DS)', 'price': 51540.0, 'description': '<p>Смартфон Samsung
        Galaxy S23 FE 256GB Graphite (SM-S711B/DS) — это мощный гаджет с большим
        экраном, который позволяет смотреть фильмы, играть в игры и общаться с
        друзьями.</p>\n<h2>Продуманная конструкция</h2>\n<p>Смартфон оснащен
        восьмиядерным процессором Exynos 2200, который обеспечивает высокую
        производительность. Оперативной памяти 8 Гб — этого достаточно для
        одновременного запуска нескольких приложений. Другие
        параметры:</p>\n<ul>\n<li>IPS-дисплей диагональю 6,4 дюймов —
        изображение выглядит четким и ярким;</li>\n<li>три основные камеры с
        разрешением 50, 12 и 8 Мп — позволяют делать качественные
        снимки;</li>\n<li>фронтальная камера на 10 Мп — подходит для
        селфи;</li>\n<li>емкий аккумулятор на 4500 мА·ч — хватает на длительное
        время работы.</li>\n</ul>\n<p>Смартфон защищен от попадания пыли и
        влаги. Корпус выполнен из пластика — он устойчив к царапинам и
        потертостям. На задней панели расположен сканер отпечатков
        пальцев.</p>', 'rating': 4.8, 'review_count': 117, 'extra_info': ''}
      - >-
        {'long_web_name': 'Смартфон Honor 200 Lite 8/256GB голубой (5109BFBH)',
        'price': 21290.0, 'description': '', 'rating': 4.83, 'review_count': 17}
      - >-
        {'long_web_name': 'Накладка силикон для Xiaomi Redmi 5 (оригинальный)
        прозрачный', 'price': 599.0, 'url':
        'https://megamarket.ru/catalog/details/nakladka-silikon-dlya-xiaomi-redmi-5-originalnyy-prozrachnyy-100057155753/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-24/417/121/310/276/47/100057155753b0.jpg',
        'id': '100057155753_102580', 'description': '', 'rating': 0.0,
        'review_count': 0}
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
  - cosine_accuracy_threshold
  - cosine_f1
  - cosine_f1_threshold
  - cosine_precision
  - cosine_recall
  - cosine_ap
model-index:
  - name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
    results:
      - task:
          type: binary-classification
          name: Binary Classification
        dataset:
          name: item classification
          type: item-classification
        metrics:
          - type: cosine_accuracy
            value: 0.9842829076620825
            name: Cosine Accuracy
          - type: cosine_accuracy_threshold
            value: 0.7253406047821045
            name: Cosine Accuracy Threshold
          - type: cosine_f1
            value: 0.949367088607595
            name: Cosine F1
          - type: cosine_f1_threshold
            value: 0.7253406047821045
            name: Cosine F1 Threshold
          - type: cosine_precision
            value: 0.9297520661157025
            name: Cosine Precision
          - type: cosine_recall
            value: 0.9698275862068966
            name: Cosine Recall
          - type: cosine_ap
            value: 0.9839091724445497
            name: Cosine Ap

SentenceTransformer based on sergeyzh/rubert-tiny-turbo

This is a sentence-transformers model finetuned from sergeyzh/rubert-tiny-turbo. It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: sergeyzh/rubert-tiny-turbo
  • Maximum Sequence Length: 2048 tokens
  • Output Dimensionality: 312 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-5")
# Run inference
sentences = [
    'расскажи о камерах смартфонов',
    "{'long_web_name': 'Смартфон Honor 200 Lite 8/256GB голубой (5109BFBH)', 'price': 21290.0, 'description': '', 'rating': 4.83, 'review_count': 17}",
    "{'long_web_name': 'Накладка силикон для Xiaomi Redmi 5 (оригинальный) прозрачный', 'price': 599.0, 'url': 'https://megamarket.ru/catalog/details/nakladka-silikon-dlya-xiaomi-redmi-5-originalnyy-prozrachnyy-100057155753/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-24/417/121/310/276/47/100057155753b0.jpg', 'id': '100057155753_102580', 'description': '', 'rating': 0.0, 'review_count': 0}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Binary Classification

Metric Value
cosine_accuracy 0.9843
cosine_accuracy_threshold 0.7253
cosine_f1 0.9494
cosine_f1_threshold 0.7253
cosine_precision 0.9298
cosine_recall 0.9698
cosine_ap 0.9839

Training Details

Training Dataset

Unnamed Dataset

  • Size: 48,868 training samples
  • Columns: anchor, text, and label
  • Approximate statistics based on the first 1000 samples:
    anchor text label
    type string string int
    details
    • min: 5 tokens
    • mean: 17.78 tokens
    • max: 118 tokens
    • min: 57 tokens
    • mean: 318.85 tokens
    • max: 1182 tokens
    • 0: ~85.50%
    • 1: ~14.50%
  • Samples:
    anchor text label
    помоги подобрать внешний аккумулятор, чтобы получить сбербонусы
    покажи товары
    {'long_web_name': 'Чехол для Xiaomi Battery Case 10000mAh ver.2 Orange', 'price': 195.0, 'url': 'https://megamarket.ru/catalog/details/xiaomi-battery-case-10000mah-ver2-orange-100043272924/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/202/591/442/682/916/55/100043272924b0.jpg', 'id': '100043272924', 'description': '', 'rating': 0.0, 'review_count': 0} 0
    Здравствуйте. Мне нужен недорогой смартфон на Android, чтобы можно было легко звонить и писать сообщения внукам. Можете что-то посоветовать? {'long_web_name': 'Чистящее средство Topperr 3037', 'price': 417.0, 'url': 'https://megamarket.ru/catalog/details/chistyashee-sredstvo-dlya-kofemashin-topperr-3037-100022709014/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-16/699/502/081/231/16/100022709014b0.jpg', 'id': '100022709014', 'description': '', 'rating': 4.94, 'review_count': 222} 0
    Samsung Galaxy S24 {'long_web_name': 'Поворотное металлическое крепление на руль мотоцикла велосипеда для экшн камеры GoPro', 'price': 950.0, 'url': 'https://megamarket.ru/catalog/details/kreplenie-nobrand-00000659-600016461568/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-66/144/792/042/153/1/600016461568b0.png', 'id': '600016461568_81689', 'description': '

    Это надежный металлический крепеж для рулей и круглых труб небольшого диаметра, до 33мм. Крепление оснащено стандартным U-образным креплением, которое совместимо с экшн камерами GoPro, SjCam, Xiaomi и иных других оснащенных подобным креплением. Есть возможность поворота камеры вокруг своей оси на 360 градусов с фиксацией.

    Благодаря резиновым уплотнителям внутри, крепление надежно держится и не провернется вокруг трубы.

    Крепление затягивается шестигранником, который идет в комплекте. Также в комплекте идет металлический болт для закрепления экшн камеры в U-образном креплении.

    ', 'rating': 0.0, 'review_count': ...
    0
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 6,108 evaluation samples
  • Columns: anchor, text, and label
  • Approximate statistics based on the first 1000 samples:
    anchor text label
    type string string int
    details
    • min: 5 tokens
    • mean: 20.51 tokens
    • max: 1716 tokens
    • min: 53 tokens
    • mean: 326.79 tokens
    • max: 1182 tokens
    • 0: ~84.50%
    • 1: ~15.50%
  • Samples:
    anchor text label
    Привет, помоги подобрать ноутбук, на что обратить внимание?
    Диагональ дисплея хочу 15
    оеративка от 16гб
    ссд хотя бы 0.5 тб

    Порекомендуй конкртные товары
    {'long_web_name': 'Ноутбук Azerty RB-1550 Silver (120-0513)', 'price': 25470.0, 'description': 'Ноутбук Azerty RB-1550 обладает достаточной производительностью для решения учебных задач, таких как работа с документами, просмотр веб-страниц, использование электронных учебников и презентаций. Конечно, ведь именно для этого он и предназначен, являясь представителем серии моделей для учёбы Story. - Корпус ноутбука выполнен из твердого полимерного пластика, придающего легкости и прочности. Этот материал обладает высокой устойчивостью к механическим воздействиям, царапинам и потёртостям, а также снижает вес устройства, что делает его удобным для переноски. - Экран ноутбука имеет размер 15,6 дюйма выполнен по технологии IPS, которая обеспечивает хорошее качество изображения, с высокой контрастностью и широким углом обзора. Разрешение экрана составляет 1920x1080 пикселей, что обеспечивает высокую детальность. Антибликовое покрытие экрана помогает снизить нагрузку на зрение при работе в ярко ос... 0
    расскажи как выбрать смартфон игровой
    расскажи о разнице между андроидом и айос подробнее
    расскажи подробнее об операционной системе
    {'long_web_name': 'Смартфон Honor Honor 90 12/512GB изумрудный зеленый (5109ATRU)', 'price': 33990.0, 'description': '', 'rating': 4.73, 'review_count': 37} 1
    Найди самсунг белого цвета в республике башкортостан. Меня зовут Алексей, кстати
    И до 50к с 8 гб оперативы
    {'long_web_name': 'Защитное стекло Remax Medicine Glass GL-27 3D для iPhone 15, черная рамка 0,3 мм', 'price': 247.0, 'url': 'https://megamarket.ru/catalog/details/zashitnoe-steklo-remax-medicine-glass-gl-27-3d-dlya-iphone-15-chernaya-ramka-03-mm-600013601251/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/811/370/081/107/016/600013601251b0.jpeg', 'id': '600013601251', 'description': 'Защитное стекло для Apple iPhone 15/ Айфон 15, противоударное стекло от сколов и царапин на экран айфона Защитное стекло повторяет контуры экрана на 100% и закрывает его полностью от края до края, не оставляя зазоров. Благодаря наличию цветной рамки оно полностью копирует дизайн лицевой панели телефона и не портит его внешний вид. Комплектация Защитное стекло для iPhone 15/ Айфон 15 Спиртовая салфетка Салфетка из микрофибры Стикеры для удаления пыли Инструкция по наклеиванию Надежная упаковка', 'rating': 4.9, 'review_count': 229} 0
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • num_train_epochs: 5
  • warmup_ratio: 0.1
  • fp16: True
  • load_best_model_at_end: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 8
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss Validation Loss item-classification_cosine_ap
0 0 - 0.0241 0.3377
0.0164 100 0.0182 - -
0.0327 200 0.0137 - -
0.0409 250 - 0.0128 0.4945
0.0491 300 0.0135 - -
0.0655 400 0.0132 - -
0.0818 500 0.0098 0.0092 0.7161
0.0982 600 0.0084 - -
0.1146 700 0.0084 - -
0.1228 750 - 0.0059 0.7971
0.1310 800 0.0074 - -
0.1473 900 0.0072 - -
0.1637 1000 0.0059 0.0050 0.8319
0.1801 1100 0.0054 - -
0.1964 1200 0.0052 - -
0.2046 1250 - 0.0046 0.8753
0.2128 1300 0.0048 - -
0.2292 1400 0.0046 - -
0.2455 1500 0.0049 0.0043 0.9045
0.2619 1600 0.0049 - -
0.2783 1700 0.0046 - -
0.2865 1750 - 0.0039 0.9027
0.2946 1800 0.0046 - -
0.3110 1900 0.0045 - -
0.3274 2000 0.0046 0.0035 0.9127
0.3438 2100 0.0043 - -
0.3601 2200 0.0049 - -
0.3683 2250 - 0.0033 0.9300
0.3765 2300 0.0042 - -
0.3929 2400 0.0032 - -
0.4092 2500 0.0038 0.0031 0.9393
0.4256 2600 0.0034 - -
0.4420 2700 0.0042 - -
0.4502 2750 - 0.0030 0.9418
0.4583 2800 0.004 - -
0.4747 2900 0.0042 - -
0.4911 3000 0.004 0.0031 0.9551
0.5074 3100 0.0038 - -
0.5238 3200 0.0041 - -
0.5320 3250 - 0.0032 0.9451
0.5402 3300 0.0041 - -
0.5566 3400 0.0037 - -
0.5729 3500 0.0032 0.0028 0.9585
0.5893 3600 0.0032 - -
0.6057 3700 0.003 - -
0.6138 3750 - 0.0029 0.9531
0.6220 3800 0.0031 - -
0.6384 3900 0.0027 - -
0.6548 4000 0.0024 0.0027 0.9559
0.6711 4100 0.0031 - -
0.6875 4200 0.0025 - -
0.6957 4250 - 0.0027 0.9637
0.7039 4300 0.0032 - -
0.7202 4400 0.0034 - -
0.7366 4500 0.0026 0.0024 0.9679
0.7530 4600 0.0025 - -
0.7694 4700 0.0034 - -
0.7775 4750 - 0.0024 0.9699
0.7857 4800 0.0024 - -
0.8021 4900 0.0034 - -
0.8185 5000 0.0028 0.0025 0.9624
0.8348 5100 0.0036 - -
0.8512 5200 0.0025 - -
0.8594 5250 - 0.0024 0.9666
0.8676 5300 0.0034 - -
0.8839 5400 0.0026 - -
0.9003 5500 0.0032 0.0024 0.9673
0.9167 5600 0.0032 - -
0.9330 5700 0.0043 - -
0.9412 5750 - 0.0026 0.9662
0.9494 5800 0.0027 - -
0.9658 5900 0.0024 - -
0.9822 6000 0.0037 0.0025 0.9691
0.9985 6100 0.0028 - -
1.0149 6200 0.0031 - -
1.0231 6250 - 0.0023 0.9671
1.0313 6300 0.0029 - -
1.0476 6400 0.003 - -
1.0640 6500 0.0027 0.0021 0.9689
1.0804 6600 0.0033 - -
1.0967 6700 0.0027 - -
1.1049 6750 - 0.0021 0.9735
1.1131 6800 0.0029 - -
1.1295 6900 0.0023 - -
1.1459 7000 0.0026 0.0020 0.9733
1.1622 7100 0.0024 - -
1.1786 7200 0.0029 - -
1.1868 7250 - 0.0021 0.9711
1.1950 7300 0.0023 - -
1.2113 7400 0.0024 - -
1.2277 7500 0.0031 0.0021 0.9753
1.2441 7600 0.0026 - -
1.2604 7700 0.0019 - -
1.2686 7750 - 0.0020 0.9713
1.2768 7800 0.0029 - -
1.2932 7900 0.0022 - -
1.3095 8000 0.0032 0.0020 0.9753
1.3259 8100 0.0021 - -
1.3423 8200 0.002 - -
1.3505 8250 - 0.0020 0.9744
1.3587 8300 0.003 - -
1.3750 8400 0.0027 - -
1.3914 8500 0.0019 0.0020 0.9752
1.4078 8600 0.0022 - -
1.4241 8700 0.002 - -
1.4323 8750 - 0.0020 0.9742
1.4405 8800 0.0021 - -
1.4569 8900 0.0023 - -
1.4732 9000 0.0026 0.0019 0.9749
1.4896 9100 0.0018 - -
1.5060 9200 0.0023 - -
1.5142 9250 - 0.0019 0.9753
1.5223 9300 0.0026 - -
1.5387 9400 0.0022 - -
1.5551 9500 0.0027 0.0020 0.9772
1.5715 9600 0.002 - -
1.5878 9700 0.0019 - -
1.5960 9750 - 0.0020 0.9776
1.6042 9800 0.0018 - -
1.6206 9900 0.0019 - -
1.6369 10000 0.0016 0.0020 0.9775
1.6533 10100 0.0017 - -
1.6697 10200 0.0017 - -
1.6779 10250 - 0.0019 0.9766
1.6860 10300 0.0014 - -
1.7024 10400 0.0019 - -
1.7188 10500 0.0023 0.0020 0.9769
1.7351 10600 0.0023 - -
1.7515 10700 0.0017 - -
1.7597 10750 - 0.0019 0.9760
1.7679 10800 0.0022 - -
1.7843 10900 0.0017 - -
1.8006 11000 0.0023 0.0019 0.9820
1.8170 11100 0.0018 - -
1.8334 11200 0.0024 - -
1.8415 11250 - 0.0020 0.9797
1.8497 11300 0.0016 - -
1.8661 11400 0.0023 - -
1.8825 11500 0.002 0.0020 0.9799
1.8988 11600 0.0022 - -
1.9152 11700 0.0018 - -
1.9234 11750 - 0.0021 0.9797
1.9316 11800 0.0028 - -
1.9479 11900 0.0022 - -
1.9643 12000 0.0015 0.0021 0.9799
1.9807 12100 0.0026 - -
1.9971 12200 0.0019 - -
2.0052 12250 - 0.0020 0.9807
2.0134 12300 0.0022 - -
2.0298 12400 0.0022 - -
2.0462 12500 0.0023 0.0019 0.9773
2.0625 12600 0.0022 - -
2.0789 12700 0.0024 - -
2.0871 12750 - 0.0019 0.9802
2.0953 12800 0.0018 - -
2.1116 12900 0.0019 - -
2.1280 13000 0.0019 0.0018 0.9815
2.1444 13100 0.0019 - -
2.1607 13200 0.0019 - -
2.1689 13250 - 0.0018 0.9818
2.1771 13300 0.0023 - -
2.1935 13400 0.0016 - -
2.2099 13500 0.0014 0.0019 0.9811
2.2262 13600 0.0022 - -
2.2426 13700 0.002 - -
2.2508 13750 - 0.0018 0.9817
2.2590 13800 0.0015 - -
2.2753 13900 0.0023 - -
2.2917 14000 0.0017 0.0019 0.9795
2.3081 14100 0.0025 - -
2.3244 14200 0.0017 - -
2.3326 14250 - 0.0018 0.9818
2.3408 14300 0.0016 - -
2.3572 14400 0.0019 - -
2.3735 14500 0.0019 0.0018 0.9825
2.3899 14600 0.0018 - -
2.4063 14700 0.0015 - -
2.4145 14750 - 0.0018 0.9829
2.4227 14800 0.0017 - -
2.4390 14900 0.0019 - -
2.4554 15000 0.0019 0.0018 0.9795
2.4718 15100 0.0018 - -
2.4881 15200 0.0012 - -
2.4963 15250 - 0.0018 0.9795
2.5045 15300 0.0017 - -
2.5209 15400 0.0019 - -
2.5372 15500 0.0018 0.0019 0.9801
2.5536 15600 0.0018 - -
2.5700 15700 0.0018 - -
2.5782 15750 - 0.0018 0.9805
2.5863 15800 0.0014 - -
2.6027 15900 0.0013 - -
2.6191 16000 0.0012 0.0017 0.9817
2.6355 16100 0.0013 - -
2.6518 16200 0.0011 - -
2.6600 16250 - 0.0018 0.9812
2.6682 16300 0.0012 - -
2.6846 16400 0.0009 - -
2.7009 16500 0.0015 0.0018 0.9809
2.7173 16600 0.0015 - -
2.7337 16700 0.0019 - -
2.7419 16750 - 0.0018 0.9811
2.7500 16800 0.0014 - -
2.7664 16900 0.0017 - -
2.7828 17000 0.001 0.0018 0.9817
2.7991 17100 0.0016 - -
2.8155 17200 0.0014 - -
2.8237 17250 - 0.0019 0.9829
2.8319 17300 0.0017 - -
2.8483 17400 0.0012 - -
2.8646 17500 0.0014 0.0018 0.9820
2.8810 17600 0.0014 - -
2.8974 17700 0.0017 - -
2.9055 17750 - 0.0018 0.9822
2.9137 17800 0.0016 - -
2.9301 17900 0.0017 - -
2.9465 18000 0.0018 0.0018 0.9818
2.9628 18100 0.0011 - -
2.9792 18200 0.0019 - -
2.9874 18250 - 0.0018 0.9817
2.9956 18300 0.0014 - -
3.0119 18400 0.0017 - -
3.0283 18500 0.0016 0.0017 0.9827
3.0447 18600 0.0015 - -
3.0611 18700 0.0014 - -
3.0692 18750 - 0.0017 0.9833
3.0774 18800 0.0021 - -
3.0938 18900 0.0013 - -
3.1102 19000 0.0012 0.0018 0.9844
3.1265 19100 0.0017 - -
3.1429 19200 0.0015 - -
3.1511 19250 - 0.0017 0.9840
3.1593 19300 0.0015 - -
3.1756 19400 0.0017 - -
3.1920 19500 0.0011 0.0017 0.9831
3.2084 19600 0.001 - -
3.2248 19700 0.0014 - -
3.2329 19750 - 0.0017 0.9836
3.2411 19800 0.0016 - -
3.2575 19900 0.0013 - -
3.2739 20000 0.0017 0.0017 0.9824
3.2902 20100 0.0013 - -
3.3066 20200 0.002 - -
3.3148 20250 - 0.0017 0.9813
3.3230 20300 0.0015 - -
3.3393 20400 0.0011 - -
3.3557 20500 0.0016 0.0017 0.9812
3.3721 20600 0.0016 - -
3.3884 20700 0.0015 - -
3.3966 20750 - 0.0017 0.9825
3.4048 20800 0.0012 - -
3.4212 20900 0.0012 - -
3.4376 21000 0.001 0.0017 0.9812
3.4539 21100 0.0019 - -
3.4703 21200 0.0014 - -
3.4785 21250 - 0.0017 0.9816
3.4867 21300 0.0009 - -
3.5030 21400 0.0012 - -
3.5194 21500 0.0015 0.0018 0.9823
3.5358 21600 0.0014 - -
3.5521 21700 0.0015 - -
3.5603 21750 - 0.0018 0.9814
3.5685 21800 0.0011 - -
3.5849 21900 0.0012 - -
3.6012 22000 0.001 0.0017 0.9822
3.6176 22100 0.0012 - -
3.6340 22200 0.0009 - -
3.6422 22250 - 0.0017 0.9823
3.6504 22300 0.0011 - -
3.6667 22400 0.001 - -
3.6831 22500 0.0008 0.0016 0.9825
3.6995 22600 0.0011 - -
3.7158 22700 0.0014 - -
3.7240 22750 - 0.0017 0.9826
3.7322 22800 0.0015 - -
3.7486 22900 0.001 - -
3.7649 23000 0.001 0.0017 0.9822
3.7813 23100 0.001 - -
3.7977 23200 0.0014 - -
3.8059 23250 - 0.0017 0.9836
3.8140 23300 0.0009 - -
3.8304 23400 0.0013 - -
3.8468 23500 0.001 0.0017 0.9845
3.8632 23600 0.001 - -
3.8795 23700 0.001 - -
3.8877 23750 - 0.0017 0.9848
3.8959 23800 0.0014 - -
3.9123 23900 0.0017 - -
3.9286 24000 0.0011 0.0017 0.9845
3.9450 24100 0.0014 - -
3.9614 24200 0.0009 - -
3.9696 24250 - 0.0019 0.9851
3.9777 24300 0.0015 - -
3.9941 24400 0.0014 - -
4.0105 24500 0.0013 0.0017 0.9862
4.0268 24600 0.0011 - -
4.0432 24700 0.0014 - -
4.0514 24750 - 0.0016 0.9848
4.0596 24800 0.0012 - -
4.0760 24900 0.0014 - -
4.0923 25000 0.0013 0.0017 0.9857
4.1087 25100 0.0008 - -
4.1251 25200 0.0011 - -
4.1332 25250 - 0.0017 0.9858
4.1414 25300 0.0013 - -
4.1578 25400 0.0012 - -
4.1742 25500 0.0012 0.0017 0.9858
4.1905 25600 0.0013 - -
4.2069 25700 0.0008 - -
4.2151 25750 - 0.0017 0.9855
4.2233 25800 0.0009 - -
4.2396 25900 0.0012 - -
4.2560 26000 0.0011 0.0016 0.9849
4.2724 26100 0.0015 - -
4.2888 26200 0.0009 - -
4.2969 26250 - 0.0017 0.9844
4.3051 26300 0.0013 - -
4.3215 26400 0.0011 - -
4.3379 26500 0.001 0.0017 0.9844
4.3542 26600 0.0014 - -
4.3706 26700 0.0012 - -
4.3788 26750 - 0.0016 0.9841
4.3870 26800 0.0013 - -
4.4033 26900 0.0011 - -
4.4197 27000 0.001 0.0016 0.9845
4.4361 27100 0.0008 - -
4.4524 27200 0.0016 - -
4.4606 27250 - 0.0016 0.9839
4.4688 27300 0.0011 - -
4.4852 27400 0.0008 - -
4.5016 27500 0.0009 0.0016 0.9847
4.5179 27600 0.0014 - -
4.5343 27700 0.0011 - -
4.5425 27750 - 0.0017 0.9849
4.5507 27800 0.0011 - -
4.5670 27900 0.0008 - -
4.5834 28000 0.001 0.0016 0.9846
4.5998 28100 0.0008 - -
4.6161 28200 0.0008 - -
4.6243 28250 - 0.0016 0.9839
4.6325 28300 0.0008 - -
4.6489 28400 0.0007 - -
4.6652 28500 0.0007 0.0016 0.9843
4.6816 28600 0.0008 - -
4.6980 28700 0.0008 - -
4.7062 28750 - 0.0016 0.9843
4.7144 28800 0.0011 - -
4.7307 28900 0.0014 - -
4.7471 29000 0.0008 0.0016 0.9841
4.7635 29100 0.0009 - -
4.7798 29200 0.0006 - -
4.7880 29250 - 0.0016 0.9840
4.7962 29300 0.001 - -
4.8126 29400 0.0006 - -
4.8289 29500 0.0013 0.0016 0.9843
4.8453 29600 0.0007 - -
4.8617 29700 0.0008 - -
4.8699 29750 - 0.0016 0.9844
4.8780 29800 0.001 - -
4.8944 29900 0.0011 - -
4.9108 30000 0.0013 0.0016 0.9846
4.9272 30100 0.001 - -
4.9435 30200 0.0012 - -
4.9517 30250 - 0.0017 0.9848
4.9599 30300 0.0007 - -
4.9763 30400 0.001 - -
4.9926 30500 0.0011 0.0017 0.9849
5.0 30545 - 0.0016 0.9839
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.13
  • Sentence Transformers: 3.3.1
  • Transformers: 4.47.1
  • PyTorch: 2.2.1
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

ContrastiveLoss

@inproceedings{hadsell2006dimensionality,
    author={Hadsell, R. and Chopra, S. and LeCun, Y.},
    booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
    title={Dimensionality Reduction by Learning an Invariant Mapping},
    year={2006},
    volume={2},
    number={},
    pages={1735-1742},
    doi={10.1109/CVPR.2006.100}
}