denis-gordeev's picture
Add new SentenceTransformer model
129e5cf verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:3136
  - loss:ContrastiveLoss
base_model: sergeyzh/rubert-tiny-turbo
widget:
  - source_sentence: >-
      Здравствуйте! Я ищу узкую посудомоечную машину шириной 45 см. Какие модели
      вы можете порекомендовать?
    sentences:
      - >-
        {'long_web_name': 'Microsoft Office Home and Student 2019 Rus Only
        Medialess P6 79G-05207', 'price': 3000.0, 'url':
        'https://megamarket.ru/catalog/details/microsoft-office-home-and-student-2019-rus-only-medialess-p6-79g-05207-600005002855/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-14/481/134/111/161/848/600005002855b0.jpeg',
        'id': '600005002855_78577', 'description': 'Артикул № 764312       
        Microsoft Office 2019 для дома и учёбы – это пакет самых популярных
        офисных продуктов от Microsoft. Неважно, пользуетесь вы Windows или Mac
        OS, эти программы обязательно пригодятся вам для учебных или домашних
        задач. В комплект Microsoft Office 2019 для дома и учёбы входят:  Word –
        текстовый редактор с широкими возможностями форматирования текста; Excel
        – инструмент для работы с таблицами и формулами; Power Point –
        приложение для создания презентаций.', 'rating': 4.5, 'review_count':
        16}
      - >-
        {'long_web_name': 'Увлажнитель воздуха Timberk T-HU4-A16M-W', 'price':
        13990.0, 'url':
        'https://megamarket.ru/catalog/details/uvlazhnitel-vozduha-timberk-t-hu4-a16m-w-100029966849/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/949/265/041/114/131/8/100029966849b0.jpg',
        'id': '100029966849', 'description': '<p>Увлажнитель воздуха Timberk
        T-HU4-A16M-W использует технологию распыления при помощи ультразвуковой
        мембраны. Это помогает получить чрезвычайно мелкие капли. Мощности
        достаточно для обслуживания помещения вплоть до 30 м?. Отсек для воды на
        4 л обеспечивает работу до 14 часов.</p>\n <h2>Легкое дыхание с пользой
        для здоровья</h2>\n <p>Производитель предусмотрел такие опции, которые
        положительно сказались на комфорте при эксплуатации:</p>\n <ul>\n
        <li>удобное механическое управление при помощи поворотного регулятора на
        корпусе устройства;</li>\n <li>наличие ароматического режима работы,
        который обогащает воздух смесями с антибактериальными свойствами;</li>\n
        <li>верхний залив жидкости, что позволяет быстро производить дозаправку,
        не изымая полностью резервуар.</li>\n </ul>\n <p>Прибор можно
        использовать и в ночное время суток, так как уровень шума не превышает
        35 дБ. Для безопасной работы предусмотрена функция автоматического
        отключения при опустошении резервуара.</p>', 'rating': 4.74,
        'review_count': 331}
      - >-
        {'long_web_name': 'Зарядное утсройство блок кабель для телефона 3A USB
        Type-C 25W', 'price': 890.0, 'url':
        'https://megamarket.ru/catalog/details/zaryadnoe-utsroystvo-blok-kabel-dlya-telefona-3a-usb-type-c-25w-600015086154/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/231/789/941/100/19/600015086154b0.png',
        'id': '600015086154', 'description': '<p>Зарядное устройство 25W PD –
        это компактное и удобное устройство, предназначенное для быстрой и
        эффективной зарядки вашего устройства. С ним сможете зарядить ваше
        устройство до 50% всего за 30 минут благодаря его высокой мощности 25W.
        Технология PD ( Power Delivery ) обеспечивает умную и оптимальную
        зарядку, которая автоматически адаптируется к вашему устройству для
        максимальной производительности. Кабель и блок имеет универсальный USB-C
        порт, что позволяет вам заряжать различные совместимые устройства,
        включая смартфоны, планшеты, наушники и другие гаджеты. Компактный
        дизайн делают зарядник, идеальным для путешествий и использования на
        ходу. Блок зарядки также обладает многоуровневой защитой от перегрузки,
        короткого замыкания, перегрева и других повреждений, обеспечивая
        безопасность и долговечность вашего устройства. Будьте уверены, что ваше
        устройство будет заряжаться быстро, эффективно и безопасно с помощью
        сетевого адаптера. Это надежное и удобное устройство, которое поможет
        вам всегда оставаться подключенным и готовым к действию.</p>', 'rating':
        0.0, 'review_count': 0}
  - source_sentence: >-
      Здравствуйте! Мне нужны редукторы для моего блендера. Это те детали,
      которые помогают передавать вращение от мотора к ножам. Не подскажете,
      есть ли у вас такие в наличии?
    sentences:
      - >-
        {'long_web_name': 'Цифро-аналоговый преобразователь Hiby Hiby W5',
        'price': 9005.0, 'url':
        'https://megamarket.ru/catalog/details/cifro-analogovyy-preobrazovatel-hiby-hiby-w5-600004460473/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/101/310/993/491/164/600004460473b0.jpeg',
        'id': '600004460473', 'description': 'Hiby W5 – современный
        Bluetooth-адаптер с ЦАП и усилителем для наушников. Девайс оснащён
        продвинутым чипом ЦАП ES9218P от ESS Technology в сочетании с
        микросхемой CSR8675 от Quallcomm, отвечающей за работу по
        Bluetooth.Адаптер поддерживает Bluetooth спецификации 5.0 и абсолютное
        большинство современных кодеков, включая UAT, LDAC, aptX, aptX HD, aptX
        LL, SBC и AAC. \xa0Разработка Hiby – кодек UAT позволяет обрабатывать
        аудио с частотой дискретизации до 192 кГц и битрейтом 1,2 Мбит/c, что
        превышает показатели даже всемирно известного LDAC от Sony. UAT
        совместим с мобильными телефонами и Hi-Fi-плеерами на базе Android.
        Например, поддержку имеют все плееры HiBy, Hidizs AP80, Cayin N8 и
        другие устройства с ОС HiBy. Пользователям Android необходимо будет
        установить приложение HiByMusic.Корпус W5 имеет компактный размер, он
        выполнен из нержавеющей стали и защищён от влаги и пыли по стандарту
        IP67. Адаптер поставляется с карманным зажимом, благодаря чему его можно
        легко разместить на одежде.Hiby W5 оснащен встроенным микрофоном и
        пультом. Одним щелчком мыши вы можете переключаться между
        воспроизведением музыки и ответом на звонок.Благодаря встроенному
        аккумулятору и зарядному чехлу, который может полностью зарядить W5 не
        менее пяти раз, устройство способно обеспечить до 20 часов
        воспроизведения.', 'rating': 5.0, 'review_count': 3}
      - >-
        {'long_web_name': 'Охлаждающая подставка для ноутбука KS-IS KS-740 до
        19"', 'price': 3290.0, 'url':
        'https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg',
        'id': '600010906101', 'description': 'Охлаждающая подставка для ноутбука
        с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со
        скоростью 2000об/мин, значительно рассеивает тепло от ноутбука,
        обеспечивает его хорошее рабочее состояние и продлевает срок службы.
        вашего ноутбука. Прочная охлаждающая подставка для ноутбука Поверхность
        охлаждающей подставки изготовлена из алюминиевого сплава, который может
        отводить тепло от ноутбука, улучшать рассеивание тепла и обеспечивает
        вашему ноутбуку износостойкую и прочную поверхность для переноски, что
        позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая
        подставка для ноутбука с 3 регулировками по высоте Три регулируемых
        настройки высоты, чтобы поставить подставку в вертикальное или плоское
        положение и удерживать ноутбук в подходящем положении. Специальная
        перегородка на подставке предотвращает скольжение или падение вашего
        ноутбука.  Два USB-порта Просто подключите подставку в USB-порт вашего
        ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для
        передачи данных или подключения других устройств, в комплект входит один
        USB-кабель. Сверхтихие кулеры для ноутбука Конструкция подставки для
        охлаждения ноутбука с шумоподавлением делает ее не беспокоящей вас даже
        при максимальной мощности, позволяя вам сосредоточиться на просмотре
        видео или работе, обеспечивая комфортную рабочую среду. Скорость
        вентиляторов регулируется, Вы можете подобрать оптимальный режим для
        работы.  Подготовка подставки к работе  1) подключите кабель USB из
        комплекта поставки одним концом в USB порт подставки (на тыльной ее
        части), другим концом в порт USB (рекомендуется порт стандарта не ниже
        USB 3.2 Gen 1) ноутбука  2) включите подставку (кнопка включения на
        тыльной стороне)  3) выберите оптимальный цвет подсветки RGB
        (переключается кнопкой на тыльной стороне подставки) и скорость вращения
        вентиляторов (регулятор-колесико расположен на правой стороне подставки)
        Характеристики Подсветка RGB (8 режимов)  Материал корпуса- ABS пластик,
        металл  Количество вентиляторов - 3  Размер вентиляторов - 80 х 80 мм,
        воздушный поток: 76м3/ч  Скорость вращения вентиляторов 2000 - 2500
        об/мин (+-10%)  Низкий уровень шума 20 дБА  Совместима с ноутбуками с
        размером экрана До 19 дюймов  Регулируется по высоте , 3 уровня
        регулировки положений  USB - 2 порта USB 1.1. Один порт для питания
        подставки, второй для подключения переферийного USB устройства.  Размер
        без упаковки - 42x27x3 см', 'rating': 4.6, 'review_count': 49}
      - >-
        {'long_web_name': 'Аксессуар для видеокарты NVIDIA RTX LOW PROFILE
        BRACKET A2000', 'price': 783.0, 'url':
        'https://megamarket.ru/catalog/details/planka-dlya-videokarty-rtx-low-profile-bracket-a2000-12gb-nvidia-100046937787/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/109/972/170/425/191/5/100046937787b0.jpg',
        'id': '100046937787', 'description': '', 'rating': 0.0, 'review_count':
        0}
  - source_sentence: >-
      Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать их
      в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей
      скоростью записи. Можете помочь выбрать?
    sentences:
      - >-
        {'long_web_name': 'Сетевое зарядное устройство Apple MHJE3ZM/A 20W Power
        Adapter, 1xUSB Type-C, 2.2A, white', 'price': 990.0, 'description':
        '<div><p>Сетевое зарядное устройство Apple MHJE3ZM/A 20W Power Adapter,
        1xUSB Type-C, 2.2A, white — универсальная модель, совместимая со всеми
        современными гаджетами.</p>\n<h2>Продуманная конструкция</h2>\n<p>Корпус
        выполнен из качественного пластика — прочный материал, устойчивый к
        механическим повреждениям. Дополнительные технические
        параметры:</p>\n<ul>\n<li>Подходит для зарядки смартфонов, планшетов,
        ноутбуков, наушников и других устройств.</li>\n<li>Стандарт быстрой
        зарядки Power Delivery обеспечивает высокую скорость передачи
        энергии.</li>\n<li>Защита от короткого замыкания и перегрева продлевают
        срок службы.</li>\n</ul>\n<p>Мощность 20 Вт позволяет быстро зарядить
        аккумулятор практически любого современного гаджета. Для удобства
        использования предусмотрен съемный кабель.</p></div>', 'rating': 4.8,
        'review_count': 8132}
      - >-
        {'long_web_name': 'Охлаждающая подставка для ноутбука KS-IS KS-740 до
        19"', 'price': 3290.0, 'url':
        'https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg',
        'id': '600010906101', 'description': 'Охлаждающая подставка для ноутбука
        с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со
        скоростью 2000об/мин, значительно рассеивает тепло от ноутбука,
        обеспечивает его хорошее рабочее состояние и продлевает срок службы.
        вашего ноутбука. Прочная охлаждающая подставка для ноутбука Поверхность
        охлаждающей подставки изготовлена из алюминиевого сплава, который может
        отводить тепло от ноутбука, улучшать рассеивание тепла и обеспечивает
        вашему ноутбуку износостойкую и прочную поверхность для переноски, что
        позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая
        подставка для ноутбука с 3 регулировками по высоте Три регулируемых
        настройки высоты, чтобы поставить подставку в вертикальное или плоское
        положение и удерживать ноутбук в подходящем положении. Специальная
        перегородка на подставке предотвращает скольжение или падение вашего
        ноутбука.  Два USB-порта Просто подключите подставку в USB-порт вашего
        ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для
        передачи данных или подключения других устройств, в комплект входит один
        USB-кабель. Сверхтихие кулеры для ноутбука Конструкция подставки для
        охлаждения ноутбука с шумоподавлением делает ее не беспокоящей вас даже
        при максимальной мощности, позволяя вам сосредоточиться на просмотре
        видео или работе, обеспечивая комфортную рабочую среду. Скорость
        вентиляторов регулируется, Вы можете подобрать оптимальный режим для
        работы.  Подготовка подставки к работе  1) подключите кабель USB из
        комплекта поставки одним концом в USB порт подставки (на тыльной ее
        части), другим концом в порт USB (рекомендуется порт стандарта не ниже
        USB 3.2 Gen 1) ноутбука  2) включите подставку (кнопка включения на
        тыльной стороне)  3) выберите оптимальный цвет подсветки RGB
        (переключается кнопкой на тыльной стороне подставки) и скорость вращения
        вентиляторов (регулятор-колесико расположен на правой стороне подставки)
        Характеристики Подсветка RGB (8 режимов)  Материал корпуса- ABS пластик,
        металл  Количество вентиляторов - 3  Размер вентиляторов - 80 х 80 мм,
        воздушный поток: 76м3/ч  Скорость вращения вентиляторов 2000 - 2500
        об/мин (+-10%)  Низкий уровень шума 20 дБА  Совместима с ноутбуками с
        размером экрана До 19 дюймов  Регулируется по высоте , 3 уровня
        регулировки положений  USB - 2 порта USB 1.1. Один порт для питания
        подставки, второй для подключения переферийного USB устройства.  Размер
        без упаковки - 42x27x3 см', 'rating': 4.6, 'review_count': 49}
      - >-
        {'long_web_name': 'Швейная машина Janome Excellent Stitch 300', 'price':
        50509.0, 'url':
        'https://megamarket.ru/catalog/details/shveynaya-mashina-janome-excellent-stitch-300-600005235554/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/146/900/512/815/46/600005235554b0.jpeg',
        'id': '600005235554_87239', 'description': '<div><p>Швейная машина
        Janome Excellent Stitch 300 – это устройство, которое поможет создать
        красивую вещь даже начинающему пользователю.</p>\n<h2>Современная
        техника</h2>\n<p>Машина оснащена компьютерным управлением, что позволяет
        ей самостоятельно выбирать оптимальную длину и ширину стежка, а также
        регулировать давление лапки на ткань. Пользователь может выбрать одну из
        300 встроенных программ, среди которых есть как самые простые строчки,
        так и сложные декоративные элементы. Также есть возможность создания
        собственных рисунков. К особенностям модели
        относятся:</p>\n<ul>\n<li>ротационный горизонтальный челнок обеспечивает
        ровную и гладкую строчку;</li>\n<li>максимальная скорость шитья
        составляет 820 стежков в минуту;</li>\n<li>есть функция реверса,
        позволяющая распустить неправильно сделанный шов.</li>\n</ul>\n<p>Помимо
        этого, предусмотрены дополнительные аксессуары, которые входят в
        комплект поставки. Это позволит сразу приступить к работе после
        приобретения устройства.</p></div>', 'rating': 5.0, 'review_count': 3}
  - source_sentence: >-
      Здравствуйте! Я хочу купить пылесос, который небольшой и удобный, чтобы им
      можно было быстро убирать мусор с пола. Подскажите, пожалуйста, у вас есть
      такие вертикальные пылесосы?
    sentences:
      - >-
        {'long_web_name': 'Пылесос Gorenje SVC252FMWT белый', 'price': 17099.0,
        'description': '', 'rating': 4.61, 'review_count': 23}
      - >-
        {'long_web_name': 'Встраиваемая посудомоечная машина KUPPERSBERG GSM
        6074', 'price': 47699.0, 'url':
        'https://megamarket.ru/catalog/details/posudomoechnaya-mashina-kuppersberg-gsm-6074-600005006810/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/106/877/513/742/316/30/600005006810b0.jpg',
        'id': '600005006810', 'description': 'Встраиваемая посудомоечная машина
        GSM 6074 шириной 60 см один из незаменимых кухонных бытовых приборов на
        любой кухне. Удобство данного агрегата заключается в выполнении ряда
        функций:способность вместить 14 комплектов посуды;программирование по 7
        режимам;3 регулируемых корзины для столовых приборов;специальная полка
        для чашек.Aquastop - функция Аква Стоп обезопасит вас от протечекРежим
        «Все в 1» автоматически подберет программу, исходя из особенностей
        моющего средства.Решитесь приобрести посудомоечную машину GSM 6074 для
        того, чтобы наслаждаться безупречной чистотой вымытой посуды.',
        'rating': 4.7, 'review_count': 123}
      - >-
        {'long_web_name': 'Бокс внешний для жесткого диска UGREEN US221 30847
        2.5 Inch Hard Drive Box с кабелем USB', 'price': 1520.0, 'url':
        'https://megamarket.ru/catalog/details/boks-vneshniy-dlya-zhestkogo-diska-ugreen-us221-30847-25-inch-hard-drive-box-s-kabelem-usb-600010907194/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/517/639/817/785/8/600010907194b0.png',
        'id': '600010907194', 'description': '<p>Вход: USB A 3.0 Male. Выход:
        (7+15)Pin SATA 3.0 порт. Чипсет: VL711F0. SATA 3.0, скорость до 6
        Гбит/с, совместимость с SATA 2.0/1.0 *USB 3.0, скорость до 5 Гбит/с,
        совместимость с USB 2.0 и 1.1 *Для 9,5 мм 7,5 мм 2,5 дюйма SATA I II
        III, HDD, SSD до 6 ТБ. Поддержка UASP. Не нужны дополнительные
        инструменты для установки. Поддерживает операционные системы Windows
        2000 / XP / Vista / 7/8 / 8.1 / 10, LINUX, Mac OS 8.0 и выше. Размер:
        Д128,5 x Ш82 x В14 (мм). Длина кабеля: 30 см.</p>', 'rating': 5.0,
        'review_count': 18}
  - source_sentence: >-
      Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно
      SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов.
      Можете помочь подобрать подходящий?
    sentences:
      - >-
        {'long_web_name': 'Сумка унисекс K&F Concept Storage Bag черная,
        26х16х10 см', 'price': 3259.0, 'description': '<p>Поместится все <p>В
        сумке предусмотрено 23 отделения для хранения самых разных вещей:
        смартфон, зарядное устройство, кабели для передачи данных,
        usb-накопители, ключи от машины, банковские карты и прочие ценности </p>
        Полный или частичный доступ <p>Удобная функция открытия и закрытия на
        120° позволяет использовать несколько комбинаций внутренних отсеков,
        обеспечивая высокую степень свободы в адаптации к различным сценариям
        использования, делая организацию вещей еще более удобной </p> Для
        путешествий и работы <p>Компактная и легкая сумка весом всего 250 г -
        идеальный выбор для деловых встреч или путешествий. Она не занимает
        много места в чемодане или рюкзаке, но при этом обладает внушительной
        вместимостью </p> Прочные и надежные материалы изготовления <p>Модель
        изготовлена из водонепроницаемого нейлона, с высокопрочной строчкой и
        противоугонной молнией, гарантирующей износостойкость и долговечность.
        Она надежно защищает хранящиеся внутри вещи от каких либо повреждений
        </p> Водонепроницаемый нейлон <p>Благодаря водонепроницаемому нейлону
        сумка не пропускает влагу внутрь, а также обеспечивает легкий уход за
        внешней поверхностью. Внутри модель оснащена эластичной тканью,
        отличающейся особой мягкостью и безопасностью для хрупких предметов или
        гаджетов </p></p>', 'rating': 0.0, 'review_count': 0}
      - >-
        {'long_web_name': 'Внешний SSD диск KingSpec 240 ГБ Z3-240', 'price':
        4129.0, 'description': '', 'rating': 0.0, 'review_count': 0}
      - >-
        {'long_web_name': 'Моноблок MSI AM272P 12M-400RU White
        (9S6-AF8212-498)', 'price': 122661.0, 'url':
        'https://megamarket.ru/catalog/details/monoblok-msi-am272p-12m-400ru-white-9s6-af8212-498-100068211829/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/125/947/036/513/181/4/100068211829b0.webp',
        'id': '100068211829', 'description': '', 'rating': 0.0, 'review_count':
        0}
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
  - cosine_accuracy_threshold
  - cosine_f1
  - cosine_f1_threshold
  - cosine_precision
  - cosine_recall
  - cosine_ap
model-index:
  - name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
    results:
      - task:
          type: binary-classification
          name: Binary Classification
        dataset:
          name: item classification
          type: item-classification
        metrics:
          - type: cosine_accuracy
            value: 0.9617346938775511
            name: Cosine Accuracy
          - type: cosine_accuracy_threshold
            value: 0.8327065110206604
            name: Cosine Accuracy Threshold
          - type: cosine_f1
            value: 0.88
            name: Cosine F1
          - type: cosine_f1_threshold
            value: 0.8327065110206604
            name: Cosine F1 Threshold
          - type: cosine_precision
            value: 0.873015873015873
            name: Cosine Precision
          - type: cosine_recall
            value: 0.8870967741935484
            name: Cosine Recall
          - type: cosine_ap
            value: 0.9106157533671668
            name: Cosine Ap

SentenceTransformer based on sergeyzh/rubert-tiny-turbo

This is a sentence-transformers model finetuned from sergeyzh/rubert-tiny-turbo. It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: sergeyzh/rubert-tiny-turbo
  • Maximum Sequence Length: 2048 tokens
  • Output Dimensionality: 312 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-4")
# Run inference
sentences = [
    'Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов. Можете помочь подобрать подходящий?',
    "{'long_web_name': 'Внешний SSD диск KingSpec 240 ГБ Z3-240', 'price': 4129.0, 'description': '', 'rating': 0.0, 'review_count': 0}",
    "{'long_web_name': 'Моноблок MSI AM272P 12M-400RU White (9S6-AF8212-498)', 'price': 122661.0, 'url': 'https://megamarket.ru/catalog/details/monoblok-msi-am272p-12m-400ru-white-9s6-af8212-498-100068211829/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/125/947/036/513/181/4/100068211829b0.webp', 'id': '100068211829', 'description': '', 'rating': 0.0, 'review_count': 0}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Binary Classification

Metric Value
cosine_accuracy 0.9617
cosine_accuracy_threshold 0.8327
cosine_f1 0.88
cosine_f1_threshold 0.8327
cosine_precision 0.873
cosine_recall 0.8871
cosine_ap 0.9106

Training Details

Training Dataset

Unnamed Dataset

  • Size: 3,136 training samples
  • Columns: anchor, text, and label
  • Approximate statistics based on the first 1000 samples:
    anchor text label
    type string string int
    details
    • min: 23 tokens
    • mean: 43.03 tokens
    • max: 91 tokens
    • min: 52 tokens
    • mean: 313.24 tokens
    • max: 1009 tokens
    • 0: ~81.90%
    • 1: ~18.10%
  • Samples:
    anchor text label
    Привет! Подскажите, пожалуйста, у вас есть средства для чистки и ухода за холодильником? Ищу что-то недорогое, но эффективное. {'long_web_name': 'Смартфон Huawei nova 10 8/128Gb Starry Silver', 'price': 29590.0, 'url': 'https://megamarket.ru/catalog/details/pda-huawei-nco-lx1-8-128gb-s-100057069468/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-98/769/723/010/212/31/100057069468b0.jpg', 'id': '100057069468', 'description': '

    Смартфон Huawei nova 10 8/128Gb Starry Silver — это современный гаджет, который позволяет общаться, работать и развлекаться.

    \n

    Помогает оставаться на связи

    \n

    Устройство оснащено большим экраном с высоким разрешением. На нем удобно смотреть фильмы, играть в игры и читать книги. Есть встроенные динамики, которые обеспечивают качественный звук. Другие параметры смартфона:

    \n
      \n
    • основная камера состоит из трех модулей — они делают яркие и детализированные снимки;
    • \n
    • встроенный сканер отпечатков пальцев — для быстрого доступа к устройству;
    • \n
    • поддерживает функцию бесконтактной оплаты через Google Pay.
    • \n
    \n

    Смартфон работае...

    0
    Здравствуйте! Я Андрей, мне 38 лет, я покупаю у вас товары для своего бизнеса по ремонту бытовой техники в Воронеже. Мне нужны моноблоки — это такие настольные компьютеры, где всё встроено в монитор. Интересуют недорогие модели для тестирования программного обеспечения и проведения диагностики. Можете порекомендовать что-то подходящее? {'long_web_name': 'Моноблок MSI PRO AP242 12M-450RU белый', 'price': 78299.0, 'description': '

    Моноблок MSI Pro AP242 12M-450RU — это производительная рабочая станция для офисных задач.

    \n

    Комфортная работа

    \n

    Корпус выполнен в белом цвете. Матовое покрытие дисплея защищает от бликов. Другие технические параметры:

    \n
      \n
    • мощный процессор Intel Core i5 12400;
    • \n
    • графический чип UHD Graphics 730;
    • \n
    • оперативная память объемом 16 Гб с возможностью расширения до 64 Гб;
    • \n
    • встроенная веб-камера для общения через Skype и Zoom;
    • \n
    • внутренний накопитель SSD на 512 Гб обеспечивает быстрый доступ к файлам;
    • \n
    • поддерживается беспроводная сеть стандарта 802.11ax.
    • \n
    \n

    Предусмотрены два порта USB 3.2 Type-C и два USB 2.0 Type-A. Есть выход HDMI для подключения монитора или телевизора. Для воспроизведения звука есть встроенные динамики и микрофон.

    ', 'rating': 5.0, 'review_count': 18}
    0
    Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать их в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей скоростью записи. Можете помочь выбрать? {'long_web_name': 'Флэш карта Kingston Canvas Select Plus SDCS2/32GB microSDHC Class10, 32 Gb, adapter', 'price': 740.0, 'description': '', 'rating': 4.93, 'review_count': 587} 1
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 392 evaluation samples
  • Columns: anchor, text, and label
  • Approximate statistics based on the first 392 samples:
    anchor text label
    type string string int
    details
    • min: 23 tokens
    • mean: 42.23 tokens
    • max: 91 tokens
    • min: 53 tokens
    • mean: 322.99 tokens
    • max: 1058 tokens
    • 0: ~84.18%
    • 1: ~15.82%
  • Samples:
    anchor text label
    Здравствуйте! Мне нужны магнитные кабели для зарядки моих устройств в походах. Хочу заказать несколько штук, можно с разными разъёмами (USB-C, Micro USB, и Lightning). Желательно, чтобы они были качественными и прочными. Можете помочь с этим? {'long_web_name': 'Смартфон Samsung Galaxy Z Flip 6 SM-F741B, 256 Гб, Yellow', 'price': 81990.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-samsung-galaxy-z-flip-6-sm-f741b-256-gb-yellow-1-sht-100069687356/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/153/984/177/231/36/100069687356b0.png', 'id': '100069687356', 'description': 'Смартфон Samsung Galaxy Z Flip6 Yellow с раскладным экраном. Гибкий безрамочный дисплей 6.7" с матрицей Dynamic AMOLED 2X FHD+, частотой обновления 120 Гц и плотностью пикселей 426 ppi — передает четкое детализированное изображение с яркими и насыщенными цветами. Покрытие Corning® Gorilla® Glass Victus® защищает дисплей от механических повреждений. Процессор Qualcomm Snapdragon 8 Gen 3 с графическим ускорителем Qualcomm Adreno 750 — обеспечивает высокую производительность и плавную работу системы. Внутренняя память объемом 256 ГБ — предоставляет достаточно места для хранения большого количества данных, фотографий и видео. А... 0
    Здравствуйте! Мне нужны сумки и рюкзаки для фототехники. Что-то удобное и вместительное, чтобы можно было безопасно носить зеркальный фотоаппарат и несколько объективов. Можно посмотреть варианты? {'long_web_name': 'Фильтр ZUMMAN FHR2', 'price': 14.0, 'url': 'https://megamarket.ru/catalog/details/filtr-zumman-fhr2-100026967888/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-13/878/305/792/603/9/100026967888b0.jpg', 'id': '100026967888_7', 'description': '', 'rating': 0.0, 'review_count': 0} 0
    Здравствуйте! Ищу умные часы Apple Watch Series 2. Скажите, пожалуйста, есть ли у вас в наличии? {'long_web_name': 'Смарт-часы Apple Watch Series 9 45 мм Midnight размер ML', 'price': 58373.0, 'description': 'Смарт-часы Apple Watch. Материал корпуса — алюминий. Время работы в активном режиме — до 18 часов. Функция Double Tap активируется посредством двух быстрых касаний указательного и большого пальцев — можно ответить на звонок, выключить будильник и управлять воспроизведением музыки. Объем встроенной памяти — 64 Гб. В комплекте — кабель USB?C с магнитным креплением для быстрой зарядки', 'rating': 4.97, 'review_count': 114} 0
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • num_train_epochs: 5
  • warmup_ratio: 0.1
  • fp16: True
  • load_best_model_at_end: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 8
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss item-classification_cosine_ap
0 0 - 0.0298 0.3925
0.2551 100 0.0162 - -
0.5102 200 0.0081 - -
0.6378 250 - 0.0070 0.7305
0.7653 300 0.0064 - -
1.0179 400 0.0049 - -
1.2730 500 0.0046 0.0051 0.8504
1.5281 600 0.0038 - -
1.7832 700 0.0037 - -
1.9107 750 - 0.0049 0.8791
2.0357 800 0.0032 - -
2.2908 900 0.0032 - -
2.5459 1000 0.0025 0.0046 0.9016
2.8010 1100 0.0024 - -
3.0536 1200 0.0026 - -
3.1811 1250 - 0.0044 0.8947
3.3087 1300 0.0022 - -
3.5638 1400 0.0019 - -
3.8189 1500 0.002 0.0045 0.9053
4.0714 1600 0.002 - -
4.3265 1700 0.0018 - -
4.4541 1750 - 0.0044 0.9106
4.5816 1800 0.0014 - -
4.8367 1900 0.0017 - -
4.9898 1960 - 0.0044 0.9106
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.13
  • Sentence Transformers: 3.3.1
  • Transformers: 4.47.1
  • PyTorch: 2.2.1
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

ContrastiveLoss

@inproceedings{hadsell2006dimensionality,
    author={Hadsell, R. and Chopra, S. and LeCun, Y.},
    booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
    title={Dimensionality Reduction by Learning an Invariant Mapping},
    year={2006},
    volume={2},
    number={},
    pages={1735-1742},
    doi={10.1109/CVPR.2006.100}
}