master_cate_el14 / README.md
mini1013's picture
Push model using huggingface_hub.
c8cd0a7 verified
metadata
base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 소니 WH-CH520 블루투스헤드셋 정품 WH-CH520/BZE 블랙 주식회사 스피티
  - text: 코스 스튜디오용 헤드폰 스탠다드 패키징 블랙 풀사이즈 Pro4AA 1) Standard Packaging 제이크루
  - text: 브리츠 P510GX 유선이어폰 음악+통화 언더이어 오픈형  (주)엠글로벌스
  - text: 브리츠 BZ-MQ7 휴대용 FM라디오 효도라디오 블루투스 스피커 블랙 하나전산
  - text: >-
      SOUNDCRAFT NOTEPAD-12FX 사운드 크래프트 노트패드12FX 아날로그 믹서/USB 오디오 인터페이스 [공식수입정품] 
      사운드필
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.7123194792867313
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
12
  • '[BOSE] 보스 옴니 주얼 실링(천장) 브라켓 (서라운드 스피커 700 전용) 블랙 세트 코오롱모빌리티그룹 주식회사'
  • '마샬 엠버튼2 블루투스 캠핑 스피커 크림 휴대용 연동가능 엠버튼II 앰버튼 일대의 고배급 삼림녹은 한 야드씩이다. 두즈 몰'
  • 'GENPRO SS-2스피커스탠드 공연 무대 버스킹용 1개가격 제이에스사운드'
8
  • '카날스BKM-150 컴비네이션 테이블타입 미니앰프 포도나무'
  • 'Denon AVR-X250BT/수입正品/5.1CH AV 리시버 주누 트레이드 (JUNU TRADE)'
  • '카날스 KQ-800W 4채널 800W 파워앰프 교회 노래방 장 앰프 사운드테크'
15
  • '웨이코스 씽크웨이 TONE BOB SHOCK 8D 주식회사 브라보세컨즈'
  • '[스페셜케이스]젠하이저 IE 100 pro Wired 모니터링 인이어 이어폰 레드(RED) 찬양랜드'
  • '[Sennehiser] 젠하이저 IE200 모니터링 이어폰 인이어 온더그랩'
21
  • 'Britz 브리츠인터내셔널 BZ-T3400 AV SoundBar 주식회사 동행하기'
  • '[Britz] 브리츠 BZ-T2230S AV Soundbar 블루투스 사운드바 시스템 더그랩사운드'
  • '드비알레 디온(DEVIALET DIONE) 사운드바 (주)울타리컴퍼니'
17
  • 'Britz 브리츠인터내셔널 BZ-C3900RT 주식회사 레오솔루션'
  • 'Britz 브리츠인터내셔널 BZ-BBX2 주식회사 에스씨엠인포텍'
  • '코비 냥냥이 댕댕이 블루투스 CD플레이어 BTCD7 FM라디오 어학용 스마트폰 음악재생 냥냥이 (주)디피이'
20
  • 'ULTRASONE 울트라손 헤드폰 Signature Pure 국내정품 1년보증AS 윤테크(YOON TECH)'
  • '터틀비치 아틀라스 에어 Atlas Air 무선 게이밍 헤드셋 (주)베스트파이브'
  • '재고당일발 노이만 NDH30 Black Edition Neuman NDH 30 블랙에디션 한정판 오픈형 모니터링용 정품보증서 NDH30 블랙에디션한정판:당일발송 신화'
13
  • 'NMA-LB433 스피커 관절형 벽걸이 거치대(2.6kg) 서준전자'
  • 'Britz 브리츠인터내셔널 BZ-T7780 (주)빈컴'
  • '루악오디오 R3s ruarkaudio 국내정품 Rich Walnut (월넛) 라이프스타일샵'
19
  • '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
  • '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
  • '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
10
  • '[재고보유/당일출고] 한글설명서 뮤직랜드 Behringer XR18 베링거18 xr-18 디지털믹서 뮤직랜드'
  • '베링거 DI100 1채널 액티브 다이렉트 박스 DI 주식회사 뮤존(MUZON)'
  • '베링거 DI-100 다이렉트박스, DIBOX 토포스사운드'
6
  • 'CDP-1000 ENW USB 1CD PLAYER 클럽/스포츠센터/매장 CDA1000USB CDA1000USB옴니트로닉 비비케이사운드'
  • '-네이버회원 추가쿠폰-빈센트 CD-S7 DAC 진공관 하이브리드 CD플레이어 [VINCENT] 0 주식회사 탑제이앤에이취'
  • 'DENON (데논) DCD-A110 / 110주년 기념 CD 플레이어 무진AV상사'
18
  • '[CROSLEY 크로슬리] Musician 뮤지션 엔틱 감성 올인원 CD 테이프 블루투스 턴테이블 CR704B ITDictionary'
  • '휴라이즈 HR-TS100 LP 텐테이블 주식회사 씨알텍'
  • '디앤비인터내셔널 휴라이즈 HR-TS100 (주)아토닉스'
1
  • 'iFi Audio ZEN DAC Signature V2 아이파이 고해상도 데스크탑 DAC 젠덱 시그니처 서울악기'
  • 'iFi audio Go blu 소형 HD블루투스 DAC 앰프 윌텍미디어'
  • 'TOPPING DX5 Lite 블루투스DAC 토핑 DX5 헤드폰앰프 블랙 (주)제이엘더블유'
14
  • '마이다스 M32R LIVE/마이다스 총판 공식 인증 대리점/마이다스 정품[재고 보유/당일 출고] 한솔전자'
  • 'Solid State Logic SSL 2+ (연말 연초 세일 2월29일까지) (주)국제미디'
  • 'Pioneer DJ DDJ-FLX4 파이오니아 디제이 2채널 디제이 컨트롤러 (주)뮤직메트로'
0
  • '데논(DENON) DCD-600NE CD플레이어(실버) (주)음자리'
  • '댕댕이 포터블 탁상용 블루투스 어학 공부 아기 CD플레이어 BTCD10 냥냥이 (주)아임커머스'
  • 'ENZER(엔저) EN-CD1BT CD플레이어 USB 블루투스 원목디자인 월넛 (재고보유) 원형사운드'
7
  • 'Britz 브리츠인터내셔널 BZ-R120 (블랙) 휴대용 미니 효도라디오 (주)아이텐츠'
  • 'Britz 브리츠인터내셔널 BZ-LV980 블루투스 라디오 MP3 스피커 블랙 (주)가이드컴'
  • 'Britz LED 대나무 FM 라디오 알람 온도 시계 BZ-E2R 아이티조이'
2
  • '에픽 E100B 블루투스MP3플레이어 / FM라디오 내장스피커 동영상 TF32GB확장 1. 초콜렛(4GB) 에픽'
  • '아스텔앤컨 Astell&kern KANN ULTRA DAP 주식회사 그린파워테크'
  • 'w Britz BZ-MP4580BL /MP3/녹음기/라디오/블루투스 (주)원영씨앤씨'
11
  • '[Apple 에어팟] 애플 에어팟 유선 충전 2세대 (국내 정식 발매 제품) MV7N2KH/A Apple AirPods 2nd Gen (Korean Ver.) 슈박스 (Shoe Box)'
  • '샥즈 오픈런 프로 S810 블랙 골전도 블루투스 무선 이어폰 Shokz 수영 등산 운동 스포츠 액티비티 아웃도어 (국내정품, 2년 보증) 1. 블랙 클레디오'
  • '포칼 FOCAL Bathys/수입正品/노이즈 캔슬링/블루투스/하이파이 주누 트레이드 (JUNU TRADE)'
5
  • '케이뮤직박스 서영엔터테인먼트 AV-1000 이동식노래방 휴대용 캠핑 충전용 야외용 우림미디어'
  • '미가엘 E9S 찬송가 반주기 리모콘 마이크포함 복음성가 성경낭독 지에스음향'
  • '미가엘 E9S E-9S 찬양반주기 찬양연주기 이니트(INNIT)'
9
  • '[KANALS]카날스 MJ-117 MJ117 원터치 T자형 마이크스탠드 공연용녹음용보컬용 김청애'
  • 'LEWITT LCT440 PURE 르윗 프로 콘덴서 마이크 보컬 홈레코딩 공연 방송 녹음 멘토나무'
  • '스토리하우스 네코 NK-UA600 2021년형 번슬리'
3
  • '아이리버 아스텔앤컨 AK-RM01 블루투스 리모컨 다손아이앤씨'
  • 'COMS) 3.7V 리튬이온 배터리(BL-5B) 라디오/UB714 비스티앤씨'
  • '미테르 케이스 아스텔앤컨 HB1 커버 MITER Astell&Kern AK HB1 case (착탈식 목걸이 줄 포함 팩키지) 네이비 (이태리PU인조합성가죽) 굿씨드인터내셔널'
16
  • '로마네 Romane 365 포켓 에어팟 파우치 그라미상점'
  • '에어팟 프로 실리콘 케이스 키링 1세대 2세대 공용 에어팟프로(1/2세대공용)실리콘케이스(그린) 아이킨'
  • '플래나 에어플레인 티켓 시리즈 에어팟 프로 커스텀 TPU 투명 케이스 에어팟 1/2세대_1. 서울 주식회사 플랜지'
4
  • '토마토 5인치 PMP익스트림터치 8GB+전용충전기 5인치 익스트림터치16G 주식회사 스피티'
  • '코원 스터디프로 V7 32GB+펠트파우치 /MP3/PMP 주식회사 스피티'
  • '[AS 1년보증+코원 온라인 공식판매처+재고확보] 코원 스터디프로 V7 32GB+펠트파우치/MP3/PMP [코원]스터디프로V7[32GB][화이트] (주)엠피나비'

Evaluation

Metrics

Label Metric
all 0.7123

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el14")
# Run inference
preds = model("브리츠 P510GX 유선이어폰 음악+통화 언더이어 오픈형  (주)엠글로벌스")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 3 9.4791 33
Label Training Sample Count
0 50
1 50
2 50
3 12
4 4
5 50
6 50
7 50
8 50
9 50
10 50
11 50
12 50
13 50
14 50
15 50
16 50
17 50
18 50
19 13
20 50
21 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0065 1 0.497 -
0.3268 50 0.3791 -
0.6536 100 0.2221 -
0.9804 150 0.1258 -
1.3072 200 0.0648 -
1.6340 250 0.0513 -
1.9608 300 0.0383 -
2.2876 350 0.0297 -
2.6144 400 0.0308 -
2.9412 450 0.0208 -
3.2680 500 0.0132 -
3.5948 550 0.0188 -
3.9216 600 0.0196 -
4.2484 650 0.0158 -
4.5752 700 0.0061 -
4.9020 750 0.009 -
5.2288 800 0.0107 -
5.5556 850 0.0048 -
5.8824 900 0.0024 -
6.2092 950 0.0077 -
6.5359 1000 0.0023 -
6.8627 1050 0.0077 -
7.1895 1100 0.006 -
7.5163 1150 0.003 -
7.8431 1200 0.0046 -
8.1699 1250 0.0062 -
8.4967 1300 0.003 -
8.8235 1350 0.0022 -
9.1503 1400 0.0004 -
9.4771 1450 0.0003 -
9.8039 1500 0.0003 -
10.1307 1550 0.0022 -
10.4575 1600 0.0006 -
10.7843 1650 0.0002 -
11.1111 1700 0.0002 -
11.4379 1750 0.0002 -
11.7647 1800 0.0029 -
12.0915 1850 0.0002 -
12.4183 1900 0.0001 -
12.7451 1950 0.0001 -
13.0719 2000 0.0001 -
13.3987 2050 0.0001 -
13.7255 2100 0.0001 -
14.0523 2150 0.0002 -
14.3791 2200 0.0001 -
14.7059 2250 0.0001 -
15.0327 2300 0.0001 -
15.3595 2350 0.0001 -
15.6863 2400 0.0001 -
16.0131 2450 0.0002 -
16.3399 2500 0.0001 -
16.6667 2550 0.002 -
16.9935 2600 0.0001 -
17.3203 2650 0.002 -
17.6471 2700 0.0001 -
17.9739 2750 0.0001 -
18.3007 2800 0.0001 -
18.6275 2850 0.0001 -
18.9542 2900 0.0021 -
19.2810 2950 0.0001 -
19.6078 3000 0.0001 -
19.9346 3050 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}