myrkur
/

sentence-transformer-parsbert-fa

@@ -1,455 +1,374 @@
----
-language: []
-library_name: sentence-transformers
-tags:
-- sentence-transformers
-- sentence-similarity
-- feature-extraction
-- generated_from_trainer
-- dataset_size:96546
-- loss:SoftmaxLoss
-base_model: HooshvareLab/bert-base-parsbert-uncased
-datasets: []
-widget:
-- source_sentence: 'اگرچه در آکادمی هفت جایزه دیگر نیز وجود دارد (جایزه یادبود ایروینگ
-    جی. تالبرگ، جایزه بشردوستانه ژان هرشولت، جایزه گوردون ای. سایر، جایزه علمی و مهندسی،
-    جایزه علمی و فنی آکادمی، جایزه اسکار بهترین دستاورد فنی، مدال تقدیر جان ای. بونر
-    و جایزه دانش آموزی و همچنین دو جایزه افتخاری که در سال ارائه می‌شود، اما مشهورترین
-    آن‌ها جایزه شایستگی آکادمی بوده که بیشتر به تندیس اسکار معروف است. این تندیس
-    که از فلز برنز آب طلاکاری شده بر روی یک پایه فلزی سیاه ساخته شده دارای بلندی
-    ۱۳٫۵ اینچ (معادل ۳۴ سانتیمتر) و وزن ۸٫۵ پوند (معادل ۳٫۸۵ کیلوگرم) است و شوالیه‌ای
-    را نشان می‌دهد که شمشیر مبارزان جنگ صلیبی را در دست گرفته و بر روی یک حلقه فیلم
-    ایستاده و پنج حوزه فیلم را نشان می‌دهد که هر کدام نشانگر بخش‌های اصلی آکادمی
-    هستند: بازیگر، نویسنده، کارگردان، تهیه‌کننده و تکنسین.'
-  sentences:
-  - کعبهٔ زرتشت دقیقاً روبه‌روی آرامگاه کدام پادشاه قرار دارد؟
-  - تندیس اسکار از چه چیزی ساخته شده است؟
-  - هشتمین آلبوم گروه ریدیوهِد چه نام داشت؟
-- source_sentence: 'بنیتو آمیلکاره آندره آ موسولینی (نام کامل به ایتالیایی: Benito
-    Amilcare Andrea Mussolini) (زاده ۲۹ ژوئیه ۱۸۸۳ - درگذشته ۲۸ آوریل ۱۹۴۵) نخست‌وزیر
-    پادشاهی ایتالیا از زمان به قدرت رسیدن فاشیستها در اکتبر ۱۹۲۲ تا ۱۹۴۳، و رهبر جمهوری
-    اجتماعی ایتالیا از این سال تا اعدام شدن در ۱۹۴۵ بود. به عنوان یک روزنامه‌نگار
-    و سیاستمدار، موسولینی عضو پیشروی هیئت ملی حزب سوسیالیست ایتالیا (PSI) از ۱۹۱۰
-    تا ۱۹۱۴ بود، اما به خاطر طرفداری از مداخله نظامی در جنگ اول جهانی بر خلاف رویکرد
-    بی‌طرفی PSI، از PSI اخراج گردید. موسولینی در طول جنگ در ارتش پادشاهی ایتالیا خدمت
-    نمود تا این که در ۱۹۱۷ زخمی و مرخص شد. اما موسولینی PSI را محکوم نمود، دیدگاه‌های
-    وی حالا بر محور میهن‌پرستی متمرکز شده بودند نه سوسیالیسم، و بعدها جنبش فاشیسم
-    را پایه گذاشت که با مساوات‌خواهی و جنگ طبقاتی به ستیز برخاست. در نتیجهٔ راهپیمایی
-    به سوی رم در اکتبر ۱۹۲۲، موسولینی بدل به جوان‌ترین نخست‌وزیر ایتالیا تا آن زمان
-    شد. پس از به در کردن تمامی مخالفت‌های سیاسی از طریق پلیس مخفی اش و منع اعتصابات
-    کارگری، موسولینی و مریدان وی از طریق یک سری قوانین که ملت را به حالت تک حزبی سوق
-    دادند، قدرت خود را استوار ساختند. در پنج سال، موسولینی قدرتی هم به وسیلهٔ اقدامات
-    قانونی و هم غیر معمول بنا کرد و تشنهٔ ایجاد یک دولت تمامیت‌خواه (توتالیتر) شد.
-    موسولینی در ۱۹۲۹ پیمان لاتران با واتیکان را امضاء نمود تا به دهه‌ها ستیزش بین
-    دولت ایتالیا و پاپ پایان دهد و بدین طریق استقلال شهر واتیکان را به رسمیت شناخت.'
-  sentences:
-  - ضرورت پیدایش جامعه ریشه در چه دارد؟
-  - سریال چرنوبیل در رتبه چندم بانک اطلاعات اینترنتی فیلم‌ها قرار داشت؟
-  - بنیتوموسولینی در چه تاریخی متولد شده‌است؟
-- source_sentence: در سال ۱۹۱۸ میلادی، بالفور برای اولین بار کمیته‌ای را جهت ارائهٔ
-    گزارش رسمی در مورد چنین سازمانی تشکیل داد. اعضای این کمیته، که با ابتکار لرد رابرت
-    سیسیل و به رهبری والتر فیلیمور تشکیل شد (و ازین‌رو «کمیتهٔ فیلیمور» نام‌گرفت)
-    شامل ایر کرو، ویلیام تایرل و سیسیل هرست (که همه از مقامات وزارت امور خارجهٔ بریتانیا
-    بودند) می‌شد. این کمیته توصیه کرد که «کنفرانسی از کشورهای متّحد جهت حکمیّت بین
-    کشورها و تحریم کشورهای متخلف» تأسیس شود. پیشنهادهای این کمیسیون در دولت بریتانیا
-    تصویب شد و بخش عمده‌ای از آن بعدها در میثاق جامعهٔ ملل آورده شد. در ژوئن همان
-    سال، فرانسه پیشنهادی پردامنه‌تر از گزارش کمیتهٔ فیلیمور ارائه کرد که در آن پیشنهاد
-    ایجاد کنفرانس‌های سالانهٔ بین‌المللی جهت حل‌وفصل همهٔ اختلافات و تأسیس یک ارتش
-    بین‌المللی جهت اجرای تصمیمات آن شورا گنجانده شده بود.
-  sentences:
-  - در سال ۲۰۰۶ و در یک مطالعه ارتباط ژنتیکی بیش از چند ژن دخیل در ابتلا به آسم شناسایی
-    شد؛ و همچنان این تعداد رو به افزایش است؟
-  - در غرب لاهیجان، کدام گسل به‌طور شمال خاوری - جنوب باختری گسل البرز را جابه‌جا
-    کرده‌است؟
-  - بنجامین فرانکلین در چه سالی مؤسسهٔ انتشاراتیِ خود را ترک کرد؟
-- source_sentence: بین ۱۹۲۵ و ۱۹۲۷، موسولینی تقریباً تمامی حد و مرزهای قانونی و قراردادی
-    که ایجاد محدودیت برای قدرتش می‌نمود را برداشت و دولتی پلیسی به وجود آورد. قانونی
-    به نام Christmas Eve law که در ۲۴ دسامبر ۱۹۲۵ از تصویب گذرانده شد، عنوان رسمی
-    موسولینی را از «رئیس شورای وزیران» به «رئیس حکومت» تغییر داد، هرچند در بیشتر
-    منابع خبری غیر ایتالیایی هنوز «نخست‌وزیر» نامیده می‌شد. اکنون دیگر نه در برابر
-    مجلس بلکه تنها در برابر پادشاه پاسخگو بود. هرچند قانون اساسی ایتالیا بیان داشته
-    بود که وزیران تنها به اقتدار عالیه (شاه) پاسخگو بودند، عملاً حکومت کردن بر خلاف
-    ارادهٔ مقننه تقریباً غیرممکن شده بود. اما این لایحه به این روند پایان داد و همچنین
-    موسولینی را به تنها شخصی که قادر به دیکته کردن دستور جلسات بود، تبدیل نمود. لایحه
-    Christmas Eve law ساختار حکومت موسولینی را به دیکتاتوری دو فاکتوی قانونی تبدیل
-    کرد. خودمختاری‌های محلی منحل و پودستاهای منصوب از جانب سنای ایتالیا جای شهرداران
-    و شوراهای شهر را گرفتند.
-  sentences:
-  - طبق تصویب قانونی در ۲۴ دسامبر ۱۹۲۵ عنوان رسمی موسولینی چه تغییری کرد؟
-  - ماندلا در چه سالی از زندان آزاد شد؟
-  - مِدراشیم چیست؟
-- source_sentence: پرتغالی، در وطن اصلی خود، پرتغال، تقریباً توسط ۱۰ میلیون نفر جمعیت
-    صحبت می‌شود. پرتغالی همچنین به عنوان زبان رسمی برزیل، بیش از ۲۰۰ میلیون نفر در
-    آن کشور و همچنین کشورهای همسایه، در شرق پاراگوئه و در شمال اروگوئه، سخنگو دارد،
-    که کمی بیش از نیمی از جمعیت آمریکای جنوبی را تشکیل می‌دهند؛ بنابراین پرتغالی
-    پرسخنگوترین زبان رسمی رومی در یک کشور واحد است. این زبان در شش کشور آفریقایی
-    زبان رسمی است (آنگولا، دماغه سبز، گینه بیسائو، موزامبیک، گینه استوایی و سائوتومه
-    و پرنسیپ) و توسط ۳۰ میلیون نفر از ساکنان آن قاره به عنوان زبان نخست گویش می‌شود.
-    در آسیا، پرتغالی با سایر زبان‌ها در تیمور شرقی و ماکائو رسمی است، در حالی که
-    بیشتر پرتغالی‌زبانان در آسیا - حدود ۴۰۰٫۰۰۰ نفر - به دلیل بازگشت مهاجرت ژاپنی‌های
-    برزیل ساکن ژاپن هستند. در آمریکای شمالی ۱٫۰۰۰٫۰۰۰ نفر به پرتغالی به عنوان زبان
-    نخست خود صحبت می‌کنند. پرتغالی در اقیانوسیه به دلیل شمار سخنگویانش در تیمور شرقی،
-    پس از فرانسوی، دومین زبان رومی است که بیش از همه گویش می‌شود. نزدیکترین خویشاوند
-    آن، گالیسی، دارای وضعیت رسمی در جامعه خودمختار گالیسیا در اسپانیا، همراه با اسپانیایی
-    است.
-  sentences:
-  - نام پسر عثمان یکم چه بود؟
-  - عباس جدیدی که بود؟
-  - در حدود اواخر کدام قرن پیش از میلاد سکاهای کوچ‌نشین در مرزهای شرقی اشکانیان پیشروی
-    کردند؟
-pipeline_tag: sentence-similarity
----
-# SentenceTransformer based on HooshvareLab/bert-base-parsbert-uncased
-This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [HooshvareLab/bert-base-parsbert-uncased](https://huggingface.co/HooshvareLab/bert-base-parsbert-uncased). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
-## Model Details
-### Model Description
-- **Model Type:** Sentence Transformer
-- **Base model:** [HooshvareLab/bert-base-parsbert-uncased](https://huggingface.co/HooshvareLab/bert-base-parsbert-uncased) <!-- at revision d73a0e2c7492c33bd5819bcdb23eba207404dd19 -->
-- **Maximum Sequence Length:** 512 tokens
-- **Output Dimensionality:** 768 tokens
-- **Similarity Function:** Cosine Similarity
-<!-- - **Training Dataset:** Unknown -->
-<!-- - **Language:** Unknown -->
-<!-- - **License:** Unknown -->
-### Model Sources
-- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
-- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
-- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
-### Full Model Architecture
-```
-SentenceTransformer(
-  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
-  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
-)
-```
-## Usage
-### Direct Usage (Sentence Transformers)
-First install the Sentence Transformers library:
-```bash
-pip install -U sentence-transformers
-```
-Then you can load this model and run inference.
-```python
-from sentence_transformers import SentenceTransformer
-# Download from the 🤗 Hub
-model = SentenceTransformer("myrkur/sentence-transformer-parsbert-fa")
-# Run inference
-sentences = [
-    'پرتغالی، در وطن اصلی خود، پرتغال، تقریباً توسط ۱۰ میلیون نفر جمعیت صحبت می\u200cشود. پرتغالی همچنین به عنوان زبان رسمی برزیل، بیش از ۲۰۰ میلیون نفر در آن کشور و همچنین کشورهای همسایه، در شرق پاراگوئه و در شمال اروگوئه، سخنگو دارد، که کمی بیش از نیمی از جمعیت آمریکای جنوبی را تشکیل می\u200cدهند؛ بنابراین پرتغالی پرسخنگوترین زبان رسمی رومی در یک کشور واحد است. این زبان در شش کشور آفریقایی زبان رسمی است (آنگولا، دماغه سبز، گینه بیسائو، موزامبیک، گینه استوایی و سائوتومه و پرنسیپ) و توسط ۳۰ میلیون نفر از ساکنان آن قاره به عنوان زبان نخست گویش می\u200cشود. در آسیا، پرتغالی با سایر زبان\u200cها در تیمور شرقی و ماکائو رسمی است، در حالی که بیشتر پرتغالی\u200cزبانان در آسیا - حدود ۴۰۰٫۰۰۰ نفر - به دلیل بازگشت مهاجرت ژاپنی\u200cهای برزیل ساکن ژاپن هستند. در آمریکای شمالی ۱٫۰۰۰٫۰۰۰ نفر به پرتغالی به عنوان زبان نخست خود صحبت می\u200cکنند. پرتغالی در اقیانوسیه به دلیل شمار سخنگویانش در تیمور شرقی، پس از فرانسوی، دومین زبان رومی است که بیش از همه گویش می\u200cشود. نزدیکترین خویشاوند آن، گالیسی، دارای وضعیت رسمی در جامعه خودمختار گالیسیا در اسپانیا، همراه با اسپانیایی ��ست.',
-    'در حدود اواخر کدام قرن پیش از میلاد سکاهای کوچ\u200cنشین در مرزهای شرقی اشکانیان پیشروی کردند؟',
-    'عباس جدیدی که بود؟',
-]
-embeddings = model.encode(sentences)
-print(embeddings.shape)
-# [3, 768]
-# Get the similarity scores for the embeddings
-similarities = model.similarity(embeddings, embeddings)
-print(similarities.shape)
-# [3, 3]
-```
-<!--
-### Direct Usage (Transformers)
-<details><summary>Click to see the direct usage in Transformers</summary>
-</details>
--->
-<!--
-### Downstream Usage (Sentence Transformers)
-You can finetune this model on your own dataset.
-<details><summary>Click to expand</summary>
-</details>
--->
-<!--
-### Out-of-Scope Use
-*List how the model may foreseeably be misused and address what users ought not to do with the model.*
--->
-<!--
-## Bias, Risks and Limitations
-*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
--->
-<!--
-### Recommendations
-*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
--->
-## Training Details
-### Training Dataset
-#### Unnamed Dataset
-* Size: 96,546 training samples
-* Columns: <code>anchor</code>, <code>positive</code>, and <code>label</code>
-* Approximate statistics based on the first 1000 samples:
-  |         | anchor                                                                               | positive                                                                          | label                                           |
-  |:--------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:------------------------------------------------|
-  | type    | string                                                                               | string                                                                            | int                                             |
-  | details | <ul><li>min: 14 tokens</li><li>mean: 151.98 tokens</li><li>max: 283 tokens</li></ul> | <ul><li>min: 5 tokens</li><li>mean: 15.24 tokens</li><li>max: 90 tokens</li></ul> | <ul><li>0: ~50.50%</li><li>1: ~49.50%</li></ul> |
-* Samples:
-  | anchor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | positive                                                    | label          |
-  |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------|:---------------|
-  | <code>پاستل یک محیط نقاشی به شکل چوب است که از رنگدانه‌های پودری خالص و چسب تشکیل شده‌است. رنگدانه‌های مورد استفاده در پاستل همانهایی هستند که برای تولید همه محیط‌های هنری رنگی از جمله رنگ روغن استفاده می‌شود. چسب دارای رنگ خنثی و اشباع کم است. اثر رنگی پاستیل بیش از هر فرایند به رنگدانه‌های خشک طبیعی نزدیکتر است. از آنجا که سطح یک نقاشی پاستلی شکننده است و به راحتی لکه دار می‌شود، حفظ آن نیاز به اقدامات محافظتی مانند قاب‌بندی زیر شیشه دارد. همچنین ممکن است با ماده ثابت کننده اسپری شود. با این وجود، وقتی با رنگدانه‌های دائمی ساخته می‌شود و از آنها به درستی مراقبت می‌شود، ممکن است نقاشی پاستلی قرن‌ها بدون تغییر باقی بماند. پاستل‌ها، همان‌طور که نقاشی‌های ساخته شده با یک محیط مایع، در برابر ترک خوردگی و تغییر رنگ که در اثر تغییر در رنگ، تیرگی یا ابعاد محیط خشک می‌شود، حساس نیستند.</code> | <code>پاستل از چه چیزهایی تشکیل شده است؟</code>             | <code>1</code> |
-  | <code>یک روش تغذیه و زندگی است که هدف آن حذف هر نوع محصول حیوانی چه در غذا و چه در مواد مصرفی است. مهم‌ترین دلایل گرایش به وگانیسم افراد، مسائل اخلاقی یا رعایت حقوق حیوانات، حفاظت محیط زیست، حفظ سلامتی، مسائل معنوی یا مذهبی است. بسیاری از افراد وگان با پرورش صنعتی حیوانات و آزمایش روی حیوانات مخالف هستند. از مهم‌ترین محصولات حیوانی که پاک گیاه‌خواران یا وگان‌ها از مصرف آن‌ها خودداری می‌کنند می‌توان به انواع گوشت (گوشت قرمز، مرغ، آبزیان، ماکیان و...)، لبنیات، تخم‌مرغ، عسل، ابریشم، چرم، خز، و... و نیز محصولاتی که در آن‌ها از فراورده‌های حیوانی (مانند ژله که از ژلاتین به‌دست می‌آید) استفاده شده‌است اشاره کرد.</code>                                                                                                                                                                             | <code>گیاه‌خواری چه روشی است؟</code>                        | <code>1</code> |
-  | <code>اسب‌های سنگین با اندامی عضلانی را به عنوان «اسب‌های خونسرد» می‌شناسند. آن‌ها را به دلیل توان ماهیچه‌ای و خوی آرام و صبورشان پرورش می‌دهند. مردم با کمک آن‌ها بارهای سنگین را جابجا می‌کردند. گاهی به این اسب‌های «غول‌های نجیب» هم گفته می‌شود. از جمله اسب‌های باری می‌توان به نژاد بلژیکی و کلایدزدیل اشاره کرد. برخی از این اسب‌ها مانند پرچرون سبک‌تر و چابک ترند و درکشیدن بار یا شخم زدن زمین در اقلیم خشک به کار می‌آیند. دیگران مانند شایر آرام‌تر و نیرومندترند و برای شخم زدن خاک‌های رسی کاربرد دارند. برخی اسبچهها هم در دستهٔ خونسردها جای می‌گیرند.</code>                                                                                                                                                                                                                                              | <code>اسب‌های سنگین با اندامی عضلانی را چه می‌نامند؟</code> | <code>1</code> |
-* Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
-### Evaluation Dataset
-#### Unnamed Dataset
-* Size: 11,990 evaluation samples
-* Columns: <code>anchor</code>, <code>positive</code>, and <code>label</code>
-* Approximate statistics based on the first 1000 samples:
-  |         | anchor                                                                               | positive                                                                          | label                                           |
-  |:--------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:------------------------------------------------|
-  | type    | string                                                                               | string                                                                            | int                                             |
-  | details | <ul><li>min: 41 tokens</li><li>mean: 146.59 tokens</li><li>max: 297 tokens</li></ul> | <ul><li>min: 5 tokens</li><li>mean: 15.28 tokens</li><li>max: 48 tokens</li></ul> | <ul><li>0: ~47.90%</li><li>1: ~52.10%</li></ul> |
-* Samples:
-  | anchor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | positive                                                                                      | label          |
-  |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------|:---------------|
-  | <code>بدنهٔ اسکلتی یا خرپا (Truss) در هواپیماهای اولیه تا جنگ جهانی اول بسیار استفاده می‌شد. هم‌اکنون در هواپیماهای دست‌ساز و نیز هواپیماهای مدل از این نوع بدنه استفاده زیادی می‌شود چرا که ساده، سبک و مقاوم بوده و با تیرک‌های چوبی قابل ساخت هستند. در این نوع بدنه اغلب نیروها و تنش‌های وارده توسط سازه اصلی تحمل شده و از پوسته برای ایجاد شکل آیرودینامیکی به سازه استفاده می‌شود. سازهٔ اصلی از تیرک‌های طولی، تیرک‌های مورب، قاب‌های عرضی و کابل‌های نگهدارنده تشکیل شده‌است. برادران رایت که اولین هواپیماهای قابل کنترل را ساختند از این حالت در ساختار بدنهٔ هواپیماهایشان استفاده می‌کردند.</code>                                                             | <code>در چه انتخاباتی یک نامزد نیاز به بیست درصد آرا دارد تا انتخاب‌شدن وی تضمین شود؟</code> | <code>0</code> |
-  | <code>شاید بتوان گفت این موضوع بر می‌گردد به ریشه زبان بلوچی که برگرفته از زبان پهلوی اشکانی و ساسانی می‌باشد. از آنجا که زبان پهلوی با دگرگونی‌هایی به زبان فارسی نو (امروزی) تبدیل شده‌است ویکی از این دگرگونی‌ها حذف (گ) از برخی کلمات می‌باشد می‌توان اینگونه بیان کرد که حرف گ و برخی حروف غیر عربی در زبان بلوچی خالص باقی مانده اما در زبان فارسی امروز گ از برخی کلمات حذف شده و دگرگون شده‌است؛ یعنی زبان بلوچی، "گ " اوستا را که در پازند و فارسی به "های " غیر ملفوظ تبدیل شده، مانند زبان پهلوی به صور ت "گ " و گاهی همان "ک " نگهداشته است. مثال‌های دیگر از دگرگونی حروف زبان باستان در فارسی نو اما ثابت ماندن آن‌ها در کلمات بلوچی در زیر آمده‌است:</code> | <code>در چه سالی هگل برای ادامهٔ تحصیل به دبیرستان ایلوستره رفت؟</code>                       | <code>0</code> |
-  | <code>خرطوم فیل‌ها حاصل اتصال بینی و لب بالایی است. این عضو، استخوان ندارد و دارای مقدار کمی چربی و حدود ۱۵۰۰۰۰ دسته ماهیچه‌ای است. یک یا دو لب انگشت در نوک آن وجود دارد. خرطوم این پستاندار تقریباً ۱٫۸ متر رشد می‌کند و وزنی حدود ۱۴۰ کیلوگرم دارد. این جانوران از خرطوم دراز خود به عنوان دست استفاده می‌کنند و با آن غذا و آب را در دهان خود می‌گذارند. فیل‌ها با استفاده از خرطوم خود می‌توانند حداکثر تا ۳۵۰کیلوگرم بار را برداشته و جابجا کنند. از دیگر کاربردهای خرطوم فیل‌ها احساس بویایی و همچنین تولید صدا است.</code>                                                                                                                                         | <code>فیل‌ها از خرطوم دراز خود به عنوان چه چیزی استفاده می‌کنند؟</code>                       | <code>1</code> |
-* Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
-### Training Hyperparameters
-#### Non-Default Hyperparameters
-- `per_device_train_batch_size`: 16
-- `per_device_eval_batch_size`: 16
-- `gradient_accumulation_steps`: 16
-- `num_train_epochs`: 2
-- `lr_scheduler_type`: cosine
-- `warmup_ratio`: 0.1
-- `bf16`: True
-- `load_best_model_at_end`: True
-- `deepspeed`: False
-- `batch_sampler`: no_duplicates
-#### All Hyperparameters
-<details><summary>Click to expand</summary>
-- `overwrite_output_dir`: False
-- `do_predict`: False
-- `prediction_loss_only`: True
-- `per_device_train_batch_size`: 16
-- `per_device_eval_batch_size`: 16
-- `per_gpu_train_batch_size`: None
-- `per_gpu_eval_batch_size`: None
-- `gradient_accumulation_steps`: 16
-- `eval_accumulation_steps`: None
-- `learning_rate`: 5e-05
-- `weight_decay`: 0.0
-- `adam_beta1`: 0.9
-- `adam_beta2`: 0.999
-- `adam_epsilon`: 1e-08
-- `max_grad_norm`: 1.0
-- `num_train_epochs`: 2
-- `max_steps`: -1
-- `lr_scheduler_type`: cosine
-- `lr_scheduler_kwargs`: {}
-- `warmup_ratio`: 0.1
-- `warmup_steps`: 0
-- `log_level`: passive
-- `log_level_replica`: warning
-- `log_on_each_node`: True
-- `logging_nan_inf_filter`: True
-- `save_safetensors`: True
-- `save_on_each_node`: False
-- `save_only_model`: False
-- `no_cuda`: False
-- `use_cpu`: False
-- `use_mps_device`: False
-- `seed`: 42
-- `data_seed`: None
-- `jit_mode_eval`: False
-- `use_ipex`: False
-- `bf16`: True
-- `fp16`: False
-- `fp16_opt_level`: O1
-- `half_precision_backend`: auto
-- `bf16_full_eval`: False
-- `fp16_full_eval`: False
-- `tf32`: None
-- `local_rank`: 0
-- `ddp_backend`: None
-- `tpu_num_cores`: None
-- `tpu_metrics_debug`: False
-- `debug`: []
-- `dataloader_drop_last`: False
-- `dataloader_num_workers`: 0
-- `dataloader_prefetch_factor`: None
-- `past_index`: -1
-- `disable_tqdm`: False
-- `remove_unused_columns`: True
-- `label_names`: None
-- `load_best_model_at_end`: True
-- `ignore_data_skip`: False
-- `fsdp`: []
-- `fsdp_min_num_params`: 0
-- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
-- `fsdp_transformer_layer_cls_to_wrap`: None
-- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
-- `deepspeed`: False
-- `label_smoothing_factor`: 0.0
-- `optim`: adamw_torch
-- `optim_args`: None
-- `adafactor`: False
-- `group_by_length`: False
-- `length_column_name`: length
-- `ddp_find_unused_parameters`: None
-- `ddp_bucket_cap_mb`: None
-- `ddp_broadcast_buffers`: False
-- `dataloader_pin_memory`: True
-- `dataloader_persistent_workers`: False
-- `skip_memory_metrics`: True
-- `use_legacy_prediction_loop`: False
-- `push_to_hub`: False
-- `resume_from_checkpoint`: None
-- `hub_model_id`: None
-- `hub_strategy`: every_save
-- `hub_private_repo`: False
-- `hub_always_push`: False
-- `gradient_checkpointing`: False
-- `gradient_checkpointing_kwargs`: None
-- `include_inputs_for_metrics`: False
-- `fp16_backend`: auto
-- `push_to_hub_model_id`: None
-- `push_to_hub_organization`: None
-- `mp_parameters`:
-- `auto_find_batch_size`: False
-- `full_determinism`: False
-- `torchdynamo`: None
-- `ray_scope`: last
-- `ddp_timeout`: 1800
-- `torch_compile`: False
-- `torch_compile_backend`: None
-- `torch_compile_mode`: None
-- `dispatch_batches`: None
-- `split_batches`: None
-- `include_tokens_per_second`: False
-- `include_num_input_tokens_seen`: False
-- `neftune_noise_alpha`: None
-- `optim_target_modules`: None
-- `batch_sampler`: no_duplicates
-- `multi_dataset_batch_sampler`: proportional
-</details>
-### Training Logs
-| Epoch      | Step    | Training Loss | loss       |
-|:----------:|:-------:|:-------------:|:----------:|
-| 0.0265     | 20      | 0.7506        | -          |
-| 0.0530     | 40      | 0.6701        | -          |
-| 0.0530     | 20      | 0.5843        | -          |
-| 0.1060     | 40      | 0.4591        | -          |
-| 0.1591     | 60      | 0.3316        | -          |
-| 0.2121     | 80      | 0.2856        | -          |
-| 0.2651     | 100     | 0.2599        | -          |
-| 0.3181     | 120     | 0.2478        | -          |
-| 0.3712     | 140     | 0.214         | -          |
-| 0.4242     | 160     | 0.1996        | -          |
-| 0.4772     | 180     | 0.1929        | -          |
-| 0.5302     | 200     | 0.193         | 0.1766     |
-| 0.5833     | 220     | 0.1798        | -          |
-| 0.6363     | 240     | 0.1794        | -          |
-| 0.6893     | 260     | 0.1735        | -          |
-| 0.7423     | 280     | 0.1713        | -          |
-| 0.7954     | 300     | 0.1547        | -          |
-| 0.8484     | 320     | 0.1545        | -          |
-| 0.9014     | 340     | 0.1577        | -          |
-| 0.9544     | 360     | 0.1575        | -          |
-| 1.0075     | 380     | 0.1431        | -          |
-| 1.0605     | 400     | 0.1498        | 0.1489     |
-| 1.1135     | 420     | 0.1327        | -          |
-| 1.1665     | 440     | 0.1223        | -          |
-| 1.2196     | 460     | 0.1154        | -          |
-| 1.2726     | 480     | 0.1059        | -          |
-| 1.3256     | 500     | 0.1068        | -          |
-| 1.3786     | 520     | 0.0959        | -          |
-| 1.4316     | 540     | 0.0884        | -          |
-| 1.4847     | 560     | 0.0896        | -          |
-| 1.5377     | 580     | 0.0899        | -          |
-| **1.5907** | **600** | **0.0814**    | **0.1445** |
-| 1.6437     | 620     | 0.0877        | -          |
-| 1.6968     | 640     | 0.0816        | -          |
-| 1.7498     | 660     | 0.0846        | -          |
-| 1.8028     | 680     | 0.0783        | -          |
-| 1.8558     | 700     | 0.0787        | -          |
-| 1.9089     | 720     | 0.0874        | -          |
-| 1.9619     | 740     | 0.0883        | -          |
-* The bold row denotes the saved checkpoint.
-### Framework Versions
-- Python: 3.10.13
-- Sentence Transformers: 3.0.1
-- Transformers: 4.39.3
-- PyTorch: 2.1.1+cu121
-- Accelerate: 0.26.1
-- Datasets: 2.19.2
-- Tokenizers: 0.15.2
-## Citation
-### BibTeX
-#### Sentence Transformers and SoftmaxLoss
-```bibtex
-@inproceedings{reimers-2019-sentence-bert,
-    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
-    author = "Reimers, Nils and Gurevych, Iryna",
-    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
-    month = "11",
-    year = "2019",
-    publisher = "Association for Computational Linguistics",
-    url = "https://arxiv.org/abs/1908.10084",
-}
-```
-<!--
-## Glossary
-*Clearly define terms in order to be accessible across audiences.*
--->
-<!--
-## Model Card Authors
-*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
--->
-<!--
-## Model Card Contact
-*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
 -->

+---
+language: []
+library_name: sentence-transformers
+tags:
+- sentence-transformers
+- sentence-similarity
+- feature-extraction
+- generated_from_trainer
+- dataset_size:96546
+- loss:SoftmaxLoss
+base_model: HooshvareLab/bert-base-parsbert-uncased
+datasets: []
+widget:
+- source_sentence: 'اسب‌های سنگین با اندامی عضلانی را چه می‌نامند؟'
+  sentences:
+  - خرطوم فیل‌ها حاصل اتصال بینی و لب بالایی است. این عضو، استخوان ندارد و دارای مقدار کمی چربی و حدود ۱۵۰۰۰۰ دسته ماهیچه‌ای است. یک یا دو لب انگشت در نوک آن وجود دارد. خرطوم این پستاندار تقریباً ۱٫۸ متر رشد می‌کند و وزنی حدود ۱۴۰ کیلوگرم دارد. این جانوران از خرطوم دراز خود به عنوان دست استفاده می‌کنند و با آن غذا و آب را در دهان خود می‌گذارند. فیل‌ها با استفاده از خرطوم خود می‌توانند حداکثر تا ۳۵۰کیلوگرم بار را برداشته و جابجا کنند. از دیگر کاربردهای خرطوم فیل‌ها احساس بویایی و همچنین تولید صدا است.
+  - اسب‌های سنگین با اندامی عضلانی را به عنوان «اسب‌های خونسرد» می‌شناسند. آن‌ها را به دلیل توان ماهیچه‌ای و خوی آرام و صبورشان پرورش می‌دهند. مردم با کمک آن‌ها بارهای سنگین را جابجا می‌کردند. گاهی به این اسب‌های «غول‌های نجیب» هم گفته می‌شود. از جمله اسب‌های باری می‌توان به نژاد بلژیکی و کلایدزدیل اشاره کرد. برخی از این اسب‌ها مانند پرچرون سبک‌تر و چابک ترند و درکشیدن بار یا شخم زدن زمین در اقلیم خشک به کار می‌آیند. دیگران مانند شایر آرام‌تر و نیرومندترند و برای شخم زدن خاک‌های رسی کاربرد دارند. برخی اسبچهها هم در دستهٔ خونسردها جای می‌گیرند.
+  - بدنهٔ اسکلتی یا خرپا (Truss) در هواپیماهای اولیه تا جنگ جهانی اول بسیار استفاده می‌شد. هم‌اکنون در هواپیماهای دست‌ساز و نیز هواپیماهای مدل از این نوع بدنه استفاده زیادی می‌شود چرا که ساده، سبک و مقاوم بوده و با تیرک‌های چوبی قابل ساخت هستند. در این نوع بدنه اغلب نیروها و تنش‌های وارده توسط سازه اصلی تحمل شده و از پوسته برای ایجاد شکل آیرودینامیکی به سازه استفاده می‌شود. سازهٔ اصلی از تیرک‌های طولی، تیرک‌های مورب، قاب‌های عرضی و کابل‌های نگهدارنده تشکیل شده‌است. برادران رایت که اولین هواپیماهای قابل کنترل را ساختند از این حالت در ساختار بدنهٔ هواپیماهایشان استفاده می‌کردند.
+pipeline_tag: sentence-similarity
+---
+# SentenceTransformer based on HooshvareLab/bert-base-parsbert-uncased
+This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [HooshvareLab/bert-base-parsbert-uncased](https://huggingface.co/HooshvareLab/bert-base-parsbert-uncased). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
+## Model Details
+### Model Description
+- **Model Type:** Sentence Transformer
+- **Base model:** [HooshvareLab/bert-base-parsbert-uncased](https://huggingface.co/HooshvareLab/bert-base-parsbert-uncased) <!-- at revision d73a0e2c7492c33bd5819bcdb23eba207404dd19 -->
+- **Maximum Sequence Length:** 512 tokens
+- **Output Dimensionality:** 768 tokens
+- **Similarity Function:** Cosine Similarity
+<!-- - **Training Dataset:** Unknown -->
+<!-- - **Language:** Unknown -->
+<!-- - **License:** Unknown -->
+### Model Sources
+- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
+- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
+- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
+### Full Model Architecture
+```
+SentenceTransformer(
+  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
+  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
+)
+```
+## Usage
+### Direct Usage (Sentence Transformers)
+First install the Sentence Transformers library:
+```bash
+pip install -U sentence-transformers
+```
+Then you can load this model and run inference.
+```python
+from sentence_transformers import SentenceTransformer
+# Download from the 🤗 Hub
+model = SentenceTransformer("myrkur/sentence-transformer-parsbert-fa")
+# Run inference
+sentences = [
+    'پرتغالی، در وطن اصلی خود، پرتغال، تقریباً توسط ۱۰ میلیون نفر جمعیت صحبت می\u200cشود. پرتغالی همچنین به عنوان زبان رسمی برزیل، بیش از ۲۰۰ میلیون نفر در آن کشور و همچنین کشورهای همسایه، در شرق پاراگوئه و در شمال اروگوئه، سخنگو دارد، که کمی بیش از نیمی از جمعیت آمریکای جنوبی را تشکیل می\u200cدهند؛ بنابراین پرتغالی پرسخنگوترین زبان رسمی رومی در یک کشور واحد است. این زبان در شش کشور آفریقایی زبان رسمی است (آنگولا، دماغه سبز، گینه بیسائو، موزامبیک، گینه استوایی و سائوتومه و پرنسیپ) و توسط ۳۰ میلیون نفر از ساکنان آن قاره به عنوان زبان نخست گویش می\u200cشود. در آسیا، پرتغالی با سایر زبان\u200cها در تیمور شرقی و ماکائو رسمی است، در حالی که بیشتر پرتغالی\u200cزبانان در آسیا - حدود ۴۰۰٫۰۰۰ نفر - به دلیل بازگشت مهاجرت ژاپنی\u200cهای برزیل ساکن ژاپن هستند. در آمریکای شمالی ۱٫۰۰۰٫۰۰۰ نفر به پرتغالی به عنوان زبان نخست خود صحبت می\u200cکنند. پرتغالی در اقیانوسیه به دلیل شمار سخنگویانش در تیمور شرقی، پس از فرانسوی، دومین زبان رومی است که بیش از همه گویش می\u200cشود. نزدیکترین خویشاوند آن، گالیسی، دارای وضعیت رسمی در جامعه خودمختار گالیسیا در اسپانیا، همراه با اسپانیایی است.',
+    'در حدود اواخر کدام قرن پیش از میلاد سکاهای کوچ\u200cنشین در مرزهای شرقی اشکانیان پیشروی کردند؟',
+    'عباس جدیدی که بود؟',
+]
+embeddings = model.encode(sentences)
+print(embeddings.shape)
+# [3, 768]
+# Get the similarity scores for the embeddings
+similarities = model.similarity(embeddings, embeddings)
+print(similarities.shape)
+# [3, 3]
+```
+<!--
+### Direct Usage (Transformers)
+<details><summary>Click to see the direct usage in Transformers</summary>
+</details>
+-->
+<!--
+### Downstream Usage (Sentence Transformers)
+You can finetune this model on your own dataset.
+<details><summary>Click to expand</summary>
+</details>
+-->
+<!--
+### Out-of-Scope Use
+*List how the model may foreseeably be misused and address what users ought not to do with the model.*
+-->
+<!--
+## Bias, Risks and Limitations
+*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
+-->
+<!--
+### Recommendations
+*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
+-->
+## Training Details
+### Training Dataset
+#### Unnamed Dataset
+* Size: 96,546 training samples
+* Columns: <code>anchor</code>, <code>positive</code>, and <code>label</code>
+* Approximate statistics based on the first 1000 samples:
+  |         | anchor                                                                               | positive                                                                          | label                                           |
+  |:--------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:------------------------------------------------|
+  | type    | string                                                                               | string                                                                            | int                                             |
+  | details | <ul><li>min: 14 tokens</li><li>mean: 151.98 tokens</li><li>max: 283 tokens</li></ul> | <ul><li>min: 5 tokens</li><li>mean: 15.24 tokens</li><li>max: 90 tokens</li></ul> | <ul><li>0: ~50.50%</li><li>1: ~49.50%</li></ul> |
+* Samples:
+  | anchor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | positive                                                    | label          |
+  |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------|:---------------|
+  | <code>پاستل یک محیط نقاشی به شکل چوب است که از رنگدانه‌های پودری خالص و چسب تشکیل شده‌است. رنگدانه‌های مورد استفاده در پاستل همانهایی هستند که برای تولید همه محیط‌های هنری رنگی از جمله رنگ روغن استفاده می‌شود. چسب دارای رنگ خنثی و اشباع کم است. اثر رنگی پاستیل بیش از هر فرایند به رنگدانه‌های خشک طبیعی نزدیکتر است. از آنجا که سطح یک نقاشی پاستلی شکننده است و به راحتی لکه دار می‌شود، حفظ آن نیاز به اقدامات محافظتی مانند قاب‌بندی زیر شیشه دارد. همچنین ممکن است با ماده ثابت کننده اسپری شود. با این وجود، وقتی با رنگدانه‌های دائمی ساخته می‌شود و از آنها به درستی مراقبت می‌شود، ممکن است نقاشی پاستلی قرن‌ها بدون تغییر باقی بماند. پاستل‌ها، همان‌طور که نقاشی‌های ساخته شده با یک محیط مایع، در ب��ابر ترک خوردگی و تغییر رنگ که در اثر تغییر در رنگ، تیرگی یا ابعاد محیط خشک می‌شود، حساس نیستند.</code> | <code>پاستل از چه چیزهایی تشکیل شده است؟</code>             | <code>1</code> |
+  | <code>یک روش تغذیه و زندگی است که هدف آن حذف هر نوع محصول حیوانی چه در غذا و چه در مواد مصرفی است. مهم‌ترین دلایل گرایش به وگانیسم افراد، مسائل اخلاقی یا رعایت حقوق حیوانات، حفاظت محیط زیست، حفظ سلامتی، مسائل معنوی یا مذهبی است. بسیاری از افراد وگان با پرورش صنعتی حیوانات و آزمایش روی حیوانات مخالف هستند. از مهم‌ترین محصولات حیوانی که پاک گیاه‌خواران یا وگان‌ها از مصرف آن‌ها خودداری می‌کنند می‌توان به انواع گوشت (گوشت قرمز، مرغ، آبزیان، ماکیان و...)، لبنیات، تخم‌مرغ، عسل، ابریشم، چرم، خز، و... و نیز محصولاتی که در آن‌ها از فراورده‌های حیوانی (مانند ژله که از ژلاتین به‌دست می‌آید) استفاده شده‌است اشاره کرد.</code>                                                                                                                                                                             | <code>گیاه‌خواری چه روشی است؟</code>                        | <code>1</code> |
+  | <code>اسب‌های سنگین با اندامی عضلانی را به عنوان «اسب‌های خونسرد» می‌شناسند. آن‌ها را به دلیل توان ماهیچه‌ای و خوی آرام و صبورشان پرورش می‌دهند. مردم با کمک آن‌ها بارهای سنگین را جابجا می‌کردند. گاهی به این اسب‌های «غول‌های نجیب» هم گفته می‌شود. از جمله اسب‌های باری می‌توان به نژاد بلژیکی و کلایدزدیل اشاره کرد. برخی از این اسب‌ها مانند پرچرون سبک‌تر و چابک ترند و درکشیدن بار یا شخم زدن زمین در اقلیم خشک به کار می‌آیند. دیگران مانند شایر آرام‌تر و نیرومندترند و برای شخم زدن خاک‌های رسی کاربرد دارند. برخی اسبچهها هم در دستهٔ خونسردها جای می‌گیرند.</code>                                                                                                                                                                                                                                              | <code>اسب‌های سنگین با اندامی عضلانی را چه می‌نامند؟</code> | <code>1</code> |
+* Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
+### Evaluation Dataset
+#### Unnamed Dataset
+* Size: 11,990 evaluation samples
+* Columns: <code>anchor</code>, <code>positive</code>, and <code>label</code>
+* Approximate statistics based on the first 1000 samples:
+  |         | anchor                                                                               | positive                                                                          | label                                           |
+  |:--------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:------------------------------------------------|
+  | type    | string                                                                               | string                                                                            | int                                             |
+  | details | <ul><li>min: 41 tokens</li><li>mean: 146.59 tokens</li><li>max: 297 tokens</li></ul> | <ul><li>min: 5 tokens</li><li>mean: 15.28 tokens</li><li>max: 48 tokens</li></ul> | <ul><li>0: ~47.90%</li><li>1: ~52.10%</li></ul> |
+* Samples:
+  | anchor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | positive                                                                                      | label          |
+  |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------|:---------------|
+  | <code>بدنهٔ اسکلتی یا خرپا (Truss) در هواپیماهای اولیه تا جنگ جهانی اول بسیار استفاده می‌شد. هم‌اکنون در هواپیماهای دست‌ساز و نیز هواپیماهای مدل از این نوع بدنه استفاده زیادی می‌شود چرا که ساده، سبک و مقاوم بوده و با تیرک‌های چوبی قابل ساخت هستند. در این نوع بدنه اغلب نیروها و تنش‌های وارده توسط سازه اصلی تحمل شده و از پوسته برای ایجاد شکل آیرودینامیکی به سازه استفاده می‌شود. سازهٔ اصلی از تیرک‌های طولی، تیرک‌های مورب، قاب‌های عرضی و کابل‌های نگهدارنده تشکیل شده‌است. برادران رایت که اولین هواپیماهای قابل کنترل را ساختند از این حالت در ساختار بدنهٔ هواپیماهایشان استفاده می‌کردند.</code>                                                             | <code>در چه انتخاباتی یک نامزد نیاز به بیست درصد آرا دارد تا انتخاب‌شدن وی تضمین شود؟</code> | <code>0</code> |
+  | <code>شاید بتوان گفت این موضوع بر می‌گردد به ریشه زبان بلوچی که برگرفته از زبان پهلوی اشکانی و ساسانی می‌باشد. از آنجا که زبان پهلوی با دگرگونی‌هایی به زبان فارسی نو (امروزی) تبدیل شده‌است ویکی از این دگرگونی‌ها حذف (گ) از برخی کلمات می‌باشد می‌توان اینگونه بیان کرد که حرف گ و برخی حروف غیر عربی در زبان بلوچی خالص باقی مانده اما در زبان فارسی امروز گ از برخی کلمات حذف شده و دگرگون شده‌است؛ یعنی زبان بلوچی، "گ " اوستا را که در پازند و فارسی به "های " غیر ملفوظ تبدیل شده، مانند زبان پهلوی به صور ت "گ " و گاهی همان "ک " نگهداشته است. مثال‌های دیگر از دگرگونی حروف زبان باستان در فارسی نو اما ثابت ماندن آن‌ها در کلمات بلوچی در زیر آمده‌است:</code> | <code>در چه سالی هگل برای ادامهٔ تحصیل به دبیرستان ایلوستره رفت؟</code>                       | <code>0</code> |
+  | <code>خرطوم فیل‌ها حاصل اتصال بینی و لب بالایی است. این عضو، استخوان ندارد و دارای مقدار کمی چربی و حدود ۱۵۰۰۰۰ دسته ماهیچه‌ای است. یک یا دو لب انگشت در نوک آن وجود دارد. خرطوم این پستاندار تقریباً ۱٫۸ متر رشد می‌کند و وزنی حدود ۱۴۰ کیلوگرم دارد. این جانوران از خرطوم دراز خود به عنوان دست استفاده می‌کنند و با آن غذا و آب را در دهان خود می‌گذارند. فیل‌ها با استفاده از خرطوم خود می‌توانند حداکثر تا ۳۵۰کیلوگرم بار را برداشته و جابجا کنند. از دیگر کاربردهای خرطوم فیل‌ها احساس بویایی و همچنین تولید صدا است.</code>                                                                                                                                         | <code>فیل‌ها از خرطوم دراز خود به عنوان چه چیزی استفاده می‌کنند؟</code>                       | <code>1</code> |
+* Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
+### Training Hyperparameters
+#### Non-Default Hyperparameters
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `gradient_accumulation_steps`: 16
+- `num_train_epochs`: 2
+- `lr_scheduler_type`: cosine
+- `warmup_ratio`: 0.1
+- `bf16`: True
+- `load_best_model_at_end`: True
+- `deepspeed`: False
+- `batch_sampler`: no_duplicates
+#### All Hyperparameters
+<details><summary>Click to expand</summary>
+- `overwrite_output_dir`: False
+- `do_predict`: False
+- `prediction_loss_only`: True
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `per_gpu_train_batch_size`: None
+- `per_gpu_eval_batch_size`: None
+- `gradient_accumulation_steps`: 16
+- `eval_accumulation_steps`: None
+- `learning_rate`: 5e-05
+- `weight_decay`: 0.0
+- `adam_beta1`: 0.9
+- `adam_beta2`: 0.999
+- `adam_epsilon`: 1e-08
+- `max_grad_norm`: 1.0
+- `num_train_epochs`: 2
+- `max_steps`: -1
+- `lr_scheduler_type`: cosine
+- `lr_scheduler_kwargs`: {}
+- `warmup_ratio`: 0.1
+- `warmup_steps`: 0
+- `log_level`: passive
+- `log_level_replica`: warning
+- `log_on_each_node`: True
+- `logging_nan_inf_filter`: True
+- `save_safetensors`: True
+- `save_on_each_node`: False
+- `save_only_model`: False
+- `no_cuda`: False
+- `use_cpu`: False
+- `use_mps_device`: False
+- `seed`: 42
+- `data_seed`: None
+- `jit_mode_eval`: False
+- `use_ipex`: False
+- `bf16`: True
+- `fp16`: False
+- `fp16_opt_level`: O1
+- `half_precision_backend`: auto
+- `bf16_full_eval`: False
+- `fp16_full_eval`: False
+- `tf32`: None
+- `local_rank`: 0
+- `ddp_backend`: None
+- `tpu_num_cores`: None
+- `tpu_metrics_debug`: False
+- `debug`: []
+- `dataloader_drop_last`: False
+- `dataloader_num_workers`: 0
+- `dataloader_prefetch_factor`: None
+- `past_index`: -1
+- `disable_tqdm`: False
+- `remove_unused_columns`: True
+- `label_names`: None
+- `load_best_model_at_end`: True
+- `ignore_data_skip`: False
+- `fsdp`: []
+- `fsdp_min_num_params`: 0
+- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
+- `fsdp_transformer_layer_cls_to_wrap`: None
+- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
+- `deepspeed`: False
+- `label_smoothing_factor`: 0.0
+- `optim`: adamw_torch
+- `optim_args`: None
+- `adafactor`: False
+- `group_by_length`: False
+- `length_column_name`: length
+- `ddp_find_unused_parameters`: None
+- `ddp_bucket_cap_mb`: None
+- `ddp_broadcast_buffers`: False
+- `dataloader_pin_memory`: True
+- `dataloader_persistent_workers`: False
+- `skip_memory_metrics`: True
+- `use_legacy_prediction_loop`: False
+- `push_to_hub`: False
+- `resume_from_checkpoint`: None
+- `hub_model_id`: None
+- `hub_strategy`: every_save
+- `hub_private_repo`: False
+- `hub_always_push`: False
+- `gradient_checkpointing`: False
+- `gradient_checkpointing_kwargs`: None
+- `include_inputs_for_metrics`: False
+- `fp16_backend`: auto
+- `push_to_hub_model_id`: None
+- `push_to_hub_organization`: None
+- `mp_parameters`:
+- `auto_find_batch_size`: False
+- `full_determinism`: False
+- `torchdynamo`: None
+- `ray_scope`: last
+- `ddp_timeout`: 1800
+- `torch_compile`: False
+- `torch_compile_backend`: None
+- `torch_compile_mode`: None
+- `dispatch_batches`: None
+- `split_batches`: None
+- `include_tokens_per_second`: False
+- `include_num_input_tokens_seen`: False
+- `neftune_noise_alpha`: None
+- `optim_target_modules`: None
+- `batch_sampler`: no_duplicates
+- `multi_dataset_batch_sampler`: proportional
+</details>
+### Training Logs
+| Epoch      | Step    | Training Loss | loss       |
+|:----------:|:-------:|:-------------:|:----------:|
+| 0.0265     | 20      | 0.7506        | -          |
+| 0.0530     | 40      | 0.6701        | -          |
+| 0.0530     | 20      | 0.5843        | -          |
+| 0.1060     | 40      | 0.4591        | -          |
+| 0.1591     | 60      | 0.3316        | -          |
+| 0.2121     | 80      | 0.2856        | -          |
+| 0.2651     | 100     | 0.2599        | -          |
+| 0.3181     | 120     | 0.2478        | -          |
+| 0.3712     | 140     | 0.214         | -          |
+| 0.4242     | 160     | 0.1996        | -          |
+| 0.4772     | 180     | 0.1929        | -          |
+| 0.5302     | 200     | 0.193         | 0.1766     |
+| 0.5833     | 220     | 0.1798        | -          |
+| 0.6363     | 240     | 0.1794        | -          |
+| 0.6893     | 260     | 0.1735        | -          |
+| 0.7423     | 280     | 0.1713        | -          |
+| 0.7954     | 300     | 0.1547        | -          |
+| 0.8484     | 320     | 0.1545        | -          |
+| 0.9014     | 340     | 0.1577        | -          |
+| 0.9544     | 360     | 0.1575        | -          |
+| 1.0075     | 380     | 0.1431        | -          |
+| 1.0605     | 400     | 0.1498        | 0.1489     |
+| 1.1135     | 420     | 0.1327        | -          |
+| 1.1665     | 440     | 0.1223        | -          |
+| 1.2196     | 460     | 0.1154        | -          |
+| 1.2726     | 480     | 0.1059        | -          |
+| 1.3256     | 500     | 0.1068        | -          |
+| 1.3786     | 520     | 0.0959        | -          |
+| 1.4316     | 540     | 0.0884        | -          |
+| 1.4847     | 560     | 0.0896        | -          |
+| 1.5377     | 580     | 0.0899        | -          |
+| **1.5907** | **600** | **0.0814**    | **0.1445** |
+| 1.6437     | 620     | 0.0877        | -          |
+| 1.6968     | 640     | 0.0816        | -          |
+| 1.7498     | 660     | 0.0846        | -          |
+| 1.8028     | 680     | 0.0783        | -          |
+| 1.8558     | 700     | 0.0787        | -          |
+| 1.9089     | 720     | 0.0874        | -          |
+| 1.9619     | 740     | 0.0883        | -          |
+* The bold row denotes the saved checkpoint.
+### Framework Versions
+- Python: 3.10.13
+- Sentence Transformers: 3.0.1
+- Transformers: 4.39.3
+- PyTorch: 2.1.1+cu121
+- Accelerate: 0.26.1
+- Datasets: 2.19.2
+- Tokenizers: 0.15.2
+## Citation
+### BibTeX
+#### Sentence Transformers and SoftmaxLoss
+```bibtex
+@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}
+```
+<!--
+## Glossary
+*Clearly define terms in order to be accessible across audiences.*
+-->
+<!--
+## Model Card Authors
+*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
+-->
+<!--
+## Model Card Contact
+*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
 -->