End of training
Browse files- 1_Pooling/config.json +10 -0
- README.md +566 -0
- config_sentence_transformers.json +10 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 384,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,566 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
tags:
|
3 |
+
- sentence-transformers
|
4 |
+
- sentence-similarity
|
5 |
+
- feature-extraction
|
6 |
+
- generated_from_trainer
|
7 |
+
- dataset_size:46095
|
8 |
+
- loss:MultipleNegativesRankingLoss
|
9 |
+
base_model: intfloat/multilingual-e5-small
|
10 |
+
widget:
|
11 |
+
- source_sentence: 'Paslon Atang Annida Dapat Dukungan Relawan Badani di Pilkada 2024.
|
12 |
+
Bandung, VIVA - Elemen dukungan bagi pasangan Calon Wali Kota dan Wakil Wali Kota
|
13 |
+
Bogor pada Pilkada 2024 yaitu Atang Trisnanto - Annida Allivia terus bermunculan.
|
14 |
+
Salahsatunya Balad Abah Diani (Badani) menyatakan telah menjadi relawan untuk
|
15 |
+
pemenangan Atang - Annida. Badani mendeklarasikan dukungannya di Posko Badani,
|
16 |
+
Jalan Dadali No. 39, Kecamatan Tanah Sareal, pada Minggu 27 Oktober 2024. Deklarasi
|
17 |
+
ini dihadiri 500 orang pendukung yang terdiri dari pensiunan ASN, organisasi masyarakat,
|
18 |
+
komunitas relawan, dan tokoh masyarakat.\xa0 "Mereka berkomitmen untuk mendukung
|
19 |
+
visi dan misi Atang-Annida dalam memajukan Kota Bogor serta mewujudkan Bogor Nyaman
|
20 |
+
untuk Semua," kata Dewan Pembina Badani, H. Diani Budiarto dalam keterangannya,
|
21 |
+
Rabu 30 Oktober 2024. Menurutnya, deklarasi ini bertujuan mengumpulkan potensi
|
22 |
+
berbagai kalangan, mulai dari organisasi masyarakat, pensiunan, kelompok anak
|
23 |
+
muda, komunitas relawan, maupun tokoh masyarakat yang memiliki visi yang sama
|
24 |
+
dalam memajukan Kota Bogor.\xa0 "Kami ingin bergabung memenangkan pasangan Atang-Annida
|
25 |
+
sebagai Wali Kota dan Wakil Wali Kota Bogor periode 2024-2029," ujar Diani. Selain
|
26 |
+
itu, mantan Wali Kota Bogor periode 2004-2014 ini memproyeksikan relawan ini memberikan
|
27 |
+
semangat bagi Partai Keadilan Sejahtera (PKS) dan memperlihatkan bahwa mereka
|
28 |
+
tidak berjalan sendiri. , "Banyak elemen masyarakat berharap PKS mampu menghadirkan
|
29 |
+
kepemimpinan baru yang dekat dengan masyarakat," katanya., Menurutnya, pasca memantau
|
30 |
+
seluruh kandidat, Badani memilih untuk mendukung pasangan Atang-Annida. "Kami
|
31 |
+
menilai Atang-Annida adalah pasangan calon yang paling sejalan dengan aspirasi
|
32 |
+
masyarakat Kota Bogor,” katanya., , “Memiliki komitmen untuk hadir di tengah-tengah
|
33 |
+
masyarakat, mendengarkan aspirasi, dan mampu memberikan solusi untuk permasalahan
|
34 |
+
yang ada," terangnya., Menyikapi hal ini, Atang Trisnanto menyampaikan rasa syukur,
|
35 |
+
terima kasih, dan apresiasi kepada Badani atas dukungan yang diberikan. "Saya
|
36 |
+
bertekad untuk mendengar aspirasi masyarakat, dan bersama-sama kita akan membangun
|
37 |
+
Bogor yang kita cintai ini. Mari kita wujudkan Bogor Nyaman untuk Semua: nyaman
|
38 |
+
pelayanannya, nyaman rezekinya, nyaman kotanya, dan nyaman hidupnya," terangnya.
|
39 |
+
*'
|
40 |
+
sentences:
|
41 |
+
- Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
|
42 |
+
atau menciptakan persepsi buruk terhadap timnas indonesia?
|
43 |
+
- Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
|
44 |
+
tanpa memberikan opini atau emosi terhadap timnas indonesia?
|
45 |
+
- Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
|
46 |
+
yang dapat meningkatkan citra atau reputasi timnas indonesia?
|
47 |
+
- source_sentence: 'My fears if we cut out GPs from breast checks. I’m 86 and I’ve
|
48 |
+
been on HRT since my early 40s when I had a hysterectomy. I believe it has kept
|
49 |
+
me healthy and active. I’ve never broken a bone – even though osteoporosis runs
|
50 |
+
in my family – and this must be thanks to the HRT. Now my GP wants me to stop
|
51 |
+
using the patches as he says I’m too old to be on HRT. What should I do? Dr Ellie
|
52 |
+
Cannon replies: Doctors are always cautious about older patients taking prescription
|
53 |
+
medicines because they are more likely to suffer side effects – some of which
|
54 |
+
can be dangerous. In the case of hormone replacement therapy (HRT), it can raise
|
55 |
+
the risk of a stroke or life-threatening blood clot. NHS guidelines also state
|
56 |
+
that patients should be on HRT for as short a time as possible, and recommend
|
57 |
+
that women come off it every few years to find out if it is making a significant
|
58 |
+
difference to their symptoms. However, that does not mean a woman in her 80s categorically
|
59 |
+
cannot take it. Firstly, there is no upper age limit to taking HRT. Secondly,
|
60 |
+
menopause treatment is supposed to be personalised to each patient. This is because
|
61 |
+
the symptoms affect women in different ways. Some women will need larger – or
|
62 |
+
smaller – HRT doses than others. And there are those who benefit from taking these
|
63 |
+
replacement hormones for decades, while others may need them for only a year or
|
64 |
+
two. It’s also important to consider the different types of HRT that are available.
|
65 |
+
Patches are considered to have a lower stroke risk than tablets, and there are
|
66 |
+
also low-strength patches which contain less oestrogen that can reduce this risk
|
67 |
+
even further. Moreover, HRT gel is even safer than patches, because it can be
|
68 |
+
used in very small doses. These are all options worth discussing with a GP. However,
|
69 |
+
for anyone worried about the risk of developing osteoporosis, it’s crucial to
|
70 |
+
understand that HRT – while shown to protect against the bone-thinning disease
|
71 |
+
– is not the only way to prevent it. Walking can keep it at bay, as well as a
|
72 |
+
diet with sufficient amounts of calcium and vitamin D. Adults need 1,000mg of
|
73 |
+
calcium a day to lower the risk of bone breaks. In June I developed a rash on
|
74 |
+
my feet, legs and buttocks. My GP diagnosed me with scabies and it does appear
|
75 |
+
that the treatment is working. However, apparently it is spread through close
|
76 |
+
– often sexual – sexual contact, and I have not been intimate with anyone for
|
77 |
+
well over a year. Could this really be scabies? Dr Ellie replies: Scabies is a
|
78 |
+
skin infestation caused by a parasite called a mite. The itching is caused by
|
79 |
+
the body’s response to the mites and their eggs on the skin. The parasites often
|
80 |
+
congregate in the fingers, tummy, genitals, arms and bottom. In recent years I
|
81 |
+
have noticed a rise in scabies patients at my GP surgery, which suggests it is
|
82 |
+
more common than it once was. These mites are also slowly becoming resistant to
|
83 |
+
current treatments. It is true that it usually requires close physical contact
|
84 |
+
to spread scabies, which is why it is often transmitted during sex. Brief physical
|
85 |
+
touch – such as a handshake – is unlikely to lead to scabies. However, mites can
|
86 |
+
also survive for several days in humid environments. Contaminated bedsheets and
|
87 |
+
clothes should always be washed at hot temperatures to kill the mite and eggs.
|
88 |
+
The most common treatment is an anti-parasitic liquid called Derbac M – also known
|
89 |
+
as malathion. For most patients, it is quick and effective. I’ve had balance problems
|
90 |
+
since I had a pacemaker fitted in 2019. It feels like I’m drunk at all times.
|
91 |
+
I’ve been seen by a neurologist who says I don’t have any brain issues such as
|
92 |
+
Parkinson’s. Could my pacemaker be to blame? Dr Ellie replies: It''s important
|
93 |
+
to always see a GP about balance problems. Not only is it a very distressing symptom,
|
94 |
+
it can also lead to falls and life-changing injuries. But unpicking its cause
|
95 |
+
can be complicated, because there are several possible triggers. For example,
|
96 |
+
if the dizziness occurs when standing or sitting up suddenly, it might be due
|
97 |
+
to out-of-control blood pressure. However, pacemakers, in rare cases, do have
|
98 |
+
side effects. The devices are fitted to control the beating of the heart. For
|
99 |
+
most who receive them, they massively improve quality of life and are even life-saving.
|
100 |
+
However, a small percentage of patients can suffer something known as pacemaker
|
101 |
+
syndrome. This is when electrical activity in the heart is not regulated properly,
|
102 |
+
meaning the organ does not beat as it should. As a result, people may experience
|
103 |
+
dizziness, fatigue and light-headedness. Some even faint. Anyone who experiences
|
104 |
+
balance problems after a pacemaker is fitted should see a cardiologist to explore
|
105 |
+
the possibility of this syndrome. There are tests that specialists can carry out
|
106 |
+
in hospital to work out whether the device is to blame. If it is, then a different
|
107 |
+
type of pacemaker can be used instead. A GP can make a referral to see a cardiologist.
|
108 |
+
I was concerned to read about a Government scheme that will allow women to refer
|
109 |
+
themselves for a breast cancer check without seeing a GP first. In Somerset, they
|
110 |
+
will be able to call the non-emergency phone line 111 – or use the NHS app – to
|
111 |
+
report a breast lump, and then will be directed to a specialist clinic for a cancer
|
112 |
+
check. If successful, the scheme will be rolled out across the country. I don’t
|
113 |
+
support this. Delays in cancer diagnoses do cost lives, and we need to speed up
|
114 |
+
this process, but the vast majority of new lumps are not cancerous. Testing every
|
115 |
+
lump could lead to unnecessary invasive investigations and will certainly clog
|
116 |
+
up NHS resources. Do you agree? Do you believe your breast cancer could have been
|
117 |
+
diagnosed sooner if you had been able to self-refer? Please let me know using
|
118 |
+
the email address below. I was taken aback last week when the end-of-life charity
|
119 |
+
Marie Curie released a list of the most popular songs that people want to listen
|
120 |
+
to in their final moments. Frank Sinatra’s My Way, The Beatles’ Hey Jude, and
|
121 |
+
Over The Rainbow by Judy Garland were among the top answers. I’m sure these are
|
122 |
+
all great songs, but the idea of playing music at the end of life is a strange
|
123 |
+
concept to me. Sadly, in the past year, I’ve experienced the deaths of four family
|
124 |
+
members. Not one of them requested that music was to be played at the end. However,
|
125 |
+
that’s not to say that it doesn’t bring peace and happiness to others. Do you
|
126 |
+
have a song that you would like played on your death bed? Has a family member
|
127 |
+
requested one? Please write in and let me know. Do you have a question for Dr
|
128 |
+
Ellie Cannon? Email [email protected] Dr Cannon cannot enter into personal
|
129 |
+
correspondence and her replies should be taken in a general context.'
|
130 |
+
sentences:
|
131 |
+
- Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
|
132 |
+
tanpa memberikan opini atau emosi terhadap kementerian kesehatan?
|
133 |
+
- Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
|
134 |
+
atau menciptakan persepsi buruk terhadap kementerian kesehatan?
|
135 |
+
- Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
|
136 |
+
yang dapat meningkatkan citra atau reputasi kementerian kesehatan?
|
137 |
+
- source_sentence: 'Cara Efektif Hadapi Orang yang Susah Menerima Kritik, Bicara Tanpa
|
138 |
+
Baper. MEDIA PAKUAN - Berhadapan dengan orang yang anti kritik bisa jadi hal yang
|
139 |
+
cukup menantang. Mereka seringkali sulit menerima masukan, bahkan jika itu demi
|
140 |
+
kebaikan mereka sendiri. Namun, jika kita menggunakan pendekatan yang tepat, komunikasi
|
141 |
+
bisa berjalan lebih efektif. Berikut adalah beberapa tips yang bisa Anda coba
|
142 |
+
ketika harus berhadapan dengan mereka. Jika Anda sudah mencoba berbagai cara untuk
|
143 |
+
berkomunikasi dengan seseorang yang anti kritik dan tidak ada perubahan yang berarti,
|
144 |
+
mungkin sudah saatnya untuk membatasi interaksi dengan mereka. Terlalu sering
|
145 |
+
berurusan dengan orang seperti itu dapat berdampak negatif pada kesehatan mental
|
146 |
+
Anda.*** Berita Pilihan Perbedaan Sakit Perut Saat Haid dan Hamil, Mana Kamu?
|
147 |
+
Ciri-Ciri Hamil Tanpa Morning Sickness, Jangan Terlewat! Nyeri Payudara: Tanda
|
148 |
+
Haid atau Kehamilan? Benarkah Bentuk Perut Bisa Jadi Tanda Awal Kehamilan? Ini
|
149 |
+
Faktanya! Cara Mengetahui Kehamilan Sejak Minggu Pertama, Ini Tanda-Tanda Awalnya!'
|
150 |
+
sentences:
|
151 |
+
- Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
|
152 |
+
tanpa memberikan opini atau emosi terhadap kesehatan mental?
|
153 |
+
- Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
|
154 |
+
atau menciptakan persepsi buruk terhadap kesehatan mental?
|
155 |
+
- Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
|
156 |
+
yang dapat meningkatkan citra atau reputasi kesehatan mental?
|
157 |
+
- source_sentence: Dukung Program Presiden RI, Polresta Bandung Tindak Tegas Pelaku
|
158 |
+
Tambang Ilegal. 60MENIT.COM, Bandung - Dalam rangka mendukung 17 Program Prioritas
|
159 |
+
Presiden Prabowo Subianto - Gibran, khususnya nomor 11 terkait kelestarian lingkungan
|
160 |
+
hidup. Unit Tipidter Sat Reskrim Polresta Bandung berhasil mengungkap dugaan tindak
|
161 |
+
pidana penambangan tanpa izin atau ilegal di kawasan Gunung Sungapan, Jalan Raya
|
162 |
+
Soreang-Ciwidey, Kecamatan Soreang, Kabupaten Bandung. Pengungkapan ini berhasil
|
163 |
+
diungkap berdasarkan hasil penyelidikan. Dimana aktivitas penambangan ilegal tersebut
|
164 |
+
telah berlangsung selama kurang lebih tiga bulan, terhitung sejak Agustus 2024.
|
165 |
+
Kapolresta Bandung, Kombes Pol Kusworo Wibowo mengatakan terungkapnya tambang
|
166 |
+
ilegal ini, pihaknya mengamankan satu pelaku berinisial EMK (52) yang berperan
|
167 |
+
sebagai pengelola. "Menurut laporan, kegiatan tambang ilegal ini telah berlangsung
|
168 |
+
selama tiga bulan terakhir. Dalam kurun waktu tersebut, para pelaku diketahui
|
169 |
+
menjual hasil tambang berupa tanah berbatu ke beberapa tempat, termasuk perumahan
|
170 |
+
dan real estate di wilayah Bandung," kata Kusworo saat menggerlar konferensi pers
|
171 |
+
di lokasi penambangan ilegal. Selasa, 5 November 2024. "Dari aktivitas ini, pencatatan
|
172 |
+
penjualan material tambang dijual dengan harga Rp300ribu per tronton (24 kubik)
|
173 |
+
dan Rp100ribu per dump truck (7 kubik). Konsumen yang membutuhkan material tambang
|
174 |
+
dapat datang langsung ke lokasi atau memesannya terlebih dahulu," ujarnya. Namun,
|
175 |
+
ia menegaskan bahwa selain keuntungan finansial, ada risiko besar yang dihadapi
|
176 |
+
masyarakat. Kegiatan tambang ilegal di area tersebut berpotensi menyebabkan bencana
|
177 |
+
longsor di perbukitan sekitar. "Longsor ini dapat membahayakan para pengguna Jalan
|
178 |
+
Raya Soreang-Ciwidey, yang berada di jalur berdekatan dengan lokasi tambang,"
|
179 |
+
tuturnya. "Jika longsor terjadi, terutama saat arus lalu lintas sedang padat,
|
180 |
+
kendaraan yang melintas bisa tersapu ke jurang di sisi kanan jalan, mengancam
|
181 |
+
keselamatan para pengendara," jelasnya. Kusworo mengungkapkan untuk mencegah risiko
|
182 |
+
tersebut, pihaknya langsung mengambil tindakan tegas, yakni menyita sejumlah barang
|
183 |
+
bukti yang berada di lokasi. "Kami mengimbau masyarakat untuk lebih waspada terhadap
|
184 |
+
kegiatan serupa dan turut melaporkan apabila menemukan aktivitas yang membahayakan
|
185 |
+
lingkungan hidup di wilayah mereka," ujarnya. Guna mempertanggungjawabkan perbuatannya,
|
186 |
+
pelaku dijerat Pasal 158 Jo. Pasal 35 UU RI No. 3 Tahun 2020 tentang perubahan
|
187 |
+
atas UU RI No. 4 Tahun 2009 tentang Pertambangan Mineral dan Batubara sebagaimana
|
188 |
+
telah diubah dengan UU RI No. 6 Tahun 2023 tentang penetapan peratutan pemerintah
|
189 |
+
pengganti UU RI No. 2 Tahun 2022 tentang Cipta Kerja Menjadi Undang-undang dengan
|
190 |
+
ancaman maksimal 5 tahun penjara dan denda Rp. 100 miliar. (Taupik)
|
191 |
+
sentences:
|
192 |
+
- Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
|
193 |
+
yang dapat meningkatkan citra atau reputasi pelaku tambang ilegal (emk)?
|
194 |
+
- Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
|
195 |
+
tanpa memberikan opini atau emosi terhadap pelaku tambang ilegal (emk)?
|
196 |
+
- Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
|
197 |
+
atau menciptakan persepsi buruk terhadap pelaku tambang ilegal (emk)?
|
198 |
+
- source_sentence: Bambang Hermanto Serukan Ketertiban Pasca Insiden Penghadangan
|
199 |
+
Kampanye Calon Bupati. RADARINDRAMAYU.ID - Kampanye politik di Kabupaten Indramayu
|
200 |
+
mulai memanas setelah terjadi penghadangan oleh sekelompok orang terhadap calon
|
201 |
+
Bupati Indramayu nomor urut 3, Nina Agustina, saat ia hendak berkampanye di Desa
|
202 |
+
Tegal Taman, Kecamatan Sukra, beberapa waktu lalu.\xa0\n Kejadian tersebut tentunya
|
203 |
+
telah memicu reaksi dari berbagai elemen masyarakat, yang khawatir akan stabilitas
|
204 |
+
dan keamanan dalam pelaksanaan Pilkada 2024.\n Sejumlah organisasi masyarakat
|
205 |
+
dan tokoh lokal mengecam tindakan penghadangan tersebut, menilai bahwa hal itu
|
206 |
+
bertentangan dengan semangat demokrasi.\xa0\n Mereka menekankan pentingnya kebebasan
|
207 |
+
berpendapat dan berkampanye tanpa intimidasi.\xa0\n Situasi ini menunjukkan bahwa
|
208 |
+
suhu politik di Indramayu mulai meningkat menjelang pemilihan, dan masyarakat
|
209 |
+
diimbau untuk tetap tenang dan bijaksana.\n Menanggapi situasi ini, Bambang Hermanto,
|
210 |
+
calon Bupati Indramayu nomor urut 1, mengajak seluruh masyarakat untuk menjaga
|
211 |
+
ketertiban dan keamanan selama proses Pilkada.\xa0\n Dalam pernyataan resmi di
|
212 |
+
Instagram pribadinya, pada Sabtu, 2 November 2024, Bambang menegaskan,\n "Saya
|
213 |
+
Bambang Hermanto, calon bupati wong Dermayu nomor urut 1. Saya ingin mengimbau
|
214 |
+
kepada seluruh lapisan masyarakat Indramayu untuk sama-sama menjaga kondusifitas
|
215 |
+
lingkungan, jangan sampai kita terpecah belah,"\n Jika terpecah belah, kata Bambang,
|
216 |
+
nanti masyarakat Indramayu akan merasakan sendiri akibat dari perpecahan tersebut.\xa0\n
|
217 |
+
Bambang menambahkan bahwa masyarakat Indramayu harus cerdas dalam memilih pemimpin
|
218 |
+
yang mampu memberikan kenyamanan dan mengayomi.\xa0\n Ia percaya bahwa warga Indramayu
|
219 |
+
sudah memiliki pemahaman yang baik tentang calon-calon mereka, dan berharap agar
|
220 |
+
pemilihan berlangsung dengan damai.\xa0\n "Saya yakin dan percaya masyarakat Indramayu
|
221 |
+
sudah pada cerdas semua, sudah punya pilihan siapa calon Bupatinya yang betul-betul
|
222 |
+
bisa memimpin Indramayu lebih baik lagi," ujarnya.\n Diharapkan semua pihak dapat
|
223 |
+
saling bekerja sama dalam menjaga situasi tetap kondusif, demi terciptanya pemilihan
|
224 |
+
yang adil dan demokratis.
|
225 |
+
sentences:
|
226 |
+
- Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan
|
227 |
+
atau menciptakan persepsi buruk terhadap pilkada 2024?
|
228 |
+
- Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat
|
229 |
+
yang dapat meningkatkan citra atau reputasi pilkada 2024?
|
230 |
+
- Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi
|
231 |
+
tanpa memberikan opini atau emosi terhadap pilkada 2024?
|
232 |
+
pipeline_tag: sentence-similarity
|
233 |
+
library_name: sentence-transformers
|
234 |
+
---
|
235 |
+
|
236 |
+
# SentenceTransformer based on intfloat/multilingual-e5-small
|
237 |
+
|
238 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) on the preskripsi-sentiment-analysis-dataset-for-embedding-ft dataset. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
239 |
+
|
240 |
+
## Model Details
|
241 |
+
|
242 |
+
### Model Description
|
243 |
+
- **Model Type:** Sentence Transformer
|
244 |
+
- **Base model:** [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) <!-- at revision fd1525a9fd15316a2d503bf26ab031a61d056e98 -->
|
245 |
+
- **Maximum Sequence Length:** 512 tokens
|
246 |
+
- **Output Dimensionality:** 384 dimensions
|
247 |
+
- **Similarity Function:** Cosine Similarity
|
248 |
+
- **Training Dataset:**
|
249 |
+
- preskripsi-sentiment-analysis-dataset-for-embedding-ft
|
250 |
+
<!-- - **Language:** Unknown -->
|
251 |
+
<!-- - **License:** Unknown -->
|
252 |
+
|
253 |
+
### Model Sources
|
254 |
+
|
255 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
256 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
257 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
258 |
+
|
259 |
+
### Full Model Architecture
|
260 |
+
|
261 |
+
```
|
262 |
+
SentenceTransformer(
|
263 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
|
264 |
+
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
265 |
+
(2): Normalize()
|
266 |
+
)
|
267 |
+
```
|
268 |
+
|
269 |
+
## Usage
|
270 |
+
|
271 |
+
### Direct Usage (Sentence Transformers)
|
272 |
+
|
273 |
+
First install the Sentence Transformers library:
|
274 |
+
|
275 |
+
```bash
|
276 |
+
pip install -U sentence-transformers
|
277 |
+
```
|
278 |
+
|
279 |
+
Then you can load this model and run inference.
|
280 |
+
```python
|
281 |
+
from sentence_transformers import SentenceTransformer
|
282 |
+
|
283 |
+
# Download from the 🤗 Hub
|
284 |
+
model = SentenceTransformer("masa-research/me5-small-preskripsi-embedding-pos-multineg")
|
285 |
+
# Run inference
|
286 |
+
sentences = [
|
287 |
+
'Bambang Hermanto Serukan Ketertiban Pasca Insiden Penghadangan Kampanye Calon Bupati. RADARINDRAMAYU.ID - Kampanye politik di Kabupaten Indramayu mulai memanas setelah terjadi penghadangan oleh sekelompok orang terhadap calon Bupati Indramayu nomor urut 3, Nina Agustina, saat ia hendak berkampanye di Desa Tegal Taman, Kecamatan Sukra, beberapa waktu lalu.\\xa0\\n Kejadian tersebut tentunya telah memicu reaksi dari berbagai elemen masyarakat, yang khawatir akan stabilitas dan keamanan dalam pelaksanaan Pilkada 2024.\\n Sejumlah organisasi masyarakat dan tokoh lokal mengecam tindakan penghadangan tersebut, menilai bahwa hal itu bertentangan dengan semangat demokrasi.\\xa0\\n Mereka menekankan pentingnya kebebasan berpendapat dan berkampanye tanpa intimidasi.\\xa0\\n Situasi ini menunjukkan bahwa suhu politik di Indramayu mulai meningkat menjelang pemilihan, dan masyarakat diimbau untuk tetap tenang dan bijaksana.\\n Menanggapi situasi ini, Bambang Hermanto, calon Bupati Indramayu nomor urut 1, mengajak seluruh masyarakat untuk menjaga ketertiban dan keamanan selama proses Pilkada.\\xa0\\n Dalam pernyataan resmi di Instagram pribadinya, pada Sabtu, 2 November 2024, Bambang menegaskan,\\n "Saya Bambang Hermanto, calon bupati wong Dermayu nomor urut 1. Saya ingin mengimbau kepada seluruh lapisan masyarakat Indramayu untuk sama-sama menjaga kondusifitas lingkungan, jangan sampai kita terpecah belah,"\\n Jika terpecah belah, kata Bambang, nanti masyarakat Indramayu akan merasakan sendiri akibat dari perpecahan tersebut.\\xa0\\n Bambang menambahkan bahwa masyarakat Indramayu harus cerdas dalam memilih pemimpin yang mampu memberikan kenyamanan dan mengayomi.\\xa0\\n Ia percaya bahwa warga Indramayu sudah memiliki pemahaman yang baik tentang calon-calon mereka, dan berharap agar pemilihan berlangsung dengan damai.\\xa0\\n "Saya yakin dan percaya masyarakat Indramayu sudah pada cerdas semua, sudah punya pilihan siapa calon Bupatinya yang betul-betul bisa memimpin Indramayu lebih baik lagi," ujarnya.\\n Diharapkan semua pihak dapat saling bekerja sama dalam menjaga situasi tetap kondusif, demi terciptanya pemilihan yang adil dan demokratis.',
|
288 |
+
'Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap pilkada 2024?',
|
289 |
+
'Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi pilkada 2024?',
|
290 |
+
]
|
291 |
+
embeddings = model.encode(sentences)
|
292 |
+
print(embeddings.shape)
|
293 |
+
# [3, 384]
|
294 |
+
|
295 |
+
# Get the similarity scores for the embeddings
|
296 |
+
similarities = model.similarity(embeddings, embeddings)
|
297 |
+
print(similarities.shape)
|
298 |
+
# [3, 3]
|
299 |
+
```
|
300 |
+
|
301 |
+
<!--
|
302 |
+
### Direct Usage (Transformers)
|
303 |
+
|
304 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
305 |
+
|
306 |
+
</details>
|
307 |
+
-->
|
308 |
+
|
309 |
+
<!--
|
310 |
+
### Downstream Usage (Sentence Transformers)
|
311 |
+
|
312 |
+
You can finetune this model on your own dataset.
|
313 |
+
|
314 |
+
<details><summary>Click to expand</summary>
|
315 |
+
|
316 |
+
</details>
|
317 |
+
-->
|
318 |
+
|
319 |
+
<!--
|
320 |
+
### Out-of-Scope Use
|
321 |
+
|
322 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
323 |
+
-->
|
324 |
+
|
325 |
+
<!--
|
326 |
+
## Bias, Risks and Limitations
|
327 |
+
|
328 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
329 |
+
-->
|
330 |
+
|
331 |
+
<!--
|
332 |
+
### Recommendations
|
333 |
+
|
334 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
335 |
+
-->
|
336 |
+
|
337 |
+
## Training Details
|
338 |
+
|
339 |
+
### Training Dataset
|
340 |
+
|
341 |
+
#### preskripsi-sentiment-analysis-dataset-for-embedding-ft
|
342 |
+
|
343 |
+
* Dataset: preskripsi-sentiment-analysis-dataset-for-embedding-ft
|
344 |
+
* Size: 46,095 training samples
|
345 |
+
* Columns: <code>artikel</code>, <code>positive</code>, <code>negative_1</code>, and <code>negative_2</code>
|
346 |
+
* Approximate statistics based on the first 1000 samples:
|
347 |
+
| | artikel | positive | negative_1 | negative_2 |
|
348 |
+
|:--------|:-------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
|
349 |
+
| type | string | string | string | string |
|
350 |
+
| details | <ul><li>min: 32 tokens</li><li>mean: 439.08 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 24 tokens</li><li>mean: 28.16 tokens</li><li>max: 78 tokens</li></ul> | <ul><li>min: 27 tokens</li><li>mean: 31.16 tokens</li><li>max: 81 tokens</li></ul> | <ul><li>min: 27 tokens</li><li>mean: 31.16 tokens</li><li>max: 81 tokens</li></ul> |
|
351 |
+
* Samples:
|
352 |
+
| artikel | positive | negative_1 | negative_2 |
|
353 |
+
|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
354 |
+
| <code>Apa Kabar Elkan Baggott Setelah Absen 10 Bulan dari Timnas Indonesia? Lagi Terapi Cedera Pergelangan Kaki dan Segera Comeback. Bola.com, Blackpool - Cedera pergelangan kaki Elkan Baggott hampir sembuh. Bek berusia 22 tahun itu segera kembali bermain untuk Blackpool FC di kasta ketiga Liga Inggris? Elkan Baggott telah absen membela Blackpool sejak Agustus 2024 akibat cedera pergelangan kaki yang membuatnya baru bermain empat kali pada musim ini. Penampilan terakhir Elkan Baggott di Blackpool terjadi pada 24 Agustus 2024, ketika bermain imbang 4-4 melawan Cambridge United dalam matchday ketiga League One 2024/2025. Elkan Baggott sedang menjalani peminjaman di Blackpool selama semusim dari Ipswich Town. Pemain kelahiran Bangkok, Thailand, itu diperkirakan akan kembali membela Blackpool kontra Liverpool U-21 dalam EFL Trophy 2024/2025 pada 7 November 2024. "Elkan Baggott menjalani sesi latihan pertamanya, jadi senang bisa melihatnya kembali bersama tim," ujar pelatih Blackpool, Stephen Dob...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap timnas indonesia?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi timnas indonesia?</code> | <code>Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi tanpa memberikan opini atau emosi terhadap timnas indonesia?</code> |
|
355 |
+
| <code>Di Balik Penangkapan Terduga Teroris di 3 Wilayah Jawa Timur dan NTB. KOMPAS.com- Detasemen Khusus (Densus) 88 Antiteror Mabes Polri menangkap sejumlah terduga teroris di Nusa Tenggara Barat dan Jawa Timur, beberapa hari terakhir. Mulanya penangkapan dilakukan terhadap MT di Bima, NTB pada 31 Mei 2023. Dari keterangan Mabes Polri, MT difasilitasi untuk berangkat ke Yaman dan bergabung dengan organisasi AQAP (cabang AlQaedah). Selanjutnya, berdasarkan pengembangan, Densus menangkap sejumlah terduga teroris lainnya. Pada Jumat (2/6/2023) pagi Densus menangkap ABU, terduga teroris di Jalan Kalimas Madya III Nyamplungan, Kecamatan Pabean Cantian, Surabaya, Jawa Timur. "Diamankan 07.30 WIB, setahu saya di rumahnya," kata Ketua RT M. Abri, Sabtu (3/6/2023). Setelah penangkapan tersebut dilakukan penggeledahan di rumah ABU. Abri yang turut serta dalam penggeledahan mengatakan polisi menyita sejumlah buku, busur, dan anak panah. "Iya ada panah. Ujungnya memang sangat tajam. Tapi tadi saya liha...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap MT?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi MT?</code> | <code>Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi tanpa memberikan opini atau emosi terhadap MT?</code> |
|
356 |
+
| <code>Dirjen Imigrasi Enggan Salahkan Siapapun Soal Peretasan: Sesama Bus Kota Enggak Boleh Saling Menyalip. JAKARTA, KOMPAS.com - Direktur Jenderal (Dirjen) Imigrasi Silmy Karim enggan menyalahkan siapa pun atas peristiwa gangguan sistem pelayanan imigrasi, yang terjadi karena peretasan Pusat Data Nasional (PDN). Menurutnya, ia tak berwenang untuk menilai kementerian/lembaga lain atas peristiwa peretasan yang terjadi. "Ya enggak mungkin saya gitu (menilai)," kata Silmy dalam konferensi pers di kawasan Jakarta Selatan, Jumat (28/6/2024). "Sudah lah, sesama bus kota enggak boleh saling menyalip," tambahnya. Ia menambahkan, hanya pakar di luar kementerian/lembaga yang berhak menilai atas peristiwa yang terjadi. Termasuk, siapa yang patut bertanggungjawab atas peristiwa ini. "Itu yang bisa ngomong kayak gitu pengamat, bisa lah. Saya enggak bisa," tegas Silmy. Sebelumnya, muncul petisi online untuk meminta Menkominfo Budi Arie Setiadi mundur karena dianggap tak bisa menyelesaikan PDN yang disera...</code> | <code>Seberapa kuat artikel ini mengandung sentimen negatif atau kritik yang dapat merugikan atau menciptakan persepsi buruk terhadap Budi Arie Setiadi?</code> | <code>Seberapa kuat artikel ini mengandung sentimen positif, dukungan, atau manfaat yang dapat meningkatkan citra atau reputasi Budi Arie Setiadi?</code> | <code>Seberapa netral artikel ini? Apakah artikel ini hanya menyajikan fakta atau informasi tanpa memberikan opini atau emosi terhadap Budi Arie Setiadi?</code> |
|
357 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
358 |
+
```json
|
359 |
+
{
|
360 |
+
"scale": 20.0,
|
361 |
+
"similarity_fct": "cos_sim"
|
362 |
+
}
|
363 |
+
```
|
364 |
+
|
365 |
+
### Training Hyperparameters
|
366 |
+
#### Non-Default Hyperparameters
|
367 |
+
|
368 |
+
- `per_device_train_batch_size`: 16
|
369 |
+
- `per_device_eval_batch_size`: 16
|
370 |
+
- `learning_rate`: 2e-05
|
371 |
+
- `num_train_epochs`: 1
|
372 |
+
- `warmup_ratio`: 0.1
|
373 |
+
- `push_to_hub`: True
|
374 |
+
- `hub_model_id`: masa-research/me5-small-preskripsi-embedding-pos-multineg
|
375 |
+
- `batch_sampler`: no_duplicates
|
376 |
+
|
377 |
+
#### All Hyperparameters
|
378 |
+
<details><summary>Click to expand</summary>
|
379 |
+
|
380 |
+
- `overwrite_output_dir`: False
|
381 |
+
- `do_predict`: False
|
382 |
+
- `eval_strategy`: no
|
383 |
+
- `prediction_loss_only`: True
|
384 |
+
- `per_device_train_batch_size`: 16
|
385 |
+
- `per_device_eval_batch_size`: 16
|
386 |
+
- `per_gpu_train_batch_size`: None
|
387 |
+
- `per_gpu_eval_batch_size`: None
|
388 |
+
- `gradient_accumulation_steps`: 1
|
389 |
+
- `eval_accumulation_steps`: None
|
390 |
+
- `torch_empty_cache_steps`: None
|
391 |
+
- `learning_rate`: 2e-05
|
392 |
+
- `weight_decay`: 0.0
|
393 |
+
- `adam_beta1`: 0.9
|
394 |
+
- `adam_beta2`: 0.999
|
395 |
+
- `adam_epsilon`: 1e-08
|
396 |
+
- `max_grad_norm`: 1.0
|
397 |
+
- `num_train_epochs`: 1
|
398 |
+
- `max_steps`: -1
|
399 |
+
- `lr_scheduler_type`: linear
|
400 |
+
- `lr_scheduler_kwargs`: {}
|
401 |
+
- `warmup_ratio`: 0.1
|
402 |
+
- `warmup_steps`: 0
|
403 |
+
- `log_level`: passive
|
404 |
+
- `log_level_replica`: warning
|
405 |
+
- `log_on_each_node`: True
|
406 |
+
- `logging_nan_inf_filter`: True
|
407 |
+
- `save_safetensors`: True
|
408 |
+
- `save_on_each_node`: False
|
409 |
+
- `save_only_model`: False
|
410 |
+
- `restore_callback_states_from_checkpoint`: False
|
411 |
+
- `no_cuda`: False
|
412 |
+
- `use_cpu`: False
|
413 |
+
- `use_mps_device`: False
|
414 |
+
- `seed`: 42
|
415 |
+
- `data_seed`: None
|
416 |
+
- `jit_mode_eval`: False
|
417 |
+
- `use_ipex`: False
|
418 |
+
- `bf16`: False
|
419 |
+
- `fp16`: False
|
420 |
+
- `fp16_opt_level`: O1
|
421 |
+
- `half_precision_backend`: auto
|
422 |
+
- `bf16_full_eval`: False
|
423 |
+
- `fp16_full_eval`: False
|
424 |
+
- `tf32`: None
|
425 |
+
- `local_rank`: 0
|
426 |
+
- `ddp_backend`: None
|
427 |
+
- `tpu_num_cores`: None
|
428 |
+
- `tpu_metrics_debug`: False
|
429 |
+
- `debug`: []
|
430 |
+
- `dataloader_drop_last`: False
|
431 |
+
- `dataloader_num_workers`: 0
|
432 |
+
- `dataloader_prefetch_factor`: None
|
433 |
+
- `past_index`: -1
|
434 |
+
- `disable_tqdm`: False
|
435 |
+
- `remove_unused_columns`: True
|
436 |
+
- `label_names`: None
|
437 |
+
- `load_best_model_at_end`: False
|
438 |
+
- `ignore_data_skip`: False
|
439 |
+
- `fsdp`: []
|
440 |
+
- `fsdp_min_num_params`: 0
|
441 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
442 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
443 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
444 |
+
- `deepspeed`: None
|
445 |
+
- `label_smoothing_factor`: 0.0
|
446 |
+
- `optim`: adamw_torch
|
447 |
+
- `optim_args`: None
|
448 |
+
- `adafactor`: False
|
449 |
+
- `group_by_length`: False
|
450 |
+
- `length_column_name`: length
|
451 |
+
- `ddp_find_unused_parameters`: None
|
452 |
+
- `ddp_bucket_cap_mb`: None
|
453 |
+
- `ddp_broadcast_buffers`: False
|
454 |
+
- `dataloader_pin_memory`: True
|
455 |
+
- `dataloader_persistent_workers`: False
|
456 |
+
- `skip_memory_metrics`: True
|
457 |
+
- `use_legacy_prediction_loop`: False
|
458 |
+
- `push_to_hub`: True
|
459 |
+
- `resume_from_checkpoint`: None
|
460 |
+
- `hub_model_id`: masa-research/me5-small-preskripsi-embedding-pos-multineg
|
461 |
+
- `hub_strategy`: every_save
|
462 |
+
- `hub_private_repo`: None
|
463 |
+
- `hub_always_push`: False
|
464 |
+
- `gradient_checkpointing`: False
|
465 |
+
- `gradient_checkpointing_kwargs`: None
|
466 |
+
- `include_inputs_for_metrics`: False
|
467 |
+
- `include_for_metrics`: []
|
468 |
+
- `eval_do_concat_batches`: True
|
469 |
+
- `fp16_backend`: auto
|
470 |
+
- `push_to_hub_model_id`: None
|
471 |
+
- `push_to_hub_organization`: None
|
472 |
+
- `mp_parameters`:
|
473 |
+
- `auto_find_batch_size`: False
|
474 |
+
- `full_determinism`: False
|
475 |
+
- `torchdynamo`: None
|
476 |
+
- `ray_scope`: last
|
477 |
+
- `ddp_timeout`: 1800
|
478 |
+
- `torch_compile`: False
|
479 |
+
- `torch_compile_backend`: None
|
480 |
+
- `torch_compile_mode`: None
|
481 |
+
- `dispatch_batches`: None
|
482 |
+
- `split_batches`: None
|
483 |
+
- `include_tokens_per_second`: False
|
484 |
+
- `include_num_input_tokens_seen`: False
|
485 |
+
- `neftune_noise_alpha`: None
|
486 |
+
- `optim_target_modules`: None
|
487 |
+
- `batch_eval_metrics`: False
|
488 |
+
- `eval_on_start`: False
|
489 |
+
- `use_liger_kernel`: False
|
490 |
+
- `eval_use_gather_object`: False
|
491 |
+
- `average_tokens_across_devices`: False
|
492 |
+
- `prompts`: None
|
493 |
+
- `batch_sampler`: no_duplicates
|
494 |
+
- `multi_dataset_batch_sampler`: proportional
|
495 |
+
|
496 |
+
</details>
|
497 |
+
|
498 |
+
### Training Logs
|
499 |
+
| Epoch | Step | Training Loss |
|
500 |
+
|:------:|:----:|:-------------:|
|
501 |
+
| 0.1041 | 300 | 1.5302 |
|
502 |
+
| 0.2083 | 600 | 0.8311 |
|
503 |
+
| 0.3124 | 900 | 0.7495 |
|
504 |
+
| 0.4165 | 1200 | 1.1801 |
|
505 |
+
| 0.5207 | 1500 | 0.9683 |
|
506 |
+
| 0.6248 | 1800 | 0.8723 |
|
507 |
+
| 0.7289 | 2100 | 0.9991 |
|
508 |
+
| 0.8330 | 2400 | 0.4833 |
|
509 |
+
| 0.9372 | 2700 | 0.4694 |
|
510 |
+
|
511 |
+
|
512 |
+
### Framework Versions
|
513 |
+
- Python: 3.11.11
|
514 |
+
- Sentence Transformers: 3.3.1
|
515 |
+
- Transformers: 4.47.1
|
516 |
+
- PyTorch: 2.5.1+cu124
|
517 |
+
- Accelerate: 1.2.1
|
518 |
+
- Datasets: 3.2.0
|
519 |
+
- Tokenizers: 0.21.0
|
520 |
+
|
521 |
+
## Citation
|
522 |
+
|
523 |
+
### BibTeX
|
524 |
+
|
525 |
+
#### Sentence Transformers
|
526 |
+
```bibtex
|
527 |
+
@inproceedings{reimers-2019-sentence-bert,
|
528 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
529 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
530 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
531 |
+
month = "11",
|
532 |
+
year = "2019",
|
533 |
+
publisher = "Association for Computational Linguistics",
|
534 |
+
url = "https://arxiv.org/abs/1908.10084",
|
535 |
+
}
|
536 |
+
```
|
537 |
+
|
538 |
+
#### MultipleNegativesRankingLoss
|
539 |
+
```bibtex
|
540 |
+
@misc{henderson2017efficient,
|
541 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
542 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
543 |
+
year={2017},
|
544 |
+
eprint={1705.00652},
|
545 |
+
archivePrefix={arXiv},
|
546 |
+
primaryClass={cs.CL}
|
547 |
+
}
|
548 |
+
```
|
549 |
+
|
550 |
+
<!--
|
551 |
+
## Glossary
|
552 |
+
|
553 |
+
*Clearly define terms in order to be accessible across audiences.*
|
554 |
+
-->
|
555 |
+
|
556 |
+
<!--
|
557 |
+
## Model Card Authors
|
558 |
+
|
559 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
560 |
+
-->
|
561 |
+
|
562 |
+
<!--
|
563 |
+
## Model Card Contact
|
564 |
+
|
565 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
566 |
+
-->
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.3.1",
|
4 |
+
"transformers": "4.47.1",
|
5 |
+
"pytorch": "2.5.1+cu124"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": "cosine"
|
10 |
+
}
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 512,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|