nhanv
commited on
Commit
•
943c8c2
1
Parent(s):
83dbc58
update README
Browse files
README.md
CHANGED
@@ -1,6 +1,11 @@
|
|
1 |
---
|
|
|
|
|
|
|
2 |
tags:
|
3 |
-
-
|
|
|
|
|
4 |
model-index:
|
5 |
- name: ner-vietnamese-electra-base
|
6 |
results: []
|
@@ -11,12 +16,51 @@ should probably proofread and complete it, then remove this comment. -->
|
|
11 |
|
12 |
# cv-ner
|
13 |
|
14 |
-
This model is a fine-tuned version of
|
15 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
## Model description
|
17 |
|
18 |
More information needed
|
19 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
## Intended uses & limitations
|
21 |
|
22 |
More information needed
|
|
|
1 |
---
|
2 |
+
|
3 |
+
widget:
|
4 |
+
- text: "Liên quan vụ việc CSGT bị tố đánh dân, trúng một cháu nhỏ đang ngủ, đang lan truyền trên mạng xã hội, Đại tá Nguyễn Văn Tảo, Phó Giám đốc Công an tỉnh Tiền Giang vừa có cuộc họp cùng Chỉ huy Công an huyện Châu Thành và một số đơn vị nghiệp vụ cấp tỉnh để chỉ đạo làm rõ thông tin."
|
5 |
tags:
|
6 |
+
- named-entity-recognition
|
7 |
+
language:
|
8 |
+
- vi
|
9 |
model-index:
|
10 |
- name: ner-vietnamese-electra-base
|
11 |
results: []
|
|
|
16 |
|
17 |
# cv-ner
|
18 |
|
19 |
+
This model is a fine-tuned version of NlpHUST/electra-base-vn on an VLSP 2018 dataset.
|
20 |
+
It achieves the following results on the evaluation set:
|
21 |
+
- Loss: 0.0580
|
22 |
+
- Location Precision: 0.9353
|
23 |
+
- Location Recall: 0.9377
|
24 |
+
- Location F1: 0.9365
|
25 |
+
- Location Number: 2360
|
26 |
+
- Miscellaneous Precision: 0.5660
|
27 |
+
- Miscellaneous Recall: 0.6897
|
28 |
+
- Miscellaneous F1: 0.6218
|
29 |
+
- Miscellaneous Number: 174
|
30 |
+
- Organization Precision: 0.8610
|
31 |
+
- Organization Recall: 0.9068
|
32 |
+
- Organization F1: 0.8833
|
33 |
+
- Organization Number: 1878
|
34 |
+
- Person Precision: 0.9692
|
35 |
+
- Person Recall: 0.9637
|
36 |
+
- Person F1: 0.9664
|
37 |
+
- Person Number: 2121
|
38 |
+
- Overall Precision: 0.9122
|
39 |
+
- Overall Recall: 0.9307
|
40 |
+
- Overall F1: 0.9214
|
41 |
+
- Overall Accuracy: 0.9907
|
42 |
## Model description
|
43 |
|
44 |
More information needed
|
45 |
|
46 |
+
#### How to use
|
47 |
+
|
48 |
+
You can use this model with Transformers *pipeline* for NER.
|
49 |
+
|
50 |
+
```python
|
51 |
+
from transformers import AutoTokenizer, AutoModelForTokenClassification
|
52 |
+
from transformers import pipeline
|
53 |
+
|
54 |
+
tokenizer = AutoTokenizer.from_pretrained("NlpHUST/ner-vietnamese-electra-base")
|
55 |
+
model = AutoModelForTokenClassification.from_pretrained("NlpHUST/ner-vietnamese-electra-base")
|
56 |
+
|
57 |
+
nlp = pipeline("ner", model=model, tokenizer=tokenizer)
|
58 |
+
example = "Liên quan vụ việc CSGT bị tố đánh dân, trúng một cháu nhỏ đang ngủ, đang lan truyền trên mạng xã hội, Đại tá Nguyễn Văn Tảo, Phó Giám đốc Công an tỉnh Tiền Giang vừa có cuộc họp cùng Chỉ huy Công an huyện Châu Thành và một số đơn vị nghiệp vụ cấp tỉnh để chỉ đạo làm rõ thông tin."
|
59 |
+
|
60 |
+
ner_results = nlp(example)
|
61 |
+
print(ner_results)
|
62 |
+
```
|
63 |
+
|
64 |
## Intended uses & limitations
|
65 |
|
66 |
More information needed
|