Update app.py
Browse files
app.py
CHANGED
@@ -5,6 +5,12 @@ import random
|
|
5 |
import pandas as pd
|
6 |
from huggingface_hub import login
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
def remove_space(example):
|
9 |
'''
|
10 |
移除資料集當中「犯罪事實」欄 (Corpus-Delicti) 當中作為斷詞字元的空白字元,以及每句開頭的「ㄧ、」。
|
@@ -114,9 +120,4 @@ with gr.Blocks() as demo:
|
|
114 |
# btn3.click(download_file, inputs=[result, title], outputs=[])
|
115 |
|
116 |
if __name__ == "__main__":
|
117 |
-
# 下載判決書資料集
|
118 |
-
login(token = os.environ['HUB_TOKEN'])
|
119 |
-
use_auth_token=os.environ['HUB_TOKEN'] # 下載判決書資料集所需要的 token。
|
120 |
-
dataset = load_dataset("jslin09/Fraud_Case_Verdicts", use_auth_token=use_auth_token, revision="main")
|
121 |
-
dataset = dataset.map(remove_space)
|
122 |
demo.launch(share=True) # 在遠端啟動時,需要 share=True 。
|
|
|
5 |
import pandas as pd
|
6 |
from huggingface_hub import login
|
7 |
|
8 |
+
# 下載判決書資料集
|
9 |
+
login(token = os.environ['HUB_TOKEN'])
|
10 |
+
use_auth_token=os.environ['HUB_TOKEN'] # 下載判決書資料集所需要的 token。
|
11 |
+
dataset = load_dataset("jslin09/Fraud_Case_Verdicts", use_auth_token=use_auth_token, revision="main")
|
12 |
+
dataset = dataset.map(remove_space)
|
13 |
+
|
14 |
def remove_space(example):
|
15 |
'''
|
16 |
移除資料集當中「犯罪事實」欄 (Corpus-Delicti) 當中作為斷詞字元的空白字元,以及每句開頭的「ㄧ、」。
|
|
|
120 |
# btn3.click(download_file, inputs=[result, title], outputs=[])
|
121 |
|
122 |
if __name__ == "__main__":
|
|
|
|
|
|
|
|
|
|
|
123 |
demo.launch(share=True) # 在遠端啟動時,需要 share=True 。
|