m3hrdadfi
/

wav2vec2-large-xlsr-persian-v3

Automatic Speech Recognition

xlsr-fine-tuning-week

Inference Endpoints

Model card Files Files and versions Community

mishig HF staff commited on Nov 4, 2021

Commit

f3ceecb

•

1 Parent(s): e6e49a7

Upload README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -8,11 +8,11 @@ tags:
 - speech
 - xlsr-fine-tuning-week
 widget:
-- label: Common Voice sample 1
   src: https://huggingface.co/m3hrdadfi/wav2vec2-large-xlsr-persian-v3/resolve/main/sample1.flac
-- label: Common Voice sample 2978
   src: https://huggingface.co/m3hrdadfi/wav2vec2-large-xlsr-persian-v3/resolve/main/sample2978.flac
-- label: Common Voice sample 5168
   src: https://huggingface.co/m3hrdadfi/wav2vec2-large-xlsr-persian-v3/resolve/main/sample5168.flac
 model-index:
 - name: XLSR Wav2Vec2 Persian (Farsi) V3 by Mehrdad Farahani
@@ -76,7 +76,7 @@ def cleaning(text):
 data_dir = "/content/cv-corpus-6.1-2020-12-11/fa"
-test = pd.read_csv(f"{data_dir}/test.tsv", sep="\t")
 test["path"] = data_dir + "/clips/" + test["path"]
 print(f"Step 0: {len(test)}")
@@ -93,7 +93,7 @@ test = test.reset_index(drop=True)
 print(test.head())
 test = test[["path", "sentence"]]
-test.to_csv("/content/test.csv", sep="\t", encoding="utf-8", index=False)
 ```
 **Prediction**
@@ -146,7 +146,7 @@ def predict(batch):
     return batch
-dataset = load_dataset("csv", data_files={"test": "/content/test.csv"}, delimiter="\t")["test"]
 dataset = dataset.map(speech_file_to_array_fn)
 result = dataset.map(predict, batched=True, batch_size=4)
 ```

 - speech
 - xlsr-fine-tuning-week
 widget:
+- example_title: Common Voice sample 1
   src: https://huggingface.co/m3hrdadfi/wav2vec2-large-xlsr-persian-v3/resolve/main/sample1.flac
+- example_title: Common Voice sample 2978
   src: https://huggingface.co/m3hrdadfi/wav2vec2-large-xlsr-persian-v3/resolve/main/sample2978.flac
+- example_title: Common Voice sample 5168
   src: https://huggingface.co/m3hrdadfi/wav2vec2-large-xlsr-persian-v3/resolve/main/sample5168.flac
 model-index:
 - name: XLSR Wav2Vec2 Persian (Farsi) V3 by Mehrdad Farahani
 data_dir = "/content/cv-corpus-6.1-2020-12-11/fa"
+test = pd.read_csv(f"{data_dir}/test.tsv", sep="	")
 test["path"] = data_dir + "/clips/" + test["path"]
 print(f"Step 0: {len(test)}")
 print(test.head())
 test = test[["path", "sentence"]]
+test.to_csv("/content/test.csv", sep="	", encoding="utf-8", index=False)
 ```
 **Prediction**
     return batch
+dataset = load_dataset("csv", data_files={"test": "/content/test.csv"}, delimiter="	")["test"]
 dataset = dataset.map(speech_file_to_array_fn)
 result = dataset.map(predict, batched=True, batch_size=4)
 ```