File size: 1,334 Bytes
377d5c9 6908aaa 377d5c9 6908aaa 031b537 da4fbbf 031b537 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 |
---
license: cc-by-3.0
datasets:
- espnet/yodas
language:
- ja
---
# 概要
[espnet/yodas](https://huggingface.co/datasets/espnet/yodas)のja000を[WADA SNR](http://www.cs.cmu.edu/~robust/Papers/KimSternIS08.pdf)を用いて、音声の分析およびSNR値が100以上の音声ファイルのみをまとめたもの
# 分析結果
分析結果の詳細はaudio_analysis_results.jsonをご確認ください
以下はjsonの内容をヒストグラムにしたものです
![](audio_quality_histogram.png)
以下は分析結果のjsonの構成です
```json
[
{
"ファイル名": "3IZFPbj6Z5c-00116-00045672-00046034",
"SNR値": 11.850106999992533,
"トランスクリプション": "それと僕が材料をお伝えした時にバニラエッセンスを入れたじゃないですか"
},
{
"ファイル名": "3fr1NoJcLzE-00084-00039552-00039962",
"SNR値": 6.813705012877472,
"トランスクリプション": "1弦の5フレット、2弦の5フレット、 3弦の5フレット、2弦の7フレット、"
},
...
]
```
# 備考
こちらのデータ分析は「ローカルLLMに向き合う会」が主催する[LOCAL AI HACKATHON](https://prtimes.jp/main/html/rd/p/000000007.000056944.html)にてリソースをお借りして処理を行いました |