File size: 1,334 Bytes
377d5c9
 
6908aaa
 
 
 
377d5c9
6908aaa
 
 
 
 
 
 
 
 
 
031b537
 
da4fbbf
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
031b537
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
---
license: cc-by-3.0
datasets:
- espnet/yodas
language:
- ja
---

# 概要
[espnet/yodas](https://huggingface.co/datasets/espnet/yodas)のja000を[WADA SNR](http://www.cs.cmu.edu/~robust/Papers/KimSternIS08.pdf)を用いて、音声の分析およびSNR値が100以上の音声ファイルのみをまとめたもの

# 分析結果

分析結果の詳細はaudio_analysis_results.jsonをご確認ください

以下はjsonの内容をヒストグラムにしたものです

![](audio_quality_histogram.png)

以下は分析結果のjsonの構成です

```json
[
    {
        "ファイル名": "3IZFPbj6Z5c-00116-00045672-00046034",
        "SNR値": 11.850106999992533,
        "トランスクリプション": "それと僕が材料をお伝えした時にバニラエッセンスを入れたじゃないですか"
    },
    {
        "ファイル名": "3fr1NoJcLzE-00084-00039552-00039962",
        "SNR値": 6.813705012877472,
        "トランスクリプション": "1弦の5フレット、2弦の5フレット、 3弦の5フレット、2弦の7フレット、"
    },
    ...
]
```

# 備考
こちらのデータ分析は「ローカルLLMに向き合う会」が主催する[LOCAL AI HACKATHON](https://prtimes.jp/main/html/rd/p/000000007.000056944.html)にてリソースをお借りして処理を行いました