aken12/splade-japanese-v3 · JQaRA の評価方法

hotchpotch

Jul 24, 2024

•

edited Jul 24, 2024

初めまして。JQaRA を作った @hotchpotch という物です。日本語　Splade モデルの公開、ありがとうございます。

今、Spladeモデルの評価をしておりまして、記載されている JQaRA のスコアの評価方法を、教えていただくことは可能でしょうか？

https://github.com/hotchpotch/JQaRA/blob/main/evaluator/reranker/splade_reranker.py

このコードでは、出力logitsに splade max pooling を適用した物を、dot productで類似スコア付けして評価しております。

結果は以下となり、記載されているスコアと差がありまして。私の評価方法が間違っている可能性も高そうでして、可能でしたら評価方法をご教示いただけますと幸いです。

$ python main.py --no_cache  -m aken12/splade-japanese-v3 aken12/splade-japanese-efficient
#    Model                      NDCG@10    MRR@10    NDCG@100    MRR@100
---  -------------------------  ---------  --------  ----------  ---------
a    splade-japanese-v3         0.476ᵇ     0.713ᵇ    0.678ᵇ      0.717ᵇ
b    splade-japanese-efficient  0.392      0.608     0.623       0.615

よろしくお願いいたします。

hotchpotch

Jul 24, 2024

こちら、query, docs の token length の記載を見落としておりました。token length を指定したところ、ほぼ同等のスコアとなりました。お騒がせしました。

$  python main.py --no_cache  -m aken12/splade-japanese-v3 -- --query_max_length 32 --document_max_length 180
#    Model                 NDCG@10    MRR@10    NDCG@100    MRR@100
---  ------------------  ---------  --------  ----------  ---------
a    splade-japanese-v3      0.504      0.77       0.699      0.774

aken12

Owner Jul 29, 2024

確認が遅くなってしまって申し訳ありません．
はじめまして，こちらこそJQaRA やRerankerの公開ありがとうございます．
解決できたようなのでよかったです．

hotchpotch changed discussion status to closed Jul 29, 2024