Commits · Xenova/sponsorblock-ml

Initialize logging in each script

c4f250e

Joshua Lochner commited on Feb 19, 2022

Do not allow predictions to miss start of video

aa018be

Joshua Lochner commited on Feb 19, 2022

Fix `--no_cuda` argument for preprocessing

87b2dec

Joshua Lochner commited on Feb 17, 2022

Revert model input size back to 512 tokens

721bf64

Joshua Lochner commited on Feb 17, 2022

Fix conflicting `--no_cuda` argument

09cabec

Joshua Lochner commited on Feb 17, 2022

Use correct logger per script

e3d3d3f

Joshua Lochner commited on Feb 17, 2022

Update preprocessing script to use logging module

cfbd4d5

Joshua Lochner commited on Feb 16, 2022

Add `no_cuda` argument to not use GPU

de9c8c4

Joshua Lochner commited on Feb 16, 2022

Update README to include installation instructions

776c8b2

Joshua Lochner commited on Feb 14, 2022

Fix button colour on dark theme

921fb1d

Joshua Lochner commited on Feb 13, 2022

Remove redundant calls to change device

8981122

Joshua Lochner commited on Feb 13, 2022

Add `output_as_json` argument for inference

52340fc

Joshua Lochner commited on Feb 12, 2022

Adjust tokenizer input size based on model input size

9604abd

Joshua Lochner commited on Feb 8, 2022

Fix typo in prediction command

39f6f81

Joshua Lochner commited on Feb 7, 2022

Add transcript option to streamlit app and visual improvements

8a55e13

Joshua Lochner commited on Feb 7, 2022

Show message if predictions returned, but all ignored due to filters/settings

8326048

Joshua Lochner commited on Feb 7, 2022

Update README.md

bfb080b

Joshua Lochner commited on Feb 7, 2022

Remove unused utilities

0e18e8c

Joshua Lochner commited on Feb 7, 2022

Move `load_datasets` to train script

086ca93

Joshua Lochner commited on Feb 7, 2022

Improve how transcripts are stored and how manual transcripts are segmented

583f4cf

Joshua Lochner commited on Feb 7, 2022

Add boilerplate code to detect whether segment was split due to length

df35612

Joshua Lochner commited on Feb 7, 2022

Revert evaluation script to use `processed_file` by default

8fc746d

Joshua Lochner commited on Feb 5, 2022

Fix segmentation using binary search

de9c264

Joshua Lochner commited on Feb 5, 2022

Add fallback for old transcript version

c445f1a

Joshua Lochner commited on Feb 4, 2022

Fix `num_tokens` key in words

83dc695

Joshua Lochner commited on Feb 3, 2022