--- title: README emoji: 🏆 colorFrom: gray colorTo: purple sdk: static pinned: false --- ✨ Service collection, markup and analysis of data for machine learning\ ❤️ We provide free services for collecting and marking text datasets in the service Scoutie: 🔗https://scoutie.ru \ 🎁 Give all users a free collection time that can be used to create 3 datasets on any topic \ ⭐️ Possibilities of the service: 1. Automatic collection of texts from Telegram channels (for more than 350 thousand different channels grouped by topics). ✅ 2. Automatic word markup by various means such as: Identifying emotional color, identifying named entities, vectorization (Embedding), filtering of advertising and spam, text clustering to speed up manual markup. ✅ 3. Smart filtering tools that will allow you to get the necessary sample of data. ✅ 4. Download data in any convenient format: CSV, JSON including the entire dataset or only its filtered representation. ✅ ✨ Сервис сбора, разметки и анализа данных для машинного обучения \ ❤️ Предоставляем услуги по сбору и разметки текстовых датасетов в сервисе Скаути: https://scoutie.ru \ 🎁 Дарим всем пользователям бесплатное время сбора, которые можно использовать для создания 3 датасетов на любую тему \ ⭐️ Возможности сервиса: 1. Автоматический сбор текстов из Telegram каналов (Более 350 тысяч различных каналов сгруппированных по темам). ✅ 2. Автоматическая разметка текстов различными средствами такими как: Выявление эмоционального окраса, выявление именованных сущностей, векторизация (Embedding), фильтрация рекламы и спама, кластеризация текстов для ускорения ручной разметки. ✅ 3. Умные средства фильтрации, которые позволят получить необходимую выборку данных. ✅ 4. Скачивание данных в любом удобном формате: CSV, JSON включая весь датасет или только его отфильтрованное представление. ✅