Блин, тоже подобную програму написал, думал пост запилить когда до ума доведу, только использовал paddle-paddle ocr, он мне показался наиболее точным и быстрым, на 3060 мобильной за 0.1 секунду примерно распознает текст если область небольшая.
Я кстати сделал чтобы текст поверх оригинала накладывался, по моему так удобнее, да и позволяет одновременно текст на всем экране переводить
по paddle ocr были планы, хотел посчитать метрики на своей выборке. то что видел в инете - везде противоречивые тесты (в сравнении с easy ocr). но paddle точно должен лучше на китайском работать чтобы текст поверх оригинала накладывался, по моему так удобнее, да и позволяет одновременно текст на всем экране переводитьв некоторых вариантах, да, удобнее. тож планировал как дополнительным режимом "субтитров" запилить. Как щас Mort по сути умеет работать. А на чем пишешь?
Плюсую за предложение попробовать paddle ocr, его реализация на питоне мне понравилась больше всех остальных распознавалок. У него и на C# порт есть - https://github.com/sdcb/PaddleSharp
Я кстати сделал чтобы текст поверх оригинала накладывался, по моему так удобнееНе всегда, иногда переводит не совсем точно и удобно видеть оригинал для сравнения.
Блин, тоже подобную програму написал, думал пост запилить когда до ума доведу, только использовал paddle-paddle ocr, он мне показался наиболее точным и быстрым, на 3060 мобильной за 0.1 секунду примерно распознает текст если область небольшая.
Я кстати сделал чтобы текст поверх оригинала накладывался, по моему так удобнее, да и позволяет одновременно текст на всем экране переводить
по paddle ocr были планы, хотел посчитать метрики на своей выборке. то что видел в инете - везде противоречивые тесты (в сравнении с easy ocr). но paddle точно должен лучше на китайском работать
чтобы текст поверх оригинала накладывался, по моему так удобнее, да и позволяет одновременно текст на всем экране переводитьв некоторых вариантах, да, удобнее. тож планировал как дополнительным режимом "субтитров" запилить. Как щас Mort по сути умеет работать.
А на чем пишешь?
Плюсую за предложение попробовать paddle ocr, его реализация на питоне мне понравилась больше всех остальных распознавалок. У него и на C# порт есть - https://github.com/sdcb/PaddleSharp
А так рекомендуют еще https://github.com/open-mmlab/mmocr с моделью https://github.com/open-mmlab/mmocr/blob/main/configs/textrecog/abinet/README.md, но там у готовых моделей только английский вроде; у каких-то моделей еще китайский есть.
Я кстати сделал чтобы текст поверх оригинала накладывался, по моему так удобнееНе всегда, иногда переводит не совсем точно и удобно видеть оригинал для сравнения.