OCR-приложения со встроенными функциями перевода, и что это вообще такое
Знакома ли вам ситуация, когда интересная вам игра не имеет перевода на комфортный для прохождения язык? Скорее всего, нет. Ведь вы достаточно умны и способны, чтобы успевать везде и знать всё, но у всех нас точно есть друг с подобной проблемой. У вас ведь есть друг?
К сожалению, далеко не каждый обладает достаточными знаниями языка для комфортной игры, не отвлекаясь постоянно на переводчик. А это означает, что рано или поздно в поисках лёгкого решения пользователь отправится на просторы интернета, чтобы найти программу, которая способна считать текст с экрана и самостоятельно выполнить перевод, но в конечном итоге найдёт лишь что-то платное или неудобное для игрового процесса, — не дело. «Да легче взять телефон и переводить через «Переводчик» от гугла» — не то что бы сильно ошибаясь утвердит юзер и забьёт в надежде, что когда-то настанет момент релиза перевода интересующей его игры. Но, очевидно, не всё сбывается как мы хотим, не все игры в конечном итоге переводятся.
Я не мог пройти мимо такой несправедливости в интернете, потому в этой статье поделюсь моим опытом использования некоторых программ, способных считать и перевести текст с экрана, но выводы делать только вам, конечно.
Что есть OCR?
Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере.
Понимайте эту технологию как более умный сканер. Например, если обычный сканер просто считывает изображение с листа, то OCR считает не изображение, а сразу текст на нём.
И что дальше?
Если изначально OCR был нужен для удобного переноса книг и документов в электронный вид, то сейчас находят дополнительные возможности использования этой функции. Непонятная фраза на английском в игре? Теперь не надо переписывать всё предложение в переводчик, а лишь включаешь OCR, вставляешь отсканированное и готово. Удобно, да?
Уж не знаю как думали авторы нижеприведённых программ на самом деле, но, думаю, примерно так: «Удобная штука, конечно, эти ваши программы с OCR, но если таких фраз слишком много, то процесс быстро утомляет… Намного удобней было бы совместить сканирование и перевод, чтобы не бегать от игры к переводчику и обратно».
Программы
1. Screen Translator
Наверное, самая первая и известная из программ, появившихся на данном поприще. Справедливо стоит на первом месте. Первом по количеству времени обработки текста, но со временем совершенствуется.
Писать о плюсах и минусах я не собираюсь, просто перечислю то, на что можно обратить внимание:
- Самая долгая обработка текста в сравнении с другими программами.
- Обширный набор переводчиков.
- В программе легко разобраться, но подкинуть сюрпризов она вам всё же сможет. Например, попробуйте с ходу дойти до того, что если, выделив зону перевода, вы, не отпуская ЛКМ, нажмёте ПКМ, то откроется небольшое меню с весьма удобной функцией «Сохранить зону захвата».
- Возможность сохранять область перевода.
- Можно опционально настроить отображение перевода, отсортировать «мусорный» текст, подключить прокси.
- Всячески поиграть с настройками контрастов нельзя. Если текст особо не контрастирует с фоном, то ничего не поменять.
Подытоживая, хочу сказать, что Screen Translator мало подходит для частого использования из-за его скорости и отсутствия настроек контрастов, зачастую приводящих к сомнительным результатам обработки, но вполне может выручить при необходимости перевода некоторых элементов интерфейса игры, текстов с картинок и прочего.
2. Maverik OCR Helper
«Если нет того, что нужно — сделай это сам», — видимо, именно так подумал наш соотечественник, не имевший возможности спокойно поиграть в интересующую его игру на русском языке, и потому в 2016 году миру является Maverik OCR Helper. На широкий круг юзеров программа не рассчитана изначально, автор лишь делится тем, что сделал для самого себя.
- Довольно быстрая скорость обработки текста.
- Программа может переводить с японского и английского на русский и только через гугл.
- Помимо свободного выделения, можно выделить и сохранить до десяти зон. Для каждой зоны можно настроить параметры, чтобы определение букв было более лёгким: яркость, контрастность, насыщенность, увеличение, ну и не забываем про самую полезную кнопку — «Очистить фон».
- Вышеупомянутые настройки сохраняются под каждую программу.
- Maverik нужно привязывать к целевой программе для перевода. Закрываете программу — закрываете Maverik.
- Можно подключить прокси.
3. Visual Novel Reader
Несмотря на то, что главная задача программы заключается в переводе визуальных романов посредством перехвата кода, в неё на всякий случай встроен и OCR, который можно использовать, если по разным причинам возможности для хука нету. Но так как пользователь волен использовать эту функцию в любой программе, обходить VNR мы не будем.
- Самая быстрая скорость обработки текста.
- Возможность избавить себя от лишних нажатий за счёт наличия таймера автообновления выделенных зон.
- Огромное количество настроек.
- Обширное количество переводчиков и языков для перевода, но почти всё это многообразие не работает на сегодняшний день.
- Возможность на месте узнать транскрипцию японских иероглифов. Но кому это важно?
- Программа не обновлялась уже больше пары лет, что как бы предвещает.
- Часто зависает, умудряется конфликтовать с некоторыми программами. Глюк на глюке и глюком погоняет. Удивительно, что работает.
- Настройка контрастов и прочего в наличии.
- Вышеупомянутые настройки не сохраняются. Страдайте.
Увы, без обновлений VNR медленно умирает. Почти все из массы доступных переводчиков уже перестали нормально работать: до недавнего времени переводить можно было лишь через костыль, но под конец года один хороший человек починил перевод гугла, — вечеринка продолжается.
Костыли и заговор злых корпораций
Крупные компании, прознав, что их переводчиками через парсер пользуются — о, боги! — бесплатно сторонние программы, решили просто подрубить за подозрительную активность капчу. Именно поэтому на сегодняшний день остаётся либо делать костыли, либо юзать менее известные переводчики, но, а самым отчаянные меняют прокси по несколько раз в час. И именно потому сильнее всего это бьёт по юзерам VNR, обновляют который теперь лишь обычные энтузиасты.
Тесты
Ну и тесты, конечно, чтобы не быть пустословом. На объективность не претендую.
Теперь сухие цифры:
Примерно столько времени нужно программам на каждые ~94 символа без пробелов. А ещё из статистики можно сделать сенсационный вывод, что японский будет покороче английского.
Как видно, у каждой программы на обработку уходит разное время. Что использует для распознавания лидер, VNR, я затрудняюсь сказать, другие же две программы используют Tesseract, причём у Maverik это получается в разы лучше.
Подводим итоги
В этой статье мы все дружно освежили в памяти знания об OCR (не этом), как эта функция может помочь простому пользователю, а также рассмотрели некоторые программы и результаты их тестов.
Мне очень приятно, если вы дочитали до этого момента и подчерпнули для себя что-то новое и полезное. Дня вам.