Субтитры к сериалам и как с ними работать
Всем привет. Не так давно я загорелся желанием активно изучать английский язык. Хочется, чтобы кроме заучивания грамматики и запоминания слов я мог понимать английскую речь на слух. При чтении текстов на английском языке проблем особых нет, даже если есть незнакомые слова общую суть я уловить способен, а вот с английской речью все куда хуже.
Проблему эту можно решать разными способами. Что касается меня, то я выбрал один из самых эффективных способов: просмотр сериалов в оригинале. Кто-то может задать вопрос: "И в чем же проблема? Есть же русские субтитры?". И как мне кажется, просмотр сериала с сабами не лучший способ привыкнуть к английской речи и запоминать новые слова. Я не хочу пропускать всю речь мимо ушей и заострять все внимание лишь на субтитры...
А как можно смотреть фильм или сериал на иностранном языке с не очень большим словарным запасом и особо не отвлекаться на субтитры, но при этом понимать иностранную речь?
Оказывается можно. Не так давно я наткнулся на программу LinguaSubtitle.
Почитав подробнее про это приложение, я понял что мне нравится предложенный подход автора. "Неплохая идея, показывать только незнакомые слова и их перевод, а известные слова не показывать в субтитрах" - подумал я.
Работать с приложением просто. Сначала скачиваешь субтитры, открываешь их через данную программу и отмечаешь известные слова, а неизвестные переводишь и пишешь перевод в соответствующем столбце. И после работы с субтитрами ты их экспортируешь.
При просмотре видео с новыми субтитрами слова, значения которых уже известны не будут показываться, а будут только незнакомые слова и их перевод. Т.е. отвлекаться на субтитры при просмотре будем в разы меньше (если слов незнакомых много, то это уже проблема, об этом ниже).
Думаю, сама идея неплохая, но в ходе работы с данной программой я столкнулся с рядом проблем:
1) Если в одной серии продолжительностью 1 час будет 3500 слов, а уникальных 700 (к примеру), среди которых 300 неизвестных, то приходится очень много времени тратить на перевод (даже с учётом google translate и ctr-c/ctr-v). Конечно с каждым новым файлом субтитров база данных будет пополняться и незнакомых слов будет все меньше и меньше, но все равно уходит много времени на монотонный процесс поиска и записи перевода
2) Либо у меня кривые руки, либо я так и не понял до конца как сохранить перевод слов в БД. Потому что при работе с одним файлом все сохранилось, а сегодня при работе с другими сабами все потерлось после закрытия программы, жаль потраченных 2х часов на перевод.
upd. я разобрался как сохранить перевод новых слов. для этого надо экспортировать субтитры, т.е. кнопки сохранить в бд нет
3) Программа давно не обновлялась (с 2014г.) и вряд ли когда-то обновится. А так хотелось бы добавить разные новые функции и свежий дизайн.
4) Самая важная проблема, как я уже написал выше, если незнакомых слов много, то смотреть не очень удобно, приходится часто отвлекаться на перевод неизвестных слов (как утверждает автор, если незнакомых слов >10%, то становится некомфортно).
У меня появилась идея как можно усовершенствовать данный подход и решить по крайней мере последнюю проблему. Например, можно сделать так, чтобы достаточно было отметить все незнакомые слова и экспортировать в отдельный txt/csv файл, который можно импортировать в приложение на смартфоне для запоминания слов (например, reWord). И там заучивать эти слова по карточкам (скажем 100-200 слов в течение всей недели), а в выходной день уже зная все слова наизусть сесть и посмотреть серию на английском языке и без субтитров. Хотя в данном случае перевод придется все равно набирать вручную, проблема 1 все еще остается.
Итак, вопросы, которые я хотел бы задать:
1) Можно ли написать бота или программу, которая сможет автоматизировать процесс перевода и записи значения слова?
2) Я правильно понимаю, что исходники данной программы лежат в открытом доступе и при желании и должном знании Java её можно самому модифицировать?
3) Знаете ли вы какие-то аналоги, похожие по функционалу?
4) Что нужно для написания аналогичной программы? Какие ЯП необходимо знать? p.s. немного знаю c, c++ и python.
Хочу написать свой вариант похожей программы, в первую очередь, чтобы автоматизировать процесс перевода незнакомых слов и для возможности экспортировать незнакомые слова в отдельный файл. Т.е. чтобы в БД программы была инфа лишь о том, является ли данное слово знакомым или нет. А сами слова учить уже в другом приложении.