Предыдущая тема
::
Следующая тема
|
Автор |
Сообщение |
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Ср Окт 24, 2012 19:55 pm Заголовок сообщения: Как преобразовать субтитры из формата SUB/IDX в SRT |
|
|
Я просто оставлю это здесь ©
Делюсь опытом, если вдруг кому понадобится...
Дано: есть DVD-рип с азиатским фильмом или аниме. Английские субтитры внешние, но растровые, в двух файлах *.SUB и *.IDX.
Вариант: есть DVD ISO, содержащий английские титры.
Требуется: распознать титры и получить нормальный файл *.SRT для последующего использования при переводе.
Неправильные решения: VideoSubFinder, SubRip, DVDSubEdit, Subresync
Правильное решение: использование специальной фичи редактора субтитров Subtitle Edit.
Редактор качать здесь: http://www.nikse.dk/
С Аегисабом он, разумеется, рядом не стоял, но у него есть одна очень приятная фича: распознавание растровых титров различных форматов. OCR работает вполне прилично. Разумеется, ручной контроль после распознавания никто не отменял.
Скриншот:
Последний раз редактировалось: Сб Окт 27, 2012 23:48 pm |
|
|
|
К началу |
|
Shur Гость
|
Добавлено: Сб Окт 27, 2012 20:55 pm |
|
|
Самое правильное решение: Subrip+FineReader  |
|
|
|
К началу |
|
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Сб Окт 27, 2012 21:35 pm |
|
|
Ответ неверный.
Subrip — очень старая программа, которая часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. Проверено на большом количестве наборов SUB/IDX и ISO-образов японских фильмов с английскими титрами.
К тому же, не совсем понятен механизм взаимодействия с FineReader. Во-первых, он является коммерческой программой. Его нужно либо купить, либо хакнуть (второе может не приветствоваться некоторыми участниками community). Во-вторых, он не делает на выходе SRT. В общем, костыли предлагать не надо. |
|
|
|
К началу |
|
Karsh
Переводы

Зарегистрирован: 17.03.2012 Сообщения: 325 Откуда: Ленинград
|
Добавлено: Сб Окт 27, 2012 22:33 pm |
|
|
Самый правильный ответ — SubResync. Лучше проги для этого дела пока не встречал. |
|
|
|
К началу |
|
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Сб Окт 27, 2012 23:29 pm |
|
|
Karsh: | Самый правильный ответ — SubResync. Лучше проги для этого дела пока не встречал. |
Очередной неверный ответ. У Subresync отсутствует автоматическое распознавание, придется каждый символ подтверждать: |
|
|
|
К началу |
|
Karsh
Переводы

Зарегистрирован: 17.03.2012 Сообщения: 325 Откуда: Ленинград
|
Добавлено: Сб Окт 27, 2012 23:56 pm |
|
|
Pelikan
Subresync умеет сохранять в асс и без распознавания. Пара кликов, грузим аеги — и переводим. Дело нескольких секунд и не надо париться с OCR. |
|
|
|
К началу |
|
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Вс Окт 28, 2012 0:12 am |
|
|
Karsh
Да-да, в «кривых». Знаем, плавали... Очередной костыль. Для двухчасового фильма ASS-файл получается объемом несколько десятков мегабайт, а мой метод дает распознанный текст.
Subresync я применял для японских титров, распознать которые крайне тяжело (есть очень трудоемкий путь через Finereader): |
|
|
|
К началу |
|
Shur Гость
|
Добавлено: Вс Окт 28, 2012 0:25 am |
|
|
Не, для японских титров лучше тайпист. Файнридер лажает чаще.
Pelikan: | часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. |
Примерчик можно? |
|
|
|
К началу |
|
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Вс Окт 28, 2012 8:19 am |
|
|
Наверное, имеется в виду e.Typist? Это платная программа. Опять же — либо покупать (стоит сильно недешево), либо ломать.
Те «коллекции» BMP-файлов, где каждый третий был непонятно чем, я давно уже стер, воспроизводить их заново нет никакого желания.
Пример работы OCR SubRip'а c подгруженными матрицами: |
|
|
|
К началу |
|
KeeperRus
Переводы

Зарегистрирован: 16.08.2010 Сообщения: 1867
|
Добавлено: Вс Окт 28, 2012 9:10 am |
|
|
Pelikan
спасибо, пригодится. |
|
|
|
К началу |
|
Shur Гость
|
Добавлено: Вс Окт 28, 2012 14:13 pm |
|
|
Ок. Уговорил. DVDSubEdit + FineReader  |
|
|
|
К началу |
|
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Вс Окт 28, 2012 16:43 pm |
|
|
Shur
Увы. DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. Сколько раз экспортировал с помощью него английские титры в SRT — столько же раз получал плавающий нарастающий рассинхрон с последующей утомительной ручной подгонкой.
У FineReader'а есть вполне объяснимые проблемы с распознаванием иероглифических текстов на изображениях плотностью ниже 300 dpi, к которым относятся скриншоты.
***
По распознаванию растровых азиатских титров «наклевывается» тема использования того же Subtitle Edit, поскольку он умеет пользоваться API распознавалки MODI (Microsoft Office Digital Imaging).
Для этого должен быть установлен M$ Office 2003 или 2007, к нему — языковой пакет (language pack) нужного языка (японский, китайский, корейский).
В настройках распознавалки Subtitle Edit нужно выбрать MODI вместо Tesseract и попробовать распознать титры.
О результатах напишу. |
|
|
|
К началу |
|
Shur Гость
|
Добавлено: Вс Окт 28, 2012 18:32 pm |
|
|
Pelikan: | DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. |
Галка в настройках "use drop-frame time code" |
|
|
|
К началу |
|
Pelikan
Переводы

Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
|
Добавлено: Вс Окт 28, 2012 19:32 pm |
|
|
Shur: | Pelikan: | DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. |
Галка в настройках "use drop-frame time code" |
Попробую.
А почему этот режим не выставлен по умолчанию? |
|
|
|
К началу |
|
Shur Гость
|
Добавлено: Вс Окт 28, 2012 20:48 pm |
|
|
Автор француз |
|
|
|
К началу |
|
|