Список форумов Kage Project Kage Project
 
  РегистрацияРегистрация  ВходВход
  Архив субтитровАрхив субтитров  ПоискПоиск  ЧаВоЧаВо  ПользователиПользователи
 Войти и проверить личные сообщенияВойти и проверить личные сообщения

Как преобразовать субтитры из формата SUB/IDX в SRT
На страницу 1, 2  След.
 
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Техническая поддержка
Предыдущая тема :: Следующая тема 
Автор Сообщение
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Ср Окт 24, 2012 19:55 pm   Заголовок сообщения: Как преобразовать субтитры из формата SUB/IDX в SRT Ответить с цитатой

Я просто оставлю это здесь ©

Делюсь опытом, если вдруг кому понадобится...

Дано: есть DVD-рип с азиатским фильмом или аниме. Английские субтитры внешние, но растровые, в двух файлах *.SUB и *.IDX.

Вариант: есть DVD ISO, содержащий английские титры.

Требуется: распознать титры и получить нормальный файл *.SRT для последующего использования при переводе.

Неправильные решения: VideoSubFinder, SubRip, DVDSubEdit, Subresync

Правильное решение: использование специальной фичи редактора субтитров Subtitle Edit.

Редактор качать здесь: http://www.nikse.dk/

С Аегисабом он, разумеется, рядом не стоял, но у него есть одна очень приятная фича: распознавание растровых титров различных форматов. OCR работает вполне прилично. Разумеется, ручной контроль после распознавания никто не отменял.

Скриншот:


Последний раз редактировалось: Сб Окт 27, 2012 23:48 pm


[191.28 KB / Просмотров: 1234]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
Shur
Гость




СообщениеДобавлено: Сб Окт 27, 2012 20:55 pm   Ответить с цитатой

Самое правильное решение: Subrip+FineReader Laughing

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Сб Окт 27, 2012 21:35 pm   Ответить с цитатой

Ответ неверный.

Subrip — очень старая программа, которая часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. Проверено на большом количестве наборов SUB/IDX и ISO-образов японских фильмов с английскими титрами.

К тому же, не совсем понятен механизм взаимодействия с FineReader. Во-первых, он является коммерческой программой. Его нужно либо купить, либо хакнуть (второе может не приветствоваться некоторыми участниками community). Во-вторых, он не делает на выходе SRT. В общем, костыли предлагать не надо.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
Karsh

Переводы



Зарегистрирован: 17.03.2012
Сообщения: 325
Откуда: Ленинград
СообщениеДобавлено: Сб Окт 27, 2012 22:33 pm   Ответить с цитатой

Самый правильный ответ — SubResync. Very Happy Лучше проги для этого дела пока не встречал.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора Номер ICQ
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Сб Окт 27, 2012 23:29 pm   Ответить с цитатой

Karsh:
Самый правильный ответ — SubResync. Very Happy Лучше проги для этого дела пока не встречал.


Очередной неверный ответ. У Subresync отсутствует автоматическое распознавание, придется каждый символ подтверждать:


[60.28 KB / Просмотров: 927] [64.84 KB / Просмотров: 860]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
Karsh

Переводы



Зарегистрирован: 17.03.2012
Сообщения: 325
Откуда: Ленинград
СообщениеДобавлено: Сб Окт 27, 2012 23:56 pm   Ответить с цитатой

Pelikan
Subresync умеет сохранять в асс и без распознавания. Пара кликов, грузим аеги — и переводим. Дело нескольких секунд и не надо париться с OCR.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора Номер ICQ
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 0:12 am   Ответить с цитатой

Karsh
Да-да, в «кривых». Знаем, плавали... Очередной костыль. Для двухчасового фильма ASS-файл получается объемом несколько десятков мегабайт, а мой метод дает распознанный текст.

Subresync я применял для японских титров, распознать которые крайне тяжело (есть очень трудоемкий путь через Finereader):


[240.45 KB / Просмотров: 1012]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
Shur
Гость




СообщениеДобавлено: Вс Окт 28, 2012 0:25 am   Ответить с цитатой

Не, для японских титров лучше тайпист. Файнридер лажает чаще.

Pelikan:
часто фэйлит правильное построение растровых изображений титров на «пустом» фоне.

Примерчик можно?

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 8:19 am   Ответить с цитатой

Наверное, имеется в виду e.Typist? Это платная программа. Опять же — либо покупать (стоит сильно недешево), либо ломать.

Shur:
Примерчик можно?

Те «коллекции» BMP-файлов, где каждый третий был непонятно чем, я давно уже стер, воспроизводить их заново нет никакого желания.

Пример работы OCR SubRip'а c подгруженными матрицами:


[128.59 KB / Просмотров: 956] [130.2 KB / Просмотров: 884]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
KeeperRus

Переводы



Зарегистрирован: 16.08.2010
Сообщения: 1829
Откуда: Саратов, РФ
СообщениеДобавлено: Вс Окт 28, 2012 9:10 am   Ответить с цитатой

Pelikan
спасибо, пригодится.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Отправить e-mail Посетить сайт автора Номер ICQ
Shur
Гость




СообщениеДобавлено: Вс Окт 28, 2012 14:13 pm   Ответить с цитатой

Ок. Уговорил. DVDSubEdit + FineReader Laughing

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 16:43 pm   Ответить с цитатой

Shur
Увы. Sad DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. Сколько раз экспортировал с помощью него английские титры в SRT — столько же раз получал плавающий нарастающий рассинхрон с последующей утомительной ручной подгонкой.

У FineReader'а есть вполне объяснимые проблемы с распознаванием иероглифических текстов на изображениях плотностью ниже 300 dpi, к которым относятся скриншоты.

***

По распознаванию растровых азиатских титров «наклевывается» тема использования того же Subtitle Edit, поскольку он умеет пользоваться API распознавалки MODI (Microsoft Office Digital Imaging).
Для этого должен быть установлен M$ Office 2003 или 2007, к нему — языковой пакет (language pack) нужного языка (японский, китайский, корейский).
В настройках распознавалки Subtitle Edit нужно выбрать MODI вместо Tesseract и попробовать распознать титры.

О результатах напишу.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
Shur
Гость




СообщениеДобавлено: Вс Окт 28, 2012 18:32 pm   Ответить с цитатой

Pelikan:
DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте.

Галка в настройках "use drop-frame time code"

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 136
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 19:32 pm   Ответить с цитатой

Shur:
Pelikan:
DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте.

Галка в настройках "use drop-frame time code"


Попробую.

А почему этот режим не выставлен по умолчанию?

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Номер ICQ
Shur
Гость




СообщениеДобавлено: Вс Окт 28, 2012 20:48 pm   Ответить с цитатой

Автор француз

К началу
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Техническая поддержка Часовой пояс: GMT + 3
На страницу 1, 2  След.
Страница 1 из 2
 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы можете скачивать файлы, прикрепленные к сообщениям