Список форумов Kage Project Kage Project
 
  РегистрацияРегистрация  ВходВход
  Архив субтитровАрхив субтитров  ПоискПоиск  ЧаВоЧаВо  ПользователиПользователи
 Войти и проверить личные сообщенияВойти и проверить личные сообщения

Как преобразовать субтитры из формата SUB/IDX в SRT
На страницу 1, 2  След.
 
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Техническая поддержка
Предыдущая тема :: Следующая тема 
Автор Сообщение
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Ср Окт 24, 2012 19:55 pm   Заголовок сообщения: Как преобразовать субтитры из формата SUB/IDX в SRT Ответить с цитатой

Я просто оставлю это здесь ©

Делюсь опытом, если вдруг кому понадобится...

Дано: есть DVD-рип с азиатским фильмом или аниме. Английские субтитры внешние, но растровые, в двух файлах *.SUB и *.IDX.

Вариант: есть DVD ISO, содержащий английские титры.

Требуется: распознать титры и получить нормальный файл *.SRT для последующего использования при переводе.

Неправильные решения: VideoSubFinder, SubRip, DVDSubEdit, Subresync

Правильное решение: использование специальной фичи редактора субтитров Subtitle Edit.

Редактор качать здесь: http://www.nikse.dk/

С Аегисабом он, разумеется, рядом не стоял, но у него есть одна очень приятная фича: распознавание растровых титров различных форматов. OCR работает вполне прилично. Разумеется, ручной контроль после распознавания никто не отменял.

Скриншот:


Последний раз редактировалось: Сб Окт 27, 2012 23:48 pm


[191.28 KB / Просмотров: 2660]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Сб Окт 27, 2012 20:55 pm   Ответить с цитатой

Самое правильное решение: Subrip+FineReader Laughing

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Сб Окт 27, 2012 21:35 pm   Ответить с цитатой

Ответ неверный.

Subrip — очень старая программа, которая часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. Проверено на большом количестве наборов SUB/IDX и ISO-образов японских фильмов с английскими титрами.

К тому же, не совсем понятен механизм взаимодействия с FineReader. Во-первых, он является коммерческой программой. Его нужно либо купить, либо хакнуть (второе может не приветствоваться некоторыми участниками community). Во-вторых, он не делает на выходе SRT. В общем, костыли предлагать не надо.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Karsh

Переводы



Зарегистрирован: 17.03.2012
Сообщения: 325
Откуда: Ленинград
СообщениеДобавлено: Сб Окт 27, 2012 22:33 pm   Ответить с цитатой

Самый правильный ответ — SubResync. Very Happy Лучше проги для этого дела пока не встречал.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора Номер ICQ
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Сб Окт 27, 2012 23:29 pm   Ответить с цитатой

Karsh:
Самый правильный ответ — SubResync. Very Happy Лучше проги для этого дела пока не встречал.


Очередной неверный ответ. У Subresync отсутствует автоматическое распознавание, придется каждый символ подтверждать:


[60.28 KB / Просмотров: 2221] [64.84 KB / Просмотров: 2117]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Karsh

Переводы



Зарегистрирован: 17.03.2012
Сообщения: 325
Откуда: Ленинград
СообщениеДобавлено: Сб Окт 27, 2012 23:56 pm   Ответить с цитатой

Pelikan
Subresync умеет сохранять в асс и без распознавания. Пара кликов, грузим аеги — и переводим. Дело нескольких секунд и не надо париться с OCR.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора Номер ICQ
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 0:12 am   Ответить с цитатой

Karsh
Да-да, в «кривых». Знаем, плавали... Очередной костыль. Для двухчасового фильма ASS-файл получается объемом несколько десятков мегабайт, а мой метод дает распознанный текст.

Subresync я применял для японских титров, распознать которые крайне тяжело (есть очень трудоемкий путь через Finereader):


[240.45 KB / Просмотров: 2346]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 0:25 am   Ответить с цитатой

Не, для японских титров лучше тайпист. Файнридер лажает чаще.

Pelikan:
часто фэйлит правильное построение растровых изображений титров на «пустом» фоне.

Примерчик можно?

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 8:19 am   Ответить с цитатой

Наверное, имеется в виду e.Typist? Это платная программа. Опять же — либо покупать (стоит сильно недешево), либо ломать.

Shur:
Примерчик можно?

Те «коллекции» BMP-файлов, где каждый третий был непонятно чем, я давно уже стер, воспроизводить их заново нет никакого желания.

Пример работы OCR SubRip'а c подгруженными матрицами:


[128.59 KB / Просмотров: 2288] [130.2 KB / Просмотров: 2149]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
KeeperRus

Переводы



Зарегистрирован: 16.08.2010
Сообщения: 1860

СообщениеДобавлено: Вс Окт 28, 2012 9:10 am   Ответить с цитатой

Pelikan
спасибо, пригодится.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Отправить e-mail Посетить сайт автора
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 14:13 pm   Ответить с цитатой

Ок. Уговорил. DVDSubEdit + FineReader Laughing

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 16:43 pm   Ответить с цитатой

Shur
Увы. Sad DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. Сколько раз экспортировал с помощью него английские титры в SRT — столько же раз получал плавающий нарастающий рассинхрон с последующей утомительной ручной подгонкой.

У FineReader'а есть вполне объяснимые проблемы с распознаванием иероглифических текстов на изображениях плотностью ниже 300 dpi, к которым относятся скриншоты.

***

По распознаванию растровых азиатских титров «наклевывается» тема использования того же Subtitle Edit, поскольку он умеет пользоваться API распознавалки MODI (Microsoft Office Digital Imaging).
Для этого должен быть установлен M$ Office 2003 или 2007, к нему — языковой пакет (language pack) нужного языка (японский, китайский, корейский).
В настройках распознавалки Subtitle Edit нужно выбрать MODI вместо Tesseract и попробовать распознать титры.

О результатах напишу.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 18:32 pm   Ответить с цитатой

Pelikan:
DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте.

Галка в настройках "use drop-frame time code"

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 19:32 pm   Ответить с цитатой

Shur:
Pelikan:
DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте.

Галка в настройках "use drop-frame time code"


Попробую.

А почему этот режим не выставлен по умолчанию?

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 20:48 pm   Ответить с цитатой

Автор француз

К началу
Показать сообщения:   
Начать новую тему   Ответить на тему ‹xЪЅVЫoЫTnюЉoGўЫДзТPЪЪFљђ&HCеmљђ/'‰‡oІќfбтїЎЉGРT$Д«“Жќ›Д'NЪ­B•sl'MBRZm"9—уыќпrxОµ%Sд9Osј§‚¤k5S@:®zі•Ў©ЄЋ45Х« ЁX(|ЂDћ©‚ўK®+ S:Dв¦)»цюь?/AЭБUi¦Љ_жнєэ‰«©ВЋ‚·ЛIЭЭ-WK;…jQ-$©R*дКGЫР‚Щгa8"=ё сщЂtаs©†б©cЅАЉЗs=7А–3W‡nV-§a$оЄByS2мэ»»э-x…—БЁз_Бђt»A|Ъу™C~iЋV«П±жY6Уj:’MM&гk5lє†¤лHьГ‘9ЈЋ®F{рдЛЇбC(OЙp+июХ‡С8цЈрн9рІXд9Y|ґИ=‚¦$ђ–(‡д„с8\{e4Ѕa6[ЫhЮб§’у-h*~ИvђшУ нЗлѕпТпЭA…¬Ѕ Ї®её¤Иk¦ЭрАkЩTјNШњ– ZРМСЦnЉ}Ю`љ%3+Y‚Ољ№®y8=У_jЮ …љзXЉ№ЬљФ?љ°‚0 §Б8Hљ@д_†Ќ!ѓIZ]W‰‘q'ёdbmЪ„ґя "JФZс8иъЅq'б Ј oЈuЮхыWwђ?!}2J]tЂ c2тЯ¬—Жa/†‰‡ я¬?ЃЮµ“БјЮњ кЛ0сђЁ<љY ўh¬°ps'НсЄvёЬ nK±мVЪИД%ѓTS\ҐїB3чФjb« ·`пъEUч<{ЏгљН&kiІњW,ѓC@)ґ и›ds•=ъбсcц(ЃM¶»?АQ ®ЁсBѕXЩЩСќѓЇѕШzні[ ЏЬ=(оТЅ'Яi6ќхъщЬA:ll¬ aК'[j‹нФ=C§я, Y№д