| 
Предыдущая тема
::
Следующая тема 
 | 
	
	
	
	
		| Автор | 
		Сообщение | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Ср Окт 24, 2012 19:55 pm   Заголовок сообщения: Как преобразовать субтитры из формата SUB/IDX в SRT | 
				       | 
			 
			
				
  | 
			 
			
				Я просто оставлю это здесь ©
 
 
Делюсь опытом, если вдруг кому понадобится...
 
 
Дано: есть DVD-рип с азиатским фильмом или аниме. Английские субтитры внешние, но растровые, в двух файлах *.SUB и *.IDX.
 
 
Вариант: есть DVD ISO, содержащий английские титры.
 
 
Требуется: распознать титры и получить нормальный файл *.SRT для последующего использования при переводе.
 
 
Неправильные решения: VideoSubFinder, SubRip, DVDSubEdit, Subresync
 
 
Правильное решение: использование специальной фичи редактора субтитров Subtitle Edit.
 
 
Редактор качать здесь: http://www.nikse.dk/
 
 
С Аегисабом он, разумеется, рядом не стоял, но у него есть одна очень приятная фича: распознавание растровых титров различных форматов. OCR работает вполне прилично. Разумеется, ручной контроль после распознавания никто не отменял.
 
 
Скриншот:
  Последний раз редактировалось: Сб Окт 27, 2012 23:48 pm | 
			 
			
				 | 
			 
			
				
 
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Shur Гость
 
 
 
 
 
  | 
		
			
				 Добавлено: Сб Окт 27, 2012 20:55 pm    | 
				       | 
			 
			
				
  | 
			 
			
				Самое правильное решение: Subrip+FineReader    | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Сб Окт 27, 2012 21:35 pm    | 
				       | 
			 
			
				
  | 
			 
			
				Ответ неверный.
 
 
 
Subrip — очень старая программа, которая часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. Проверено на большом количестве наборов SUB/IDX и ISO-образов японских фильмов с английскими титрами.
 
 
К тому же, не совсем понятен механизм взаимодействия с FineReader. Во-первых, он является коммерческой программой. Его нужно либо купить, либо хакнуть (второе может не приветствоваться некоторыми участниками community). Во-вторых, он не делает на выходе SRT. В общем, костыли предлагать не надо. | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Karsh
  Переводы
 
  
  Зарегистрирован: 17.03.2012 Сообщения: 325 Откуда: Ленинград
  | 
		
			
				 Добавлено: Сб Окт 27, 2012 22:33 pm    | 
				       | 
			 
			
				
  | 
			 
			
				Самый правильный ответ — SubResync.    Лучше проги для этого дела пока не встречал. | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Сб Окт 27, 2012 23:29 pm    | 
				       | 
			 
			
				
  | 
			 
			
				 	  | Karsh: | 	 		  Самый правильный ответ — SubResync.    Лучше проги для этого дела пока не встречал. | 	  
 
 
Очередной неверный ответ. У Subresync отсутствует автоматическое распознавание, придется каждый символ подтверждать: | 
			 
			
				 | 
			 
			
				
 
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Karsh
  Переводы
 
  
  Зарегистрирован: 17.03.2012 Сообщения: 325 Откуда: Ленинград
  | 
		
			
				 Добавлено: Сб Окт 27, 2012 23:56 pm    | 
				       | 
			 
			
				
  | 
			 
			
				Pelikan
 
Subresync умеет сохранять в асс и без распознавания. Пара кликов, грузим аеги — и переводим. Дело нескольких секунд и не надо париться с OCR. | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 0:12 am    | 
				       | 
			 
			
				
  | 
			 
			
				Karsh
 
Да-да, в «кривых». Знаем, плавали... Очередной костыль. Для двухчасового фильма ASS-файл получается объемом несколько десятков мегабайт, а мой метод дает распознанный текст. 
 
 
Subresync я применял для японских титров, распознать которые крайне тяжело (есть очень трудоемкий путь через Finereader): | 
			 
			
				 | 
			 
			
				
 
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Shur Гость
 
 
 
 
 
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 0:25 am    | 
				       | 
			 
			
				
  | 
			 
			
				Не, для японских титров лучше тайпист. Файнридер лажает чаще.
 
 
 	  | Pelikan: | 	 		  | часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. | 	  
 
Примерчик можно? | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 8:19 am    | 
				       | 
			 
			
				
  | 
			 
			
				Наверное, имеется в виду e.Typist? Это платная программа. Опять же — либо покупать (стоит сильно недешево), либо ломать. 
 
 
 
Те «коллекции» BMP-файлов, где каждый третий был непонятно чем, я давно уже стер, воспроизводить их заново нет никакого желания.
 
 
Пример работы OCR SubRip'а c подгруженными матрицами: | 
			 
			
				 | 
			 
			
				
 
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 KeeperRus
  Переводы
 
  
  Зарегистрирован: 16.08.2010 Сообщения: 1872
 
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 9:10 am    | 
				       | 
			 
			
				
  | 
			 
			
				Pelikan
 
спасибо, пригодится. | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Shur Гость
 
 
 
 
 
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 14:13 pm    | 
				       | 
			 
			
				
  | 
			 
			
				Ок. Уговорил. DVDSubEdit + FineReader    | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 16:43 pm    | 
				       | 
			 
			
				
  | 
			 
			
				Shur
 
Увы.   DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. Сколько раз экспортировал с помощью него английские титры в SRT — столько же раз получал плавающий нарастающий рассинхрон с последующей утомительной ручной подгонкой. 
 
 
У FineReader'а есть вполне объяснимые проблемы с распознаванием иероглифических текстов на изображениях плотностью ниже 300 dpi, к которым относятся скриншоты.
 
 
***
 
 
По распознаванию растровых азиатских титров «наклевывается» тема использования того же Subtitle Edit, поскольку он умеет пользоваться API распознавалки MODI (Microsoft Office Digital Imaging).
 
Для этого должен быть установлен M$ Office 2003 или 2007, к нему — языковой пакет (language pack) нужного языка (японский, китайский, корейский).
 
В настройках распознавалки Subtitle Edit нужно выбрать MODI вместо Tesseract и попробовать распознать титры.
 
 
О результатах напишу. | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Shur Гость
 
 
 
 
 
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 18:32 pm    | 
				       | 
			 
			
				
  | 
			 
			
				 	  | Pelikan: | 	 		  | DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. | 	  
 
Галка в настройках "use drop-frame time code" | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Pelikan
  Переводы
 
  
  Зарегистрирован: 05.03.2006 Сообщения: 137 Откуда: Москва
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 19:32 pm    | 
				       | 
			 
			
				
  | 
			 
			
				 	  | Shur: | 	 		   	  | Pelikan: | 	 		  | DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. | 	  
 
Галка в настройках "use drop-frame time code" | 	  
 
 
Попробую. 
 
 
А почему этот режим не выставлен по умолчанию? | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 Shur Гость
 
 
 
 
 
  | 
		
			
				 Добавлено: Вс Окт 28, 2012 20:48 pm    | 
				       | 
			 
			
				
  | 
			 
			
				| Автор француз | 
			 
			
				 | 
			 
			
				
 
 | 
			 
		  | 
	
	
		| К началу | 
		 | 
	
	
		 |