Список форумов Kage Project Kage Project
 
  РегистрацияРегистрация  ВходВход
  Архив субтитровАрхив субтитров  ПоискПоиск  ЧаВоЧаВо  ПользователиПользователи
 Войти и проверить личные сообщенияВойти и проверить личные сообщения

перевод с японского новыми технологиями

 
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Техническая поддержка
Предыдущая тема :: Следующая тема 
Автор Сообщение
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Ср Ноя 06, 2024 15:42 pm   Заголовок сообщения: перевод с японского новыми технологиями Ответить с цитатой

решил продублировать тут , подсказали что лучше тут обсуждать.
в общем делюсь опытом перевода с японского языка при помощи чата жпт
качество перевода можете оценить в этой теме, я скринов накидал, и это только то что бросилось в глаза.
нейроперевод сохраняет характеры и манеры речи персонажей, т.к. в японском языке много приставок и глаголов которые придают краски предложениям, и которые теряются при переводе на английский, а далее на русский.

теперь о самом процессе перевода и тонкостях которые я выявил опытным путем:

иногда встречаются неточности, например он или она неверно выдает, но это потомучто нейронка не знает, что происходит на экране, такие моменты надо править в ручную.

чат жпт имеет бесплтаную версию и платную, есть модель gpt-4o, которая в бесплатной версии может выдать в ответе примерно 25к символов, с подпиской плюс 125к, лимит сбрасывается каждые 3часа (но я могу ошибаться) после истечения лимита, меняется модель на gpt-4o mini, она не имеет смысла, это уже машинная дословщина.
всего мне хватило примерно на 2 серии перевода с подпиской плюс, без подписки на пол серии(но наверно можно пробовать несколько аккаунтов создать)
API воспользоваться я не смог, т.к. подписка плюс не дает доступа к api, апи подразумевается для бизнес пользователей. (программа subtitle edit имеет поддержку апи от чатажпт) к тому же апи будет начислять оплату за каждый запрос-ответ от количества полученых токенов(символов), в общем апи не вариант и дорого.

за раз закинуть весь текст и сказать переведи не получиться, нужно задать параметры перевода, в 1 ответ влезает примерно 50 фраз перевода, но опытным путеем я решил что лучше пихать 10 фраз, т.к. он иногда короткие фразы может обьединить, и таймкод сместить на фразу вверх, в итоге придется выискивать где он заруинил таймкод.
поэксперементировав, я пришел к такому промту:


Код:

1. сделай перевод субтитров аниме на русский язык, переводи максимально точно, старайся сохранить последовательность слов, не вноси отсебятины.
2. если у фразы два смысловых значения, то допиши второе значение в квадратных скобках без примечаний.
3. тайм код и нумерация фраз должны быть привязаны к переведенной фразе, ответ выводи в виде кода.
4. слова в скобках тоже переводи


так же можно чат попросить запомнить некоторые предпочтения, например написать прямо в чате "запомни: при переводе с японского языка, оставляй суффиксы сан, чан"
тогда она сохранит в памяти предпочтения, и будет использовать его везде, эти предпочтения можно удалять в настройках чата.
(сам чат с этой просьбой наверно лучше не удалять, сам не знаю)

далее я написал скрипт (я не программист, написал на что хватило сил), который берез из файла текст, добавляет промт, и пихает его в чат, полученый ответ записывает в новый файл,
нейронка переводит примерно по 2секунды на фразу, без подписки 5 секунд.

если вдруг(надеюсь) комуто интересно
записал видео работы скрипта
https://youtu.be/jsta-loW-DM

скрипт в приложении, чтоб он работал надо:
1. поместить файл на c:\subs\01.srt (только srt с нумерацией фраз),
2. чат открыть на четверть экрана(подвинуть в левый верхний угол) с разрешением экрана 1920x1080
если экран отличается, то надо изменить области нажатия кнопок мыши (координаты X,Y их 3), внутри скрипта я оставил пояснения что к чему.
для его работы нужно установить autohotkey v2
готовый файл будет в той же папке с названием 01_out.srt
так же можно 02.srt 03.srt и тд. скрипт будет переводить пока файлы не закончатся, после он выдаст ошибку.
можно указать с какой строки начать перевод, если вдруг достиг лимита, а позже продолжить перевод, серию лучше переводить в рамках одного чата, т.к. система ориентируется на предыдущие ответы.

еще добавлю, что я пробовал разные переводчики, всякие специализированные AI, которые заточены на перевод, все они либо хрень полная , либо максимум на уровне бесплатного gpt-4o mini.

субтитры я брал с китсунеко, если есть еще какойто ресурс где можно взять японские субтитры, буду благодарен если подскажите.


sub1.zip  [1.3 KB] [Загрузок: 100]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
ED_Sln

Переводы



Зарегистрирован: 25.03.2014
Сообщения: 395
Откуда: С просторов Сибири
СообщениеДобавлено: Ср Ноя 06, 2024 17:01 pm   Ответить с цитатой

Можно использовать Whisper для распознавания речи, если нет японских субтитров. Готовые субтитры сохраняет в srt, распознает неплохо и японский и русский. Есть онлайн сервисы и оффлайн программа, которая может работать и на ГП и на ЦП (но медленней конечно).

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Техническая поддержка Часовой пояс: GMT + 3
Страница 1 из 1
 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы можете скачивать файлы, прикрепленные к сообщениям