Список форумов Kage Project Kage Project
 
  РегистрацияРегистрация  ВходВход
  Архив субтитровАрхив субтитров  ПоискПоиск  ЧаВоЧаВо  ПользователиПользователи
 Войти и проверить личные сообщенияВойти и проверить личные сообщения

Tensei Shitara Ken Deshita [перевод с японского] [нейронка]
На страницу 1, 2, 3  След.
 
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Софтсаб
Предыдущая тема :: Следующая тема 

Прикрепленные файлы темы:
06.11.24 - Tensei Shitara Ken Deshita [S1E01-12] [bd-rip] [JP-RU] [GPT-4o 09-11-24].zip - elvaleto
11.12.24 - sub2.zip - elvaleto
01.02.25 - subs_2.0.zip - elvaleto
06.02.25 - subs_2.5.zip - elvaleto
19.03.25 - subs_2.6.zip - elvaleto

Автор Сообщение
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Ср Ноя 06, 2024 6:30 am   Заголовок сообщения: Tensei Shitara Ken Deshita [перевод с японского] [нейронка] Ответить с цитатой

создал скорее чтоб показать как продвинулись инструменты перевода,
на самом деле надоели субтитры с переводом прошедшие через тракт английского языка.
решил опробовать новый чатжпт скажу сразу, переводит замечательно, посмотрел один сериал полностью с двойными субтитрами, с переводом человека(английский) и нейронки(японский), и нейронка оказалась лучше во всем, и я не просто поверил ей наслово, проверял сложные фразы через словарь с разбором и транскрипцией японского языка, все было верно.



надеюсь на эту тему обратят внимание переводчики, чтоб использовать новый инструмент, который появился пол года назад
именно новая модель chatgpt-4o переводит хорошо, остальные остаются чисто машинной дословщиной(chatgpt-4o mini который бесплатный в том числе)

для примера накидаю скриншоты для оценки качества, снизу субтитры нейронки(японский)

[spoiler]








[/spoiler]

[spoiler]









[/spoiler]

теперь о самом процессе перевода и тонкостях которые я выявил опытным путем:

иногда встречаются неточности, например он или она неверно выдает, но это потомучто нейронка не знает, что происходит на экране, такие моменты надо править в ручную.

чат жпт имеет бесплтаную версию и платную, есть модель gpt-4o, которая в бесплатной версии может выдать в ответе примерно 25к символов, с подпиской плюс 125к, лимит сбрасывается каждые 3часа (но я могу ошибаться) после истечения лимита, меняется модель на gpt-4o mini, она не имеет смысла, это уже машинная дословщина.
всего мне хватило примерно на 2 серии перевода с подпиской плюс, без подписки на пол серии(но наверно можно пробовать несколько аккаунтов создать)
API воспользоваться я не смог, т.к. подписка плюс не дает доступа к api, апи подразумевается для бизнес пользователей. (программа subtitle edit имеет поддержку апи от чатажпт) к тому же апи будет начислять оплату за каждый запрос-ответ от количества полученых токенов(символов), в общем апи не вариант и дорого.

за раз закинуть весь текст и сказать переведи не получиться, нужно задать параметры перевода, в 1 ответ влезает примерно 50 фраз перевода, но опытным путеем я решил что лучше пихать 10 фраз, т.к. он иногда короткие фразы может обьединить, и таймкод сместить на фразу вверх, в итоге придется выискивать где он заруинил таймкод.
поэксперементировав, я пришел к такому промту:


Код:

1. сделай перевод субтитров аниме на русский язык, переводи максимально точно, старайся сохранить последовательность слов, не вноси отсебятины.
2. если у фразы два смысловых значения, то допиши второе значение в квадратных скобках без примечаний.
3. тайм код и нумерация фраз должны быть привязаны к переведенной фразе, ответ выводи в виде кода.
4. слова в скобках тоже переводи


так же можно чат попросить запомнить некоторые предпочтения, например написать прямо в чате "запомни: при переводе с японского языка, оставляй суффиксы сан, чан"
тогда она сохранит в памяти предпочтения, и будет использовать его везде, эти предпочтения можно удалять в настройках чата.
(сам чат с этой просьбой наверно лучше не удалять, сам не знаю)

далее я написал скрипт (я не программист, написал на что хватило сил), который берез из файла текст, добавляет промт, и пихает его в чат, полученый ответ записывает в новый файл,
нейронка переводит примерно по 2секунды на фразу, без подписки 5 секунд.

если вдруг(надеюсь) комуто интересно
записал видео работы скрипта
https://youtu.be/jsta-loW-DM

скрипт в приложении, чтоб он работал надо:
1. поместить файл на c:\subs\01.srt (только srt с нумерацией фраз),
2. чат открыть на четверть экрана(подвинуть в левый верхний угол) с разрешением экрана 1920x1080
если экран отличается, то надо изменить области нажатия кнопок мыши (координаты X,Y их 3), внутри скрипта я оставил пояснения что к чему.
для его работы нужно установить autohotkey v2
готовый файл будет в той же папке с названием 01_out.srt
так же можно 02.srt 03.srt и тд. скрипт будет переводить пока файлы не закончатся, после он выдаст ошибку.
можно указать с какой строки начать перевод, если вдруг достиг лимита, а позже продолжить перевод, серию лучше переводить в рамках одного чата, т.к. система ориентируется на предыдущие ответы.

еще добавлю, что я пробовал разные переводчики, всякие специализированные AI, которые заточены на перевод, все они либо хрень полная , либо максимум на уровне бесплатного gpt-4o mini.

субтитры я брал с китсунеко, если есть еще какойто ресурс где можно взять японские субтитры, буду благодарен если подскажите.

UPD:

из промта можно оставить только
Код:

сделай перевод субтитров аниме на русский язык, переводи максимально точно, старайся сохранить последовательность слов, не вноси отсебятины.

все остальные пункты просим запомнить
[/code]


Последний раз редактировалось: Ср Дек 11, 2024 19:10 pm


Tensei Shitara Ken Deshita [S1E01-12] [bd-rip] [JP-RU] [GPT-4o 09-11-24].zip  [168.01 KB] [Загрузок: 105]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Ср Ноя 06, 2024 8:54 am   Ответить с цитатой

не пойму, как прятать изображения под спойлер?

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Sa4ko aka Kiyoso

Переводы



Зарегистрирован: 16.12.2012
Сообщения: 7330
Откуда: Минск
СообщениеДобавлено: Ср Ноя 06, 2024 21:02 pm   Ответить с цитатой

elvaleto
Никак, на Каге такой тег не поддерживается. По скринам: стилистика больше нравится у фансаба, хотя видно, что нейронка точнее. Лично мне проще самому с японского перевести, чем мучиться с настройкой нейронки, всё равно допиливать придётся. Вот если б она тайпила за меня... Very Happy

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Ср Ноя 06, 2024 21:28 pm   Ответить с цитатой

Sa4ko aka Kiyoso:
elvaleto
Никак, на Каге такой тег не поддерживается. По скринам: стилистика больше нравится у фансаба, хотя видно, что нейронка точнее. Лично мне проще самому с японского перевести, чем мучиться с настройкой нейронки, всё равно допиливать придётся. Вот если б она тайпила за меня... Very Happy


на телефоне приложение есть, я думаю она умеет тайпить если попросить, но опять таки ограничения, бесплатная версия вроде 15мин в день(или месяц) позволяет обрабатывать голос, а платная 1 час в день.
и поять таки, на общий лимит влияет.

я предложил лишь как инструмент на заметку переводчикам, ибо подправить уже готовое и самое главное правильное со своим "фансаб стилистикой" куда проще.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Kage



Зарегистрирован: 19.08.2003
Сообщения: 9056

СообщениеДобавлено: Ср Ноя 06, 2024 21:33 pm   Ответить с цитатой

Sa4ko aka Kiyoso:
elvaleto
Никак, на Каге такой тег не поддерживается.

Он поддерживается, но отключен из-за административных соображений.

К началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
Sa4ko aka Kiyoso

Переводы



Зарегистрирован: 16.12.2012
Сообщения: 7330
Откуда: Минск
СообщениеДобавлено: Чт Ноя 07, 2024 0:56 am   Ответить с цитатой

elvaleto:
поять


(оффтоп: Ситуация уровня анекдота "Скинул другу SMS "Как дела?", он ответил: "Хорово". Сижу и думаю, где же опечатка".)

Интересно, если попросить нейросеть сделать мемные сабы, она сделает?..

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Чт Ноя 07, 2024 2:58 am   Ответить с цитатой

Sa4ko aka Kiyoso:
elvaleto:
поять



Интересно, если попросить нейросеть сделать мемные сабы, она сделает?..


некоторые фансабы уже мемные, только сами авторы об этом не знают.

я думаю можно, но мне кажется она сделает это плохо, есть новая модель, которая вроде как в декабре станет доступна, но на данный момент для подписчисков около 10ответов в неделю доступно, завтра лимит сброситься,
она умеет анализировать данные которые ей даешь, например я первый раз переводил ссору брата и сестры из аниме про про "дочь моей мачехи бывшая....", она думала минут 5, в логах можно было увидеть, что она поняла о разговоре брата и сестры, что они пытаются выяснить кто из них старше и тд,. долго и в перевод авторской отсебятины добавила, ну прям как человек,а этого какраз и не нужно.


могу попробовать, скиньте какой нибудь отрезок субтитров, промт надо еще придумать, что то вроде:
опирайся на мемных личностей рунета, перефразируй в комичной форме.

но вообще вы и сами можете, как я писал, бесплатная версия рабочая, только с лимитом ответов.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Чт Ноя 07, 2024 7:26 am   Ответить с цитатой

эта фраза лучше всего отображает фансабовский примерный перевод и точный перевод, и такое почти везде, во всех тайтлах.


К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Aero

Переводы



Зарегистрирован: 15.03.2015
Сообщения: 2387

СообщениеДобавлено: Чт Ноя 07, 2024 10:44 am   Ответить с цитатой

Цитата:
эта фраза лучше всего отображает фансабовский примерный перевод и точный перевод



Dialogue: 0,0:17:50.25,0:17:56.04,Subtitle,,0000,0000,0000,,As I was getting lost in the world of fantasy cuisine,\Nthings were happening in Alessa…

Видимо, ты про эту строку.
Первый вариант на твоём скрине как раз похож на ансабберский.
А второй... что это за набор слов? Он не имеет смысла в контексте седьмой серии.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Чт Ноя 07, 2024 13:38 pm   Ответить с цитатой

Aero:
Цитата:
эта фраза лучше всего отображает фансабовский примерный перевод и точный перевод



А второй... что это за набор слов? Он не имеет смысла в контексте седьмой серии.

это называется потерянная шутка благодаря английским фансабберам.

герои пол серии готовили жратву.
Код:

370
00:17:47,316 --> 00:17:49,610
(Мастер) Ты полностью очарована карри

371
00:17:50,778 --> 00:17:51,612
(Мастер) И вот, неожиданно...

372
00:17:51,695 --> 00:17:53,822
мы почти превратились в
историю о кулинарии в другом мире,




[/code]

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Чт Ноя 07, 2024 14:07 pm   Ответить с цитатой

ансаб от YSS
Код:

Dialogue: 0,0:17:46.35,0:17:48.85,Меч 1,,0,0,0,,Попала в ловушку карри.
Dialogue: 0,0:17:49.80,0:17:52.93,Thoughts,,0,0,0,,Пока мы наслаждались кулинарными изысками,

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Aero

Переводы



Зарегистрирован: 15.03.2015
Сообщения: 2387

СообщениеДобавлено: Чт Ноя 07, 2024 14:41 pm   Ответить с цитатой

elvaleto
Потерянная в ансабе шутка не сохранилась в переводе нейросетки. Это всё ещё набор слов. Настолько инородный, что многие сочтут это нелепой отсылкой самого переводчика к кулинарным тайтлам.

Будь там "наша история превратилась в историю о кулинарии в другом мире", было бы ещё как-то читабельно.
А "мы превратились в историю" звучит как "мы умерли и вошли в историю". Персонажи не могли "превратиться в историю". Это их будни превратились.
Чтобы доделать это предложение, нужно постараться самому. Но тогда нет особого смысла использовать нейросетку. Особенно ради единственной потерянной шутки про то, что обычный исекай на одну серию превратился в "Сому". Ты сам сказал, вся серия была "про жратву". Так что любой, кто смотрел кулинарные тайтлы, словил бы дежавю. Для этого даже нейросетка не нужна.
Итак, это единственный пример? Ты дошёл до седьмой серии и нашёл лишь это? Ты ведь даже не указал ни под одним скрином ни номер серии, ни время. Пришлось самому искать.

И раз уж ты затронул мой перевод, потрудись объясниться насчёт первых скринов.
Один случай я разберу сам:

Да, с умственно отсталой я промахнулся, и то потому, что в первом вышедшем ансабе было:
Dialogue: 0,0:17:54.16,0:17:57.70,Default,,0000,0000,0000,,Is she emotionally stunted?
и лишь через неделю или две вышел другой ансаб:
Dialogue: 0,0:17:55.21,0:17:58.04,Subtitle,,0000,0000,0000,,Guess she's the quiet type\Nthat keeps her emotions hidden.
Но ошибка есть ошибка. Я лишь частично сгладил её, добавив "или в шоке от происходящего".

Другие четыре случая одинаковы по смыслу что в твоей версии, что в моей. И то варианты нейросетки звучат просто как калька (Меч кричит: "Не суть! Вытаскивай меня уже!", а в переводе нейросетки бездушное "Ладно, оставим это", будто он за кружкой кофе обсуждает планы на день, а не находится в разгаре битвы).

Но вот этими двумя кадрами ты фактически распространяешь дезинфу о моём переводе:




Т.к. это лишь часть реплик, потому что я разбивал их на отдельные строки. А ты взял и заскринил только первые части. Тайминг говорит сам за себя.

Dialogue: 0,0:08:41.58,0:08:44.00,Text,,0000,0000,0000,,Ты чё развякалась, замарашка?!
Dialogue: 0,0:08:44.00,0:08:46.29,Text,,0000,0000,0000,,Больше не раскрывай свой рот.

Про рот указано? Указано.

Dialogue: 0,0:19:13.42,0:19:15.46,Меч 1,,0000,0000,0000,,Пушистая, убей монстра!
Dialogue: 0,0:19:15.46,0:19:17.21,Меч 1,,0000,0000,0000,,Будь уверенней и атакуй!

На чём она ещё могла сосредоточиться, как не на убийстве? Поэтому я отставил в сторону кальку, которая была такой же и в ансабе, упростил и написал "Убей монстра!", и дальше меч, подбодрив нерешительную ггню, кричит: "Будь уверенней и атакуй!", т.к. ей надо лишь начать сражаться, а меч сделает всё остальное. И эти две реплики по таймингу покрывают всё то предложение, что указано в твоём варианте нейросети.

Сравнивать куски разбитых надвое реплик из моего перевода и целые предложения из нейросети было изначально некорректно с твоей стороны.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Aero

Переводы



Зарегистрирован: 15.03.2015
Сообщения: 2387

СообщениеДобавлено: Чт Ноя 07, 2024 15:02 pm   Ответить с цитатой

Открыл первую серию из твоего архива. Скажи, ты выложил перевод нейросетки как есть? Даже не пытался его подрихтовать?

Мой перевод:

Вот так я... похоже, умер. Но переродился... девочкой с кошачьими ушками в другом мире. Вот и нет. Я переродился мечом. Так вот, переродился мечом. А моим владельцем стала эта кошкодевочка с пушистыми ушками.

Твой перевод:

Похоже, я кажется, умер но в другом мире как оказалось, я переродился в милую девушку с ушками но это не так переродившись, я стал мечом Переродившись, я стал мечом и затем эта пушистая девушка с кошачьими ушками стала моим дорогим носителем

Стала носителем))) Да, носить меч можно, но "быть носителем" это из мед.оперы, когда люди/звери/насекомые оказываются носителями болезней и вирусов. Ты же мог это исправить. Или просто хотел показать чистый перевод нейросети? При этом засунув его в архив как свой?

И дальше:
Dialogue: 0,0:08:23.63,0:08:25.34,Default,,0000,0000,0000,,Если так продолжится,
Dialogue: 0,0:08:25.42,0:08:29.01,Default,,0000,0000,0000,,кто меня наденет,\Nсразу станет мастером меча?

К тому же столько ошибок в знаках препинания, вернее, отсутствие знаков препинания. В других сериях тоже так?

Твоя темка называется "перевод с японского", а не "демонстрация работы нейросети".

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Чт Ноя 07, 2024 15:38 pm   Ответить с цитатой

номера серии не указывал, потому-что я создал тему для демонстрации возможностей ИИ, и скрипта, чтоб такие как вы взяли инструмент на вооружение.
на скринах я показал как плюсы (точного перевода), так и минусы ("Ладно, оставим это"), которые надо править человеку, но в даже так он остается точным по смыслу переводом в отличии ансаба.

про гастрономию тут очевидно, как никрути ИИ перевел лучше, он точно передал смысл, (оригинал на японском я приложил для достоверности), когда смотришь понимаешь что сказал гг и улыбаешся в отличии от фансаба, я уже перестал смотреть с двойными сабами, пару серий только посмотрел, по ним уже было понятно что ансаб не имеет смысла(но он имел до появления ИИ, кроме тех кто деньги за это получает), лишь иногда в отдельные моменты включаю для сравнения, досмотрел до 8ой серии, за весь сериал раз 5 встретил косяки, когда нейронка просто не поняла какой персонаж к какому обращается.(пока что смотрю и все еще экспериментирую)

даже не смотря на все минусы вроде "ладно оставим это" , смотрится гораздо лучше, но это вкусовщина, (для меня важней смысл фразы, а эмоции и манеру речи я перенимаю от персонажей с экрана.), а переформулировка, вроде "убей монстра" итак и так правильно, каждый фансабер посвоему сформулирует, смысл останется один, а вот то что ушки потеряны, это уже косяк.

в любом случае неверный перевод объективно во много раз хуже (умственно отсталая) , чем "ладно оставим это".

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
elvaleto



Зарегистрирован: 04.11.2024
Сообщения: 28

СообщениеДобавлено: Чт Ноя 07, 2024 15:44 pm   Ответить с цитатой

Aero:
Открыл первую серию из твоего архива. Скажи, ты выложил перевод нейросетки как есть? Даже не пытался его .


выложил как есть, сабы взял японские с китсунеко от нетфликс, сдвинул только тайминг на 1 секунду, т.к. не совпадали.

вспомнил, что в первой серии в конце попытался добавить аннотации из сабов YSS, т.к. их нет в японских сабах, но как то не очень получилось, поэтому я забил и не стал дальше ничего менять.


Последний раз редактировалось: Чт Ноя 07, 2024 16:34 pm

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Софтсаб Часовой пояс: GMT + 3
На страницу 1, 2, 3  След.
Страница 1 из 3
 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы можете скачивать файлы, прикрепленные к сообщениям