Subject: ОФФ: Оптимизация/ускорение перевода с помощью mashine learning gen. Здравствуйте. Меня зовут Юра. Занимаюсь техническим (медицинским) переводом более 9 лет. За это время выполнил свыше полутысячи заказов суммарным объемом более 38 млн. знаков с пробелами. Работаю дистанционно. Продолжительность моего рабочего дня последние пару лет - от где-то 3,5 до 10 ч (с учетом малолетних семейных обстоятельств), в среднем в пределах 5 ч. Перевожу 8-30 тыс. знаков с пробелами в день (в зависимости от сложности текста и времени работы), принимая заказы ориентируюсь (чтобы с некоторым запасом) на 14 тыс. знаков с пробелами/день. Поскольку среди друзей переводчиков нет, насколько низки/высоки темпы моей работы, по-правде, толком не знаю. Работаю в MemoQ (свои translation memories + весьма обширная база TM БП, в котором работаю). Продолжительность рабочего дня меня, конечно, устраивает, но, как ни странно, не совсем устраивает заработок ;)Собственно, вопрос: как повысить эффективность своей работы? Позволю себе высказать ряд мыслей вслух, и буду рад конструктивной беседе. Видится 2 глобальных аспекта/направления: По п. 1, в общем-то, понятно, что качество и скорость перевода растет в зависимости от знаний/опыта переводчика, и этот процесс идет сам собой по мере выполнения заказов, хотя, наверное, не слишком быстро. А если времени на самообразование особо не остается (плохо, да), то и динамика в этом плане не слишком бодрая. Поэтому интересно, можно ли/да и стоит ли при таких раскладах попытаться повысить скорость работы с помощью каких-либо современных компьютерных технологий. Пробовал надиктовывать перевод голосом (speechpad.ru) - поначалу показалось перспективно (на первых пробных текстах, вроде как, был некоторый прирост производительности, до 20%), но в конечном счете оказалось многовато правки при вводе, мне как-то не пошло, и я отказался от этой затеи. Теперь вот размышляю над: Какие еще могут быть мысли насчет повышения продуктивности работы? Заранее спасибо. |
Machine. |
более "глобальные" варианты типа поиска другого работодателя, работы напрямую с заказчиками. |
Да, все похоже, похоже… и нормы дневной выработки, и мысли… Только инструмент другой (DeJa Vu). А мысли грустные. Занимаюсь переводом с 05 года, «плотно» - с 2008. Если в «золотые годы» (20010-2013) подбирался к объемам 1 млн. знаков в месяц (и иногда переваливал их), то в последние годы падение раза в 3… Изменился входной материал. Тексты были написаны проще, грамотнее, соответствовали стилю (перевожу описания изобретений). Сейчас нередки автоматически сгенерированные (или автоматически переведенные на английский с др. европейских языков) тексты. Там грамматики практически нет (не говоря уже о смысле), порядок слов произвольный, куча ошибок, которые Word показывает… CAT тут бессилен… И не знаю, какая мощь нейросети нужна, чтобы справиться с этим бредом. Скорее всего, сработает принцип GIGO (garbage IN – garbage OUT), что по-русски означает «из г…на конфетку не сделаешь». А «прокачка» … стала мешать. Если раньше и вариантов перевода в мозгу «не всплывало», и мало что смущало, то теперь постоянно цепляешься за всякую ерунду. А вот еще в этом словаре посмотрим, а вот еще в гугле пороемся в статьях, сомнения, сомнения, а вдруг автор имел в виду… или вдруг вот это начало предложения как-то связано с вот этим местом в середине? |
"А вот еще в этом словаре посмотрим, а вот еще в гугле пороемся в статьях, сомнения, сомнения, а вдруг автор имел в виду..." Так так и должно быть, по-моему. |
|
link 4.08.2017 10:29 |
"Iurii" - после этого не стал читать |
В общем, Юрий, спойлер: в этой ветке будут обсуждать ваш ник, ваши ставки, ваших заказчиков, но - никто этим здесь не занимался, я уверена на 99%. Если хочется попробовать - так и попробуйте! Потом сможете выступить на TFR, рассказать)) |
Supa Traslata - так сейчас в паспортах пишут, однако. IuriiA Мне кажется, самообразование переводчика и процесс перевода - это одно и тоже. Переводишь договоры с английского, запоминаешь фразы, потом используешь в переводе на язык - как-то так. То, что вы предлагаете потом, для меня "темный лес") CAT сильно помогают при работе на одних и тех же клиентов, даже если им скидки делать. Какие еще могут быть пути повышения эффективности - повышать цены, искать менее жадных заказчиков))) |
Юрий, я и переводчик. и программист, так что прекрасно понимаю, о чем Вы говорите. Сама идея вполне правильная, но возникает масса технических сложностей. Это и ограничения по производительности одного компьютера, а самое главное - недостаточный объем данных для нормального обучения нейросети. Даже гугловские нейросети, которые годами обучаются на всем массиве данных Интернета, по-прежнему выдают чушь. Хуже того, чушь эта нестабильная - по мере обучения один и тот же фрагмент исходного текста переводится по-разному (но всегда плохо). Мне кажется, что больше помогут технологии внутрисегментного поиска (не помню. есть ли они в MemQ, в Традосе есть) и надиктовка. Я написал программу, подцепляющую Google Speech API к Традосу, и диктую по 5-6К слов в день. Потом, конечно, мой корректор вычитывает, так как бывают казусы типа "а тут мы видим двух местных крокодилов" -> "а тут невидим двухместный крокодилов". Насчет локальных нейросетей можно пообщаться более предметно, пишите на dtroitsky@gmail.com |
DrDIT "Я написал программу, подцепляющую Google Speech API к Традосу" А сегменты вы при этом руками переключаете (или как это в Традосе называется, я так понимаю, у всех кошек принцип работы один)? |
|
link 4.08.2017 13:59 |
вообще-то надиктовка перевода - вещь очень интересная. Она была по-моему в каком-то из фильмов Ghost in the Shell. Там писательница текст надиктовывала, а не печатала. |
laya shkoda, это в фильме "Her" было. и не писательница, а писатель. :)
|
Я еще лет 15 назад пробовала, программка Dragon Dictate называлась, неплохо распознавала, даже команды были голосовые для форматирования. Потом начала пользоваться Wordfast, и диктовку забросила. |
во всех программах, преобразующих речь в текст, меня раздражает одно - необходимость озвучивания знаков препинания и регистра букв и слов. диктовать текст вот так: "с большой буквы кстати запятая о птичках двоеточие с большой буквы москва запятая знаете ли запятая не сразу строилась", мне представляется противоестественным. к сожалению, даже продвинутые программы типа Dragon Dictate не умеют расставлять знаки препинания самостоятельно. ну или попробуйте продиктовать компьютеру название песни "Точка, точка, запятая", чтобы при этом не вышло "..," :) |
этим же страдают встроенные распознаватели речи в продукции Apple. насчет Windows ничего не скажу, Кортаной еще не пользовался. |
поэтому при письменном переводе ввожу текст по-прежнему пальцами, а не голосом. :) |
В общем, "Machine: Impossible"... :) |
Все уже попробовано титанами до нас: А что природа делает без нас? - Вопрос ("Осенний марафон") |
осталось спросить: «Ставку повышать не пробовали?» |
azu, работает это так: - открылся очередной сегмент в Традосе; - нажимаю выбранной мной комбинацию клавиш, держу их нажатыми, диктую; - отпускаю - распознанный текст появляется в Традосе; - подправляю знаки препинания, заглавные и пр. (команд с голоса под них нет), подтверждаю сегмент, и т.д. |
как это нет команд? так попробуйте сказать "запятая", "точка" - вдруг получится? |
А пробовали считать какой ресурс уйдет на собственные разработки? Стоит ли игра свеч? Можно ли будет их продать (коммерческим будет продукт или совсем наколеночным)? Из неплохо работающих самообучающихся программ перевода посмотрите еще это: https://demo-pnmt.systran.net/production#/translation. Он не во всех темах хорош, но иногда приятно удивляет. Даже соображает какая в исходном тексте сделана опечатка и учтывает это. А в некоторых темах совсем слабый перевод выдает. Это онлайн демо-версия. Теоретически (почитайте) программу можно купить и подключить к CAT. С Memsource у меня это не вышло. Долго переписывалась с теходдержками Memsource и Systran, ничего путного от них не добилась. Они как слепой с глухим :( |
Aiduza, Google Speech API - это не то, что распознает "ОК, Google" )) Это совсем другой движок, и там команд нет, но качество распознавания очень хорошее. |
Хорошо, но вот я зашел на сайт Google Speech API, и слова comma и full stop вполне себе распознаются и превращаются в "," и ".". О чем мы спорим? |
В русском на "запятая" он честно пишет "запятая" ))) |
а у меня и точки и запятые распознал, только слово "сегодня" у него начинается с прописной буквы: Привет, Сегодня дождь и скверно. |
https://translate.google.ru выставил русский язык, нажал на микрофончик. сказал: "мороз и сонце запятая день чудесный точка" получилось: Мороз и солнце, день чудесный. |
DrDIT, возможно, у вас с дикцией проблемы :) |
Dragon покупали, да, и тоже после перехода на Wordfast как-то забыли про него. Тексты по качеству изменились - очень изменились +100500. Некоторое время назад было больше правильных текстов. А из мозга изображения в виде символов пока не скачиваются. Тока если диктовать будешь. Пока так. По поводу нейросети - вам нужно к ученым. Аскер, попробуйте запатентовать и продавать ваши собственные наработки. Насчет заработка. Возможно, придется совмещать эту работу с другой или подумать о другой работе. (Кто знает, если вам переехать в другое место и открыть свой ресторан (языковую школу и т.д.), у вас будет заработок больше? Если хотите оставаться переводчиком - придерживайтесь этого уровня, потому что у вас будут в любом случае затраты энергии для повышения объема. Вам бы сохранить этот уровень, а вы о повышении. Желания берутся не пойми откуда. (Воздействие рекламы?) И если они берутся у ваших близких - отправляйте их на работу. Малыши пока зарабатывать не могут. Через некоторое время вы станете на них тратить больше времени. |
Юрий, в данном случае необходимо правильно ставить цели, куда вы стремитесь. К чему вы, в итоге стремитесь: обрести методику скоростного перевода или материальное благополучие семьи?? Это самое главное. Вселенная щедра и отзывчива, и, как правило, даёт то, что вы просите. Более того, она очень непосредственна: Если вы просите способности быстрого перевода, то вы их получите, но это вовсе не означает, что у вас будет материальное благополучие в семье. Я догадываюсь, что вы на это ответите, но, еще раз: Стремиться - нужно к самой конечной цели. |