DictionaryForumContacts

 Liudmila Budanitskaya

link 10.10.2017 21:08 
Subject: Off, помогите.SmartCat неправильно посчитал статистику gen.
Добрый вечер!
Может, кто-нибудь сталкивался с такой проблемой.

В нашем бюро переводов решили переходить на работу в SmartCat. Сегодня узнала, что данные статистики по проекту, которую строит SmartCat, будут учитываться при оплате за страницу (имеется в виду количество повторов, количество фрагментов, которые на 50 - 70%, 70-100%, 101% и 102% соответствуют имеющимся в памяти переводов).

Сама я уже давно работаю в этой системе. Проблема в том, что у меня имеются веские сомнения в правильности расчета статистики. Например, в файле практически полностью отсутствуют повторы, каждое предложение совершенно новое, а SmartCat выдает, что 99,7% слов - это 102% соответствие. Может, это я что-то неправильно считаю?
***
У меня есть некоторые предположения, может быть, это зависит от того, какая память переводов поставлена на запись в настройках по проекту или что-нибудь в этом роде?

Буду благодарна за любые советы, помощь и т.д.

 Bogdan_Demeshko

link 11.10.2017 7:47 
Смарткат нормально считает статистику. "99,7% слов - это 102%" - причем тут повторы? Это совпадения с ТМ же, которую к проекту подключили (или с несколькими ТМ). Или там в документе у вас куча цифр.

 Liudmila Budanitskaya

link 11.10.2017 8:56 
На повторы забейте. Дело в том, что SmartCat подтверждает фрагмент, сохраняет его в базе, а потом выдает для 99,7% фрагментов соответствие с базой на 102%. Получается, эта цифра зависит от того, какие базы подключат там. Мне в принципе все равно, но то, что по этому будут считать оплату за работу, как-то настораживает.

Наверное, это я чего-то недотумкиваю, ведь SmartCat - большая система, ею много кто пользуется, если бы такие проблемы были, стало бы известно.

 Bogdan_Demeshko

link 11.10.2017 11:02 
если вы перевели весь файл, и все сегменты сохранены в ТМ, а статистику вы решили посчитать именно после того, как вы все перевели, то смарткат покажет, примерно то, как у вас, что типа весь (почти) файл состоит из 102%, потому что все сегменты уже в ТМ есть, и анализ статистики будет делаться по текущему состоянию ТМ (в которой уже есть весь ваш перевод), как было до начала перевода - теперь вы не узнаете :) это недоделка. которой кстати нет в мемсорсе, например.

 Liudmila Budanitskaya

link 11.10.2017 12:53 
То есть, кажется, я поняла. Получается, Смарткат не считает статистику правильно ни до начала работы, ни после ее завершения.

До начала работы: система сравнивает файл с имеющимися в базе переводами. Получается, она не учитывает внутрифайловые соответствия на 50 -99%. То есть их в базе просто нет, те переводы, по отношению к которым система сделает такой вывод, появятся в памяти переводов позже.

После окончания работы: она считает, что заново переведенные фрагменты соответствуют имеющимся в базе на 101 - 102%. Т.е., опять неправильно.

По моим наблюдениям, если строить статистику на протяжении работы над проектом, статистика просто "скачет".

 Bogdan_Demeshko

link 11.10.2017 13:54 
Так точно. Считает-то он ее очень даже правильно, но каждый раз, по мере делания перевода, цифры будут получаться разные, потому что подсчет всегда по текущему состоянию ТМ на момент подсчета, а не по ее состоянию на момент начала работы (понятно, что кол-во повторов не меняется, а меняется количество совпадений с ТМ, стремясь к ста процентам контекстных (102%-х) совпадений). И в итоге, когда перевод закончен, если посчитать статистику, то получиться, что весь ваш файл на 100% состоит из контекстных совпадений (102%-х), ну или почти на 100%, что у вас и получилось. Смарткату еще есть над чем работать.

 

You need to be logged in to post in the forum

Get short URL