metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2013-08-08 12:04 pm

Американский Legalese

Читаю дикий 13-страничный юридический документ на английском.
Ну, то что там завороты, с которыми не сравнится ни одно собрание сочинений ленина или научная работа младшего научного сотрудника НИИГиТ - это привычно, хер с ним.
А вот то, что там есть словосочетания, которые не знает даже гугл - это уже явный перебор.

Например слово "Third Pam Information". Сколько не ищи - единственное, что гугл находит - явно ошибочно отсканированные документы где имелось в виду явно "Third Party Information".
Например: https://www.otciq.com/otciq/ajax/showFinancialReportById.pdf?id=39085 - гугл видит этот документ по ключевой фразе, но внутри там вот что:

В каком-то из шрифтов слов Party однозначно портит голову OCR, а лоеры или сами не читают свои документы (что более вероятно) или боятся признаться, что не знают этого термина.

[identity profile] osdm.livejournal.com 2013-08-08 02:52 pm (UTC)(link)
Про неправильное сканирование. Недавно читал про феерический баг Xerox-овского сканера, когда в результате слишком агрессивного алгоритма компрессии изображений в документе подменялись буквы и цифры, причем на выходе получался вполне красивый и читаемый документ, только некоторые буквы и цифры другие. http://www.dkriesel.com/en/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning

Это случайно не ваш случай?