Переводы Со Ссылкой На Источник

Как выглядят переводы? Это документ, составленный на другом сайте, других страницах, но повторяющий последовательность мыслей автора и структуру его текста.

Бывает, что авторский текст меняется, особенно часто это происходит в документации – основном профессиональном использовании переводов, с которым сталкиваются программисты и другие пользователи технических продуктов.

Если привязать перевод к исходному коду статьи, документации или книги так, чтобы скрипт отображения перевода следовал структуре, проверял изменения и отмечал непереведенное, то следить за изменениями в текстах и переводить изменения становится очень легко.

Новые версии текстов не слишком отличаются от старых, а предыдущие переводы остаются частично рабочими.

Сам перевод будет следить за его актуальностью.

Все остальные тексты будут просто слепками, менее ценными, чем перевод, созданный и поддерживаемый таким образом.

Да, скрипт или сервер могут отслеживать их статус, чтобы оперативно сообщать держателям показов об устаревании.

Самородки полезны не только как источник контента для владельцев сторонних ресурсов, но также нужны пользователям для работы в автономном режиме или в составе пользовательских программ.

Но перевод, привязанный к структуре и оформлению оригинала, все равно будет более ценным.

Также это поможет вам отслеживать не копию сайта, а сам оригинальный сайт в случае работы с документацией.

Техническая реализация перевода, привязанная к оригиналу - пользовательские скрипты, дополнения и расширения для браузера.

В худшем случае, если ссылки на текстовые структуры нет, могут показать ссылки на места перевода и использовать в помощь онлайн-переводчики.

Что может быть источником данных для переводов? Уже существующие переводы из разных мест сети и их копии.

Для установления соответствий вам понадобится файл соответствий — та же технология, которая используется в Source Maps. Файлы переписки могут располагаться там же, где и переводы, или в третьих местах.

Наконец, вам нужно место, где хранятся отправные точки — информация о том, где искать данные о переводах и файлах переписки.

Очевидно, это будут каталоги ссылок на необходимые ресурсы.

Пользователь делает копию ссылок и самих ресурсов исходя из своих потребностей.

Очень похожие задачи решают преобразователи представления информации.

Их задача — показывать тесты без переводов, но в другом структурном оформлении (выбирать интересующие новости, как в агрегаторе) и отслеживать изменения в форме подачи информации, чтобы оперативно сообщать о несовместимых форматах и необходимых обновлениях.

Формат представления данных выбирает пользователь — это дополнительная задача по сравнению с отображением переводов строго в рамках форматов сайтов, на которых они сделаны.

Мы получаем структуру работы с Интернетом, отличную от сегодняшней.

Во-первых, вам не обязательно иметь сайты, на которых отображаются переводы новостей и документации.

Информация с таких сайтов очень нужна, но в формате просто данных и структуры оригинала.

На первом этапе их можно использовать для «возврата» переведенной информации на исходные сайты.

В дальнейшем удобно работать с теми ресурсами, которые предоставляют информацию напрямую, без формализации – данными, файлами переписки, данными для контроля структуры оригинала.

Если оригиналы исчезнут из доступа или неожиданно изменят структуру, их информация понадобится для дальнейшего использования, если сама информация актуальна.

Поэтому серверы или отдельные ресурсы копирования выполняют необходимую функцию сети распределенных клиентов, примерно как в P2P, помогают работать в автономном режиме или в интранете и в то же время показывают актуальность той или иной информации – копируется то, что важно.

теми, кто может позволить себе хранить объемы.

Это ничем не отличается от обычного человеческого запоминания информации – исконного свойства мозга, помогающего его носителю выжить в эволюции.

Поэтому сеть передачи данных рассматривается вместе с функциями кэширования и восстановления информации в случае потери первоисточников.

Отдельную функцию представляют системы преобразования представлений.

Насколько они необходимы? С одной стороны, те же переводы на сторонних ресурсах могут нести информацию в своей презентации, и это даже считается хорошим тоном по сравнению с простым копированием дизайна презентаций различных сайтов.

Подходит ли другой дизайн представления для просмотра информационных структур (документация, книги, страницы справки и обсуждения)? Во-первых, оформление оригинала подчеркивает происхождение информации.

Если дизайн не претендует на роль собственного источника информации, то никто не вводится в заблуждение относительно источников.

С другой стороны, несоответствие в дизайне презентаций может мешать увидеть ту общность, которую содержат очень разные источники из разных областей знаний — описания различных API, различные словари и книги по схожим темам.

Лучше, если решение о подаче будет принимать получатель информации – он сможет просмотреть ее как в исходном формате, так и в любом используемом им формате.

Если формат не может отобразить некоторые данные, задача средства отображения состоит в том, чтобы сообщить об этом в формате отображения.

Например, невозможность отображения экзотических плееров и связанных с ними форматов данных или нехватка места для отображения заметок.

Собственные представления также необходимы для тех данных, для которых собственные представления изначально не были предусмотрены.

Типичным примером являются простые списки RSS, но могут быть и сложные картографические данные, изначально не привязанные к какому-либо движку, или просто структура книг и статей, которая выглядит по-разному в разных условиях просмотра.

Во всем этом комплексе задач переводы занимают скромное, но заметное место.

Они необходимы для понимания текстов другими группами читателей.

Они присутствуют везде, где это необходимо, и появляются там, где механизм перевода не предусмотрен.

По сути, это механизм типовой трансформации информационных представлений, к которому следует относиться с таким же должным вниманием, как и к дизайну сайтов.

Однако это ощущается в бэкэнде сайтов, где интернационализация является важной и неизбежной составляющей.

При наличии развитой системы трансформации представлений появляется интересное следствие - интернационализация на сайте становится необязательной, если это делается другой подсистемой, которая сейчас описывается, которую достаточно «натравить» на одноязыковое представление и предоставить форматы с переводами.

Потому что переводы имеют значение только на уровне презентации (иногда да, оформление презентации зависит от длины слов и фраз, но это касается и конкретно презентации).

Систему перевода, как и систему представления, можно удалить из недр архитектуры.

Да, сам сайт может помочь многоязычным пользователям, но для этого не обязательно использовать свой бэкэнд. Чтобы не создавать необходимости установки дополнений (а в будущем это вполне может стать браузерным модулем), сайт сам может поставить необходимые скрипты для отображения переводов и просмотров.



Роль и место поисковых систем

Они тоже работают исключительно с представлениями данных и в определенной степени тянут фронтенд назад, когда определенная масса поисковых систем распознает тексты только в архаичном формате.

Им необходимо обеспечить отображение данных на уровне сайта.

При прогрессивном подходе — поисковая система могла бы сама принимать данные в формате структур — это соответствует тренду отображения и снижает затраты.

Разумеется, только после того, как появятся признанные форматы представления.



Вернемся к нашим переводам

Для встраивания перевода в любой сайт технически необходимы несколько описанных здесь подсистем: анализ структуры данных в представлении сайта; контроль целостности презентации; информирование читателя и переводчика об изменениях; файлы корреспонденции (файлы карт); встраивание текстов вместо оригинальных текстов.

Или вывести собственное представление с генерацией как оригинала, так и перевода заново.

Удобство встраивания в оригиналы заключается в том, что разметка и ссылки автоматически отображаются в отображении и не мешают чтению и переводу, а наоборот подчеркивают и связывают нужные части текстов.

Поддержка ссылок и ударений в сторонних текстах — дополнительная и непрофильная задача для переводчиков, поэтому часто можно увидеть обедненные акцентами переводы, а на реальную поддержку ссылок можно надеяться и того меньше.

Интересно, что при таком подходе можно использовать переводы терминов и сокращений под вкус читателей, поддерживая определенные языки предметных областей.

Например, для неопытных в теме читателей раскройте сокращения.

А для очень опытных читателей включите «удаление воды» из текстов, аналогично тому, как удаляют рекламу.

Ведь семантический анализ — это очень маленький шаг от файлов сопоставления, которые уже будут присутствовать в переводах.

Если кто-то озадачен переводом, то может озадачиться и выделением терминов для создания адаптированных текстов, либо программа может попытаться сделать это автоматически.

Недалеко от этой кухни также расположены системы обучения языкам.

Если система обучения знает уровень подготовки читателя, то она сможет показать или перевести читателю неизвестные термины, чтобы тест сохранил оптимальный для обучения процент неизвестных слов.

Аналогичная проблема существует и в профессиональных знаниях: если новичок читает сложную для него статью, проблема в большом количестве неизвестных терминов и идей.

Адаптированные тексты и учебники могли и даже должны заметить этот момент, узнав от читателя об уровне его знаний (тоже своего рода подшивка из усвоенных им понятий по предметной области, полученных на основе предыдущих уроков и тестов ).

Если читатель не готов учиться из-за принципиальных пробелов (незнания функционального программирования), система советует ему пройти необходимые курсы и показывает их обычный уровень сложности.

Как мы видим, в вопросе о том, иметь или не иметь такую систему перевода, смешивается ряд важнейших для интеллектуальной деятельности человека составляющих приобретения знаний.

Здесь и отголоски семантической паутины, и распространение знаний, и представление данных, и как самая основа — скромная подмена исходных текстов в исходном формате с использованием функций отображения перевода.

Становится совершенно очевидным, что по этому пути пойдут системы просмотра и работы с данными в сети, поэтому стоит задуматься о создании подобных систем перевода.

Теги: #переводы #иностранные языки #новости #новостные ресурсы #Анализ и проектирование систем #Интеллектуальный анализ данных

Вместе с данным постом часто просматривают: