HackerNoon — многоязычная платформа: все главные новости теперь доступны на 8 языках

HackerNoon — многоязычная платформа: все главные новости теперь доступны на 8 языках

21 ноября 2022 г.

В настоящее время население Земли составляет около 8 миллиардов человек, так зачем стремиться к тому, чтобы население США составляло всего 331,9 миллиона человек? Что ж, мы просто сделали невозможное, немыслимое и непредсказуемое. В HackerNoon мы хотим (по крайней мере, мы пытаемся) дать каждому на ЗЕМЛЕ, имеющему доступ к Интернету, шанс прочитать соответствующий контент, который перемещая мир.

Что только что произошло?

Мы использовали машинное обучение для перевода всех главных новостей с нашей платформы с английского на испанский, хинди, мандаринский диалект, вьетнамский, < a href="https://hackernoon.com/tagged/hackernoon-fr">французский, португальский и японский. Мы будем продолжать переводить новые предстоящие главные новости. Теперь главные новости будут отображаться на всех этих языках поверх основного изображения.

Кроме того, если вы перейдете на страницу тегов определенного языка, вы заметите, что вся страница будет на этом конкретном языке. Например, https://hackernoon.com/tagged/hackernoon-hi будет отображаться только на определенном языке, в этом случае хинди. Но то же самое и для других языков.

Почему эти языки?

Что ж, благодаря новой системе опросов, созданной Джеферсон, мы смогли спросить пользователей, на каких языках они хотели бы читать истории. Мы также ссылаемся на нашу существующую читательскую аудиторию. Результаты опроса были довольно ясными, поэтому мы решили продолжить. проект. Проверьте результаты прямо здесь: Поскольку мы прислушиваемся к нашим пользователям, мы хотим убедиться, что все, что мы создаем, будет полезным. Таким образом, испанский был переведен первым языком, а затем мы перешли на остальные. Влияние этих переводов было поразительным благодаря количеству новых читателей, которые находят истории о HackerNoon.

Как это было построено?

Мы начали с Google Translation API. Нам очень нравится точность, и с помощью разнообразной команды мы можем проверять контент на большинстве языков. чтобы убедиться, что перевод статей надежен. Увидев простоту API, я думаю, что это был лучший выбор. Мы изучаем различные правила и инструменты для улучшения базового перевода, но в долгосрочной перспективе мы будем делать ставку на то, что сообщество улучшит эти переводы (больше будет позже!). Мы также создали новую базу данных для хранения переведенных статей, чтобы их можно было отличить от оригинального контента, и, конечно, с некоторой корреляцией между ними.

Структура

Самой сложной частью этого проекта было создание платформы, которая каким-то образом загружала статические данные определенной страницы на языке этой конкретной страницы. Идея заключается в том, что если кто-то читает статью на французском, то статические данные (текст, который не изменяется), такие как « новая история» покажет переведенную версию, например «Новую историю», то же самое для других языков.

Есть несколько способов сделать это, я решил просто создать объект для хранения текста на каждом языке, сохранить объект в нашей базе данных, а затем загрузить его через API в зависимости от языка страницы. После того, как статический перевод был сделан, все, что осталось, — это фактически перевести главные новости с помощью сценария. Это был долгий процесс, потребовалось около двух недель, чтобы перевести все истории на все эти языки. Самое приятное то, что все переведенные истории также добавляются на карту сайта HackerNoon с метаданными на языке страницу, которая определенно облегчит обмен опытом. Нравится этот поиск на вьетнамском в Google:

Надеюсь, вам всем понравится читать на своем родном языке, комментировать и комментировать. поделись!


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE