В этом уроке. Я продемонстрирую, как использовать Google Translate API для перевода данных с хинди на английский.

Есть некоторые вещи, которые я хочу прояснить в начале урока. Сначала я бы перевел данные с хинди на английский. Кроме того, я продемонстрирую перевод на фрейме данных Pandas, то есть я переведу весь фрейм данных с хинди на английский. Разве это не здорово? Что ж, приступим. Также вы можете использовать Блокнот Google Colab для ввода кода. Я бы порекомендовал всем полностью изучить документацию Google Translate API для Python, чтобы к тому времени, когда вы начнете писать код, вы, вероятно, уже поймете, что я имею в виду. Это будет легкой прогулкой, потому что вы будете знать большинство терминов во время кодирования.



Откройте свой Google Colab, создайте новый блокнот и назовите его «Google _Translations.ipynb». Прежде чем набирать код, я хочу, чтобы вы, ребята, вручную установили библиотеку Google Translate в записную книжку. Для этого просто введите !pip install googletrans. Эта команда автоматически загружает и устанавливает библиотеку, как показано ниже:

# install googletrans using pip
!pip install googletrans

Импорт необходимых библиотек

На этом этапе мы будем импортировать необходимые библиотеки, которые будем использовать на протяжении всего урока. Библиотека pandas предназначена для хранения данных CSV во фрейме данных. И googletrans, очевидно, используется для перевода, и мы также будем использовать один из его методов, называемый Translator, который вы увидите в следующем руководстве.

# Importing the necessary libraries
import pandas as pd
import googletrans
from googletrans import Translator

Сохранение файла CSV как фрейма данных

На этом этапе мы будем хранить CSV-файл как фрейм данных с помощью pandas. Чтобы получить файл CSV, щелкните ссылку ниже:



После загрузки файла CSV загрузите файл в Google Colab. Слева есть 3 горизонтальные линии, при наведении на них появляется запрос «Показать оглавление». После нажатия перейдите на вкладку «Файлы» и нажмите «Загрузить». Затем загрузите CSV.

Теперь вам нужно прочитать файл CSV и сохранить его во фрейме данных. Для ясности я показываю первые 10 строк фрейма данных.

# Reading and storing the CSV file as a dataframe
df = pd.read_csv('/content/Vegetables_names_in_hindi.csv')
df.head(10)

Создание функции транслятора и перевод фрейма данных

Именно здесь мы фактически переводим фрейм данных с хинди на английский. Исходный код был взят из статьи. Но я внес некоторые изменения кое-где. Чтобы узнать больше о функции перевода, нажмите здесь.



translator = Translator()
translations = {}
for column in df.columns:
    # Unique elements of the column
    unique_elements = df[column].unique()
    for element in unique_elements:
        # Adding all the translations to a dictionary (translations)
        translations[element] = translator.translate(element).text
translations

По сути, я сохраняю все уникальные элементы во фрейме данных, а затем перевожу каждый элемент на английский с помощью функции переводчика (Translator ()). Таким образом, как вы можете видеть из вышеприведенного вывода, все элементы теперь переводятся с хинди на английский, который хранится в словаре.

Замена переведенных слов на исходный фрейм данных

Теперь последний шаг - заменить или сохранить переведенные данные в новый или исходный фрейм данных. Здесь я бы заменил его исходным фреймом данных с помощью функции замены панд.

# Replacing all the translated words from the dictionary to the original dataframe
df.replace(translations, inplace = True)
df.head(10)

Вы успешно перевели данные из файла CSV с языка хинди на английский. В будущем вы можете использовать это руководство в качестве справочника для перевода данных с другого языка на английский по умолчанию. Надеюсь, вы сегодня узнали что-то новое. Если у вас есть какие-либо сомнения по поводу руководства, не стесняйтесь спрашивать в разделе комментариев ниже. А пока увидимся в следующий раз. До свидания.