Нічний читач

Як перетворити числа зі словесної форми у числову за допомогою numerizer?

11 серпня 5 хв читати

Зміст

Встановлення
Використання
Вдосконалення функції numerizer()
Висновок

У сьогоднішній статті предметом нашого огляду буде невеличка бібліотека під назвою numerizer, яка дозволяє перетворювати числа зі словесної у числову форму.

Встановлення

Windows:

pip install numerizer

MacOS:

pip3 install numerizer

Linux:

pip install numerizer

Використання

Отже, бібліотека numerizer має функцію numerize(). Саме функція numerize() і перетворює числа зі словесної форми у числову.

Тож, імпортуємо бібліотеку та дивимося на приклад:

import numerizer

text = "Twenty-four"
print(numerizer.numerize(text))

Тобто ми передали функції numerize() рядок “Twenty four“ (“Двадцять чотири“) та отримали результат у вигляді цілого числа. Але якщо ми спробуємо визначити, який тип даних має наш результат — результат буде str, тобто результат залишається рядком. Перевіримо це на практиці:

text = "Twenty-four"
numerize_text = numerizer.numerize(text)

print(type(numerize_text))

<class 'str'>

Тобто функція numerize() не змінює тип даних.

Тепер чудово було б навести ще приклади використання даної функції:

Приклад 2:

text = "Five hundred and forty three"
numerize_text = numerizer.numerize(text)

print(numerize_text)

Приклад 3:

text = "Twenty-one million forty-two thousand seven hundred and sixty-three"
numerize_text = numerizer.numerize(text)

print(numerize_text)

21042763

Приклад 4:

text = "Seven and two quarters"
numerize_text = numerizer.numerize(text)

print(numerize_text)

7.5

Важливий факт: numerize() не розпізнає роздільник point для виведення десятих. Тобто коли ми, наприклад, захочемо перетворити рядок “Seven point thirty“ на 7.30, то ми не зможемо цього зробити. Ось приклад такого намаганняя у коді:

text = "Seven point thirty"
numerize_text = numerizer.numerize(text)

print(numerize_text)

7 point 30

Вдосконалення функції numerizer()

Тепер пропоную дещо усунути проблему із роздільником point. Отже, зробимо оновлену функцію, яка б мала всі ті ж функції, що й numerize(), але підтримувала роздільник point. Тож, спочатку конкретезуємо, які дії нам треба виконати у коді, щоб отримати підтримку роздільника point.

По-перше, нам треба замінити слово point на крапку. З цим завданням ми можемо впоратися за допомогою методу replace(), який якраз таки і заміняє потрібну нам частину рядка на вказаний нами символ.

По-друге, прибрати зайві пробіли між числами. Це можна зробити за допомогою того, що ми перетворимо рядок, який ми отримаємо у якості параметра у список. Таким чином ми просто зможемо видалити порожні елементи з новоствореного списка та повернути результат назад до рядкового типу даних.

Тож, тепер дещо модифікуємо функцію numerize(), а саме створюємо нову функцію — modificated_numerize().

Ось код нашої функції:

text = "Seven point thirty"


def modificated_numerize(text):
    totally_modified = None

    numerize_text = numerizer.numerize(text)
    replaced_point = numerize_text.replace("point", ".")
    listed_text = list(replaced_point)

    for i in listed_text:
        if i == " ":
            space_index = listed_text.index(i)
            listed_text.pop(space_index)

        elif " " not in listed_text:
            totally_modified = "".join(listed_text)

    return totally_modified


print(modificated_numerize(text))

7.30

І у підсумку отримали 7.30 як бажаний результат. Тепер пропоную розібрати цей код з поясненнями як він працює.

Розбір коду:

Перший етап. Визначаємо функцію та створюємо для неї параметр text, щоб ми потім могли вказати наш рядок у якості параметра.

Другий етап. Визначаємо змінну totally_modified, яка у майбутньому буде зберігати наш кінцевий результат, а зараз вона просто зберігає порожній рядок.

Третій етап. Використовуємо функцію numerize(), щоб перетворити словесний формат чисел у числовий. Результат роботи функції зберігаємо у змінній numerize_text. Тобто, якщо зараз абстрагуватися від всього іншого коду і залишити тільки numerize(), то ми отримаємо результат 7 point 30.

Четвертий етап. Визначаємо змінну replaced_point та зберігаємо туди наш попередній результат тільки з крапкою замість слова point. Тобто ми отримали “7 . 30” у результаті. Ми досягли цього за допомогою методу replace(), який отримав слово, яке треба замінити, та символ, на який ми хочемо замінити слово. У нашому випадку нам треба замінити слово point на крапку, звідси і такий запис replace(“point“, “.“).

П’ятий етап. Перетворюємо рядок на список. У такому разі кожен символ у рядку буде окремим елементом списку і пусті рядки також.

Шостий етап. Тут ми створюємо цикл for у якому проходимося по кожному елементу нещодавно створеного списку listed_text. Цей цикл має у собі дві умови if i == " " та if " " not in listed_text. Перша умова перевіряє кожен елемент на те, чи є він порожнім рядком, якщо так, то ми знаходимо індекс цього елемента у списку і видаляємо його зі списку за допомогою методу pop(). Якщо ж у списку більше немає жодного елемента, який був би порожнім рядком, то ми просто приєднуємо список до рядка і зберігаємо його у змінній totally_modified. Варто зазначити одну важливу річ, приєднуючи список до рядка ми тим самим ніби конвертуємо список у рядок. Тобто на виході ми отримаємо результат типу str.

Сьомий етап. Повертаємо змінну totally_modified.

Висновок

У цій статті ми познайомилися з бібліотекою numerizer, ознайомилися з функцією numerize(), створили на її основі власну вдосконалену функцію modificated_numerize() та детально розібрали її код. Сподіваюся, що вам сподобався цей матеріал і ви дізналися щось нове для себе. Дякую за увагу!

It Програмування Пайтон

Статті про вітчизняний бізнес та цікавих людей:

Вчасно.Каса@kasa.vchasno.com.ua
Як працює розподіл оплати між готівкою та карткою в одному чеку
Чи можна поєднувати готівку та оплату карткою в одному чеку, як це працює в ПРРО та яких помилок варто уникати
Дата публікації: 12 год томуЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Прро
К
КМДШ@kmds.ua
Як вибрати гурток для дитини: що врахувати, щоб заняття приносили користь і задоволення
Додаткові заняття після школи важливі для розвитку дитини. Вони допомагають розкрити таланти, знайти нові захоплення, навчитися працювати в команді та отримати корисні соціальні навички. Перед батьками постає питання: як обрати для дитини справді цікавий і корисний гурток?
Дата публікації: 6 дн. томуЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Гуртки
Lullaby@lullaby.ua
Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці
Mantle вирізняється підходом, рідкісним для догляду за обличчям: замість звичного «anti-age» він говорить про здоров'я шкіри – її бар'єр, рівний тон і сяйво.
Дата публікації: 14 липняЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Mantle
UCloud@ucloud_ua
Хмарні сервіси та їх використання | UCloud
Хмарні сервіси: збереження даних, трансляції, бізнес-програми та освіта. Дізнайтесь, де застосовують хмарні сервіси та як обрати їх для бізнесу.
Дата публікації: 9 липняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Хмарні Сервіси
Design Print UA@designprintua
Як паковання впливає на сприйняття бренду
Паковання давно перестало бути лише способом перенести або захистити товар. Для бізнесу це частина першого контакту з клієнтом: ще до того, як людина оцінить сам продукт, вона вже бачить матеріал, форму, якість друку та загальну подачу.
Дата публікації: 7 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Виготовлення Упаковки

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!

Написати

Magnifique numérique@nocturnal_reader

Нічний читач

88Довгочити

1.7KПерегляди

27Підписники

Підтримати

На Друкарні з 14 липня 2025

Більше від автора

Метод find() у Python
У цій статті ми розберемо призначення та застосування методу find() у Python.
Дата публікації: 16 липняЧас на прочитання: 2 хв читати
Теми цього довгочиту:
Програмування
Новина блогу Magnifique numérique
У проєкту Magnifique numérique тепер з'явився власний сайт, де будуть викладатися усі нові статті.
Дата публікації: 13 липняЧас на прочитання: 1 хв читати
Теми цього довгочиту:
It
Цикл статей з мови SQL у базах даних SQLite
Тут будуть зібрані посилання на усі статті про мову SQL. Дана стаття буде доповнюватися з виходом нових статей на цю тематику.
Дата публікації: 12 липняЧас на прочитання: 1 хв читати
Теми цього довгочиту:
Програмування

Це також може зацікавити:

Вадим Головченко@v.golovchenko.dbai
Параметри сеансу в BAF: технічний огляд
Трішки подушнимо. Детальний розбір параметрів сеансу в BAF: архітектура, взаємодія з кластером серверів, проблеми множинних сеансів
Дата публікації: 11 червняЧас на прочитання: 8 хв читати
Теми цього довгочиту:
Програмування
Артем@artem
Висновки першої конференції AI Codecon
Завершує “трилогію” публікацій Тіма О’Рейлі про “вайб-кодінг“ та ШІ-асистоване програмування переклад статті "Takeaways from Coding with AI" про результати конференції AI Codecon.
Дата публікації: 18 травняЧас на прочитання: 10 хв читати
Теми цього довгочиту:
Вайб-кодінг
Негатив@negativo_ua
Посібник цілковитого початківця з комп'ютерів і програмування (переклад)
Про архітектуру комп'ютера та основи програмування для цілковитих початківців.
Дата публікації: 20 липняЧас на прочитання: 18 хв читати
Теми цього довгочиту:
Програмування

Метод find() у Python

Теми цього довгочиту:

Новина блогу Magnifique numérique

Теми цього довгочиту:

Цикл статей з мови SQL у базах даних SQLite

Теми цього довгочиту:

Встановлення

Використання

Вдосконалення функції numerizer()

Висновок

Статті про вітчизняний бізнес та цікавих людей:

Як працює розподіл оплати між готівкою та карткою в одному чеку

Теми цього довгочиту:

Як вибрати гурток для дитини: що врахувати, щоб заняття приносили користь і задоволення

Теми цього довгочиту:

Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці

Теми цього довгочиту:

Хмарні сервіси та їх використання | UCloud

Теми цього довгочиту:

Як паковання впливає на сприйняття бренду

Теми цього довгочиту:

Більше від автора

Метод find() у Python

Теми цього довгочиту:

Новина блогу Magnifique numérique

Теми цього довгочиту:

Цикл статей з мови SQL у базах даних SQLite

Теми цього довгочиту:

Це також може зацікавити:

Параметри сеансу в BAF: технічний огляд

Теми цього довгочиту:

Висновки першої конференції AI Codecon

Теми цього довгочиту:

Посібник цілковитого початківця з комп'ютерів і програмування (переклад)

Теми цього довгочиту:

Коментарі (0)

Це також може зацікавити:

Параметри сеансу в BAF: технічний огляд

Теми цього довгочиту:

Висновки першої конференції AI Codecon

Теми цього довгочиту:

Посібник цілковитого початківця з комп'ютерів і програмування (переклад)

Теми цього довгочиту: