Створюю інтерпретатор Mash Src

λanguage: Написання парсера

5 квітня 2 хв читати

Написання парсера - це, залежно від мови програмування, досить складне завдання. У сутності, він повинен перетворити фрагмент коду (який ми аналізуємо, розглядаючи символи) у "абстрактне синтаксичне дерево" (AST). AST - це структуроване представлення програми в пам'яті, і воно "абстрактне" в тому сенсі, що не має значення, з яких саме символів складається вихідний код, але вірно відображає семантику програми. Я написав окрему сторінку, щоб описати наше AST.

Наприклад, для такого тексту програми:

sum = lambda(a, b) {
  a + b;
};
print(sum(1, 2));

наш парсер створить наступне AST, як об'єкт JavaScript:

{
  type: "prog",
  prog: [
    // first line:
    {
      type: "assign",
      operator: "=",
      left: { type: "var", value: "sum" },
      right: {
        type: "lambda",
        vars: [ "a", "b" ],
        body: {
          // the body should be a "prog", but because
          // it contains a single expression, our parser
          // reduces it to the expression itself.
          type: "binary",
          operator: "+",
          left: { type: "var", value: "a" },
          right: { type: "var", value: "b" }
        }
      }
    },
    // second line:
    {
      type: "call",
      func: { type: "var", value: "print" },
      args: [{
        type: "call",
        func: { type: "var", value: "sum" },
        args: [ { type: "num", value: 1 },
                { type: "num", value: 2 } ]
      }]
    }
  ]
}

Основна складність у написанні парсера полягає в неправильній організації коду. Парсер повинен працювати на вищому рівні, ніж просте читання символів з рядка. Кілька порад, як не писати спагетті:

Пишіть багато функцій і робіть їх невеликими. В кожній функції виконуйте одну річ і робіть це добре.
Не намагайтеся використовувати регулярні вирази для синтаксичного аналізу. Вони не працюють. Регулярні вирази можуть бути корисними у лексері, але я раджу обмежитися дуже простими речами.
Не намагайтеся вгадати. Якщо ви не впевнені, як парсити щось, викидайте помилку і переконайтеся, що повідомлення про помилку містить місце помилки (рядок/стовпчик).

Щоб спростити код, я розбив його на три частини, які далі розділені на багато невеликих функцій:

Js Javascript Nodejs Парсер Парсинг

Статті про вітчизняний бізнес та цікавих людей:

К
КМДШ@kmds.ua
Як вибрати гурток для дитини: що врахувати, щоб заняття приносили користь і задоволення
Додаткові заняття після школи важливі для розвитку дитини. Вони допомагають розкрити таланти, знайти нові захоплення, навчитися працювати в команді та отримати корисні соціальні навички. Перед батьками постає питання: як обрати для дитини справді цікавий і корисний гурток?
Дата публікації: позавчораЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Гуртки
Lullaby@lullaby.ua
Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці
Mantle вирізняється підходом, рідкісним для догляду за обличчям: замість звичного «anti-age» він говорить про здоров'я шкіри – її бар'єр, рівний тон і сяйво.
Дата публікації: 14 липняЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Mantle
UCloud@ucloud_ua
Хмарні сервіси та їх використання | UCloud
Хмарні сервіси: збереження даних, трансляції, бізнес-програми та освіта. Дізнайтесь, де застосовують хмарні сервіси та як обрати їх для бізнесу.
Дата публікації: 9 липняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Хмарні Сервіси
Design Print UA@designprintua
Як паковання впливає на сприйняття бренду
Паковання давно перестало бути лише способом перенести або захистити товар. Для бізнесу це частина першого контакту з клієнтом: ще до того, як людина оцінить сам продукт, вона вже бачить матеріал, форму, якість друку та загальну подачу.
Дата публікації: 7 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Виготовлення Упаковки
Л
Леруа@leroymerlin.ua
Розкладний садовий стілець: огляд варіантів від «ЛЕРУА МЕРЛЕН» для дачі та тераси
Мобільні розкладні стільці — елемент комфортного відпочинку на відкритій дачній ділянці, терасі, патіо, в альтанці тощо. На відміну від стаціонарних крісел і диванів, це меблі, які легко переносити з місця на місце, ховати в приміщенні від дощу і брати з собою на заміські пікніки
Дата публікації: 3 липняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Садові Меблі

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!

Написати

Romashka@Romashka

Створюю інтерпретатор Mash Src

11Довгочити

316Перегляди

2Підписники

На Друкарні з 16 березня 2024

Більше від автора

Mash Script: Рядки, string
Стаття охоплює різні аспекти роботи з рядками в мові Mash Script, включаючи їхній літеральний запис, методи, рядки-шаблони та інше.
Дата публікації: 19 жовтняЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Mash Script
Mash Script: Оголошення функцій
Ця публікація охоплює основи роботи з функціями в мові програмування Mash Script: оголошення, використання опціональних параметрів, повернення значень, продвинуту типізацію та створення анонімних функцій.
Дата публікації: 16 жовтняЧас на прочитання: 2 хв читати
Теми цього довгочиту:
Mash Script
Mash Script: Базовий синтаксис
Опис базової структури програми написаної мовою Mash Script
Дата публікації: 30 травняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Programming

Це також може зацікавити:

Артем@artem
Як працює Інтернет: інтерактивний урок
Ця стаття допоможе вам зрозуміти основні принципи роботи Інтернету на прикладі створення власного веб-застосунку. Ми розглянемо всі ключові компоненти: клієнт, сервер та їх взаємодію.
Дата публікації: 6 січняЧас на прочитання: 12 хв читати
Теми цього довгочиту:
Інформатика
Владислав Лєсной@unnsin
Мапери, або як написати багато коду заради чистої архітетури
Однією зі спорних тем в Clean Architecture як на мене це мапери. Сьогодні ми подивимось чому вони необхідні(або ні)
Дата публікації: 5 травняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Js
Олександр Козак@kozack
Лише Гуру TypeScript побачать помилку в цьому рядку коду!
Уважно подивіться на наведену нижче TypeScript функцію з одного рядку коду. В ній є проблема пов’язана з типами. Чи можете ви її побачити?
Дата публікації: 19 квітняЧас на прочитання: 2 хв читати
Теми цього довгочиту:
Typescript

Mash Script: Рядки, string

Теми цього довгочиту:

Mash Script: Оголошення функцій

Теми цього довгочиту:

Mash Script: Базовий синтаксис

Теми цього довгочиту:

Статті про вітчизняний бізнес та цікавих людей:

Як вибрати гурток для дитини: що врахувати, щоб заняття приносили користь і задоволення

Теми цього довгочиту:

Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці

Теми цього довгочиту:

Хмарні сервіси та їх використання | UCloud

Теми цього довгочиту:

Як паковання впливає на сприйняття бренду

Теми цього довгочиту:

Розкладний садовий стілець: огляд варіантів від «ЛЕРУА МЕРЛЕН» для дачі та тераси

Теми цього довгочиту:

Більше від автора

Mash Script: Рядки, string

Теми цього довгочиту:

Mash Script: Оголошення функцій

Теми цього довгочиту:

Mash Script: Базовий синтаксис

Теми цього довгочиту:

Це також може зацікавити:

Як працює Інтернет: інтерактивний урок

Теми цього довгочиту:

Мапери, або як написати багато коду заради чистої архітетури

Теми цього довгочиту:

Лише Гуру TypeScript побачать помилку в цьому рядку коду!

Теми цього довгочиту:

Коментарі (1)

Це також може зацікавити:

Як працює Інтернет: інтерактивний урок

Теми цього довгочиту:

Мапери, або як написати багато коду заради чистої архітетури

Теми цього довгочиту:

Лише Гуру TypeScript побачать помилку в цьому рядку коду!

Теми цього довгочиту: