Перейти к содержимому

Как создать свой язык программирования

  • автор:

Как создать свой язык программирования? Теория и практика

Как создать свой язык программирования? Теория и практика

Создание языка программирования очень сложная задача, но выполнимая. Мы расскажем основные факторы при создании своего первого языка.

Желание создать что-то своё и оставить след в истории посещает всех людей, в том числе программистов. Создание собственного языка программирования – это подходящая возможность. Мотивы бывают различные: от нечего делать, решения вечных проблем в других языках, разработка комфортного варианта для себя.

Создание языков – это посильная задача, которую может выполнить читатель, руководствуясь пошаговым алгоритмом из 12 этапов. Вероятно, что именно за вашим языком будущее.

Статья содержит специфические термины, без понимания которых не обойтись: лексеры, парсеры, интерпретаторы, компиляторы, деревья синтаксиса и остальное. Значительно проще вникнуть в суть, черпая информацию из интернета или при совместном изучении данных с опытным программистом. Базовые понятия терминологии – это фундаментальная величина для создания своего языка программирования.

Изучение компьютера

Это совет и необходимость одновременно, знание операционных систем поможет работать, изучать новые языки, стать на путь программиста. Невозможно создать быстрый, качественный и многофункциональный язык без понимания способа преобразования кода и его обработки. Познание функционирования системной машины – это обязательный этап дальнейшего развития.

Зачем вам новый язык программирования?

Заранее определитесь с предназначением языка. Существует 2 основных направления – универсальный инструмент или узкоспециализированное решение.

Востребованными оказываются языки с обоих направлений, но более популярны универсальные. Учтите, что многофункциональные языки требуют больше времени и усилий, а также у них множество конкурентов.

Сейчас стоит оценить количество предстоящей работы, установить цели и желания. Немаловажно определиться, вы планируете стать знаменитостью, а язык должен стать одним из лучших, или вам достаточно интересно провести время и расширить мировоззрение?

Каких концепций будет придерживаться новый язык?

На этапе планирования следует ответить на ряд ключевых вопросов, они зададут направление развития:

  • интерпретация или компиляция? Код для компилирования будет преобразовываться в машинный, затем исполняться. При использовании интерпретатора код обрабатывается построчно. На вопрос нет правильного ответа, перед разработчиком стоит сложный выбор, в какую сторону уклон делать: функциональность, безопасность, скорость работы, удобство и т. д.;
  • типизация? Если да, то разработчику будет необходимо вручную устанавливать типы данных. В противном случае придётся описывать систему, которая будет определять типы;
  • в языке будет встроен автоматический алгоритм очистки мусора или управление отдать в руки пользователя?
  • планируемая модель языка программирования: структурное, ООП, функциональная логика. Кто знает, может вам удастся разработать что-то совсем иное;
  • как язык будет себя вести в отношении конкурентов, вставка из других языков планируется? Учитывать этот аспект важно при изначальной разработке языка;
  • планируется поддержка базового функционала языка или передать все функции на сторону фреймворков?
  • какой ожидается конечный вид архитектуры программы?

Последовательно отвечая на поставленные вопросы, в голове начнёт формировать облик детища, но появятся и другие вытекающие вопросы, требующие ответов.

Придумайте синтаксис для языка

При использовании особых символов можно существенно упростить работу компьютеру и повысить производительность кода. Недостатком является отталкивание нового пользователя. Подобный выбор стоит в отношении функций: либо элементарные и понятные, либо максимально информативные.

При этом синтаксис может быть каким вы только сами захотите. К примеру, существует язык от отечественных разработчиков, который называется YoptaScript . Он имеет очень забавный синтаксис и писать программы на нем приносит лишь смех 🙂

PS: этот язык является лишь шуткой и его не стоит воспринимать как реальный язык. Посмотреть язык вы можете на их официальном сайте .

Назовите ваше детище

Вопрос с одной стороны простой, с другой – нет. Многие разработчики не выбирают глубокое и замысловатое название, отдают предпочтение простоте и лёгкости запоминания. Особенно эффективно давать имя языку с явной ассоциацией, чтобы потенциальный пользователь запоминал название после первого-второго произнесения. Сложные аббревиатуры и названия из 3 и больше слов – сложно запоминаются и быстро теряются в памяти. Имя должно быть относительно коротким и запоминающимся.

Выберите фундамент языка

Выбор языка, который будет взят за основу – это важнейший шаг. Если знаний достаточно, можно писать на ассемблере или даже машинном коде, но в современном мире лучше присмотреться к другим высокоуровневым языкам: C, C++ , Swift , Pascal и другие компилируемые варианты пригодные для интерпретируемых решений. В качестве достойных языков с интерпретаторами стоит присмотреться к: Java , JavaScript , Ruby, Python – для компиляторов. Перечисленные пары снизят потерю скорости работы.

Лексер и парсер

Лексер – это инструмент для анализа лексики, деления написанного кода на отдельные элементы, их называют токены. Далее вступает в работы парсер для синтаксического анализа, его роль – организация иерархии с учётом токенов, он восстанавливает цепь событий. В качестве графического примера рассмотрим простую схему:

Пугаться не стоит, так как уже есть готовые библиотеки для быстрого формирования лексеров и парсеров. Приложения упростят выполнение сложного этапа работы.

Создание основной библиотеки

Независимо от наличия встроенных возможностей в языке для работы с элементарным функционалом или максимального использования внешних библиотек, потребуется создание функций. Они помогут продемонстрировать возможности хотя бы очень базисно.

Создание и написание тестов

Процесс создания в большей мере сводится к оттачиванию работы, так как сформировать нормально работающий язык весьма сложно. Задача разработчика – выявить работоспособность встроенных элементов и механизмов их взаимодействия, здесь на помощь приходят тесты. По результатам тестирования делается вывод о недопустимом и разрешённом синтаксисе и сочетании функций. Возможно удастся расширить функционал языка.

Выпуск языка в свет

После завершения работы обязательно следует загрузить язык в сеть. Здесь вы найдёте единомышленников и людей, которые помогут совершенствовать детище. Публикация – это логическое завершение процесса, не стоит прятать работу в ящик, поделитесь ей.

Больше интересных новостей

10 перспективных IT-профессий ближайших лет

10 перспективных IT-профессий ближайших лет

Введение в Python: Основы и ключевые черты языка

Введение в Python: Основы и ключевые черты языка

Делаем Google Chrome красивым / Кастомизация, оформление и плагины

Делаем Google Chrome красивым / Кастомизация, оформление и плагины

Какие языки программирования через 10 лет потеряют востребованность?

Какие языки программирования через 10 лет потеряют востребованность?

Комментарии (2)

Хёни(талшын) 20 февраля 2023 в 18:00

Я буду создать свою языку

Сергей 24 декабря 2022 в 18:22

Создаем свой язык программирования

До этого в своей работе мы использовали только один язык программирования — Python, но, как вы догадывайтесь, их гораздо больше.

Сегодня мы поговорим о том, какие бывают языки программирования, как они функционируют и даже попробуем придумать собственный. В общем, материала много, должно быть интересно.

Сколько существует языков программирования?

Сколько существует языков программирования? Это сложный вопрос, скорее всего — более 500. Многие из них создаются в процессе учебы/для развлечения. Многие использовались раньше, но сейчас мало популярны.

  • https://www.quora.com/How-many-programming-languages-are-there-in-the-world — сколько есть языков программирования?
  • https://en.wikipedia.org/wiki/List_of_programming_languages — список существующих языков программирования

Горадо более интересен вопрос, какие из них наиболее популярны. Определить это можно по разному: например, можно подсчитать на скольких страницах в интернете упоминается язык, так делает рейтинг TIOBE — https://www.tiobe.com/tiobe-index/.

Другой способ — подсчитать количество кода на разных языках в проектах с открытым исходным кодом, так, например, делает рейтинг GitHub (платформа для хранения кода и командного взаимодействия программистов) — https://tproger.ru/articles/github-top-10-languages-2017/.

Несмотря на то, что позиции языков в разных рейтингах различны и меняются со временем, основные действующие лица достаточно стабильны. Далее мы обсудим эти языки более подробно.

Классификация языков программирования

Общепринятой классификации языков программирования на данный момент не существует, но можно выделить некоторые ключевые отличия.

Примеры кода в разных языках программирования: http://cs.lmu.edu/~ray/notes/pltypes/

  1. Как мы замечали ранее, существуют языки низкого и высокого уровня. Языки низкого уровня (ассемблеры) позволяют напрямую отправлять команды процессору, а языки высокого уровня (все остальные языки) писать понятный человеку код одновременно для большого числа устройств.
  2. Языки различаются по назначению. Языки общего позволяют решать практически любые задачи (например, python или Java), а специализированные языки служат конкретным целям. Например, язык PostScript используется для программирования заданий для принтера (печать изображений), а язык SQL — для запросов к реляционным базам данных.
  3. Языки различаются по модели выполнения. Программу на компилируемом языке (C, C++, Pascal. ) перед запуском необходимо скомпилировать — транслировать (перевести) в машинный код. На выходе получится бинарный файл (.exe в windows).

Интепретируемые языки (PHP, Perl, отчасти python) для запуска используют специальную программу — интерпретатор, которая в реальном времени исполняет команды, описанные в коде. Например, для запуска программы на питоне, в системе должен быть установлен питон.

Сейчас большинство таких языков альтернативно могут использовать JIT-компиляцию (Just In Time компиляция — методика, которую изначально используют Java и C#). Программа перед запуском транслируется в промежуточное представление — байт-код, который похож на ассемблер, но не привязан к конкретному процессору. Трансляция в машинный код происходит непосредственно в процессе работы программы. Это позволяет совместить портируемость интерпретируемых языков (один код работает везде, если есть интерпретатор) со скоростью компилируемых (скомпилированная программа работает на конкретной платформе, но очень быстро).

  1. Ну и, конечно, парадигма программирования — это общий подход к составлению программ. Большинство современных языков поддерживают разные стили написания кода — они мультипарадигмальны. В данный момент мы используем процедурный стиль программирования (программа = блок-схема), а в следующем семестре рассмотрим и другие подходы — ООП и функциональное программирование.

Самые популярные языки

Вернемся к списку самых популярных языков от GitHub.com и рассмотрим их подробнее.

№1 JavaScript

Главный герой списка прошел долгий путь от обычного интерпретируемого языка для оживления веб-страниц, который выполняется в браузере (интерпретатор js встроен во все современные браузеры) до языка, который сейчас используется повсеместно.

Главная причина — это, конечно, повсеместное распространие веб-сервисов. На Javascript по прежнему пишется фронтенд в интернете, но теперь это уже большие самостоятельные приложения, такие, как фронтенд ВК или Gmail. Для упрощения таких задач существуют большие фреймворки, такие, как JQuery, AngularJS, React. NodeJS теперь позволяют писать на js не только фронтенд, но и серверную часть сайтов.

Но настоящий бум произошел, когда большое распространение получили веб-сервисы, замаскированные под офлайновые приложения. В мобильном приложении на весь экран запускается браузер в котором отображается веб-страница, внешне неотличимая от настоящего приложения. В мобильных приложениях для этого используются фреймворки Apache Cordova, Ionic, React Native. Для настольных приложений используется Electron.

Пример кода:

  
№2 Python

С питоном вы уже неплохо знакомы — это JIT-компилируемый язык общего назначения. Второе место по популярности занимает благодаря простоте синтаксиса и огромной библиотеке доступных модулей в любой области.

На питоне очень удобно писать произвольные настольные и серверные программы. На данный момент есть проблема с мобильными приложениями, но есть способы ее обойти, например Kiwi.

№3 Java

Классический пример объектно-ориентированного JIT-компилируемого промышленного языка. В основном используется в мобильных приложениях (Android), кроссплатформенных настольных приложениях и веб-сервисах (например, банковских системах).

Пример кода:

public class SimpleIfElseStatementExample < public static void main(String[] args) < int i = 0; if(i == 0) System.out.println("i is 0"); else System.out.println("i is not 0"); >>
№4 Ruby

По сфере применения и принципу работы похож на python. Подробнее — https://ru.wikipedia.org/wiki/Ruby. Наиболее известен, как язык для построения веб-сервисов, благодаря фреймворку Rails.

Пример кода:

a = [ 45, 3, 19, 8 ] b = [ 'sam', 'max', 56, 98.9, 3, 10, 'jill' ] print (a + b).join(' '), "\n" print a[2], " ", b[4], " ", b[-2], "\n" print a.sort.join(' '), "\n" a 
№5 Go

Компилируемый многопоточный язык от Google - https://ru.wikipedia.org/wiki/Go

№6 PHP

PHP - это изначально и до сих пор главный язык в вебе. Его основная задача - написание кода для серверной части веб-сервисов.

Пример кода:

№7-8 C/C++

Классические компилируемые языки, которые позволяют как работать с железом на низком уровне для написания драйверов и операционных систем, так и на высоком, для разработки прикладных приложений, например, используя Qt или Windows Forms.

#include #include // для system using namespace std; int main() < cout 
№9 Typescript

Объектно-ориентированный аналог Javascript от Microsoft, который транслируется в него. Сфера применения - аналогична.

№10 С Sharp

С# - это изначально аналог Java от компании Microsoft. На этом объектно-ориентированном (это парадигма) JIT-компилируемом языке общего назначения можно писать программы для платформ Microsoft: настольные приложения для Windows и Windows Phone, веб-сервисы на ASP.MVC, игры на Unity.

Сейчас Microsoft активно продвигает решения для запуска программ на C# на других платформах (.NET Core, Mono), а также решения для разработки кроссплатформенных мобильных приложений на этом языке - Xamarin.

Пример кода:

using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace check1 < class Program < static void Main(string[] args) < int i; Console.Write("Enter a Number : "); i = int.Parse(Console.ReadLine()); if (i % 2 == 0) < Console.Write("Entered Number is an Even Number"); Console.Read(); >else < Console.Write("Entered Number is an Odd Number"); Console.Read(); >> > >

Изотерические языки программирования

Изотерические языки программирования - это отдельный класс языков, которые разработаны либо с целью изучения границ возможностей разработки языков, либо, в качестве шутки.

Обычно такие языки состоят всего из нескольких команд, однако полны по Тьюрингу, т.е. теоретически позволяют написать произвольную программу.

Наиболее известный изотерический язык - Brainfuck - состоит всего из восьми операций, которые обозначаются знаками арифметических операций и скобочками.

Другой пример - язык Petooh - состоит из криков петуха.

Свой язык программирования

Принцип работы

Если языков так много, то почему бы не придумать свой?

В таком случае перед нами встает две проблемы: язык нужно придумать, а затем написать для него транслятор.

Даже если мы придумаем идеальный язык, без транслятора никто не сможет написать программу на нем. К задаче написания транслятора есть два подхода:

  1. Написать транслятор в машинный код. Это задача выполнимая, но на нашем уровне - очень сложная. Если вам интересна эта тема, можно начать копать здесь и здесь.
  2. Написать транслятор в другой язык, для которого уже существует транслятор в машинный код. Например, транслировать наш язык в питон или яваскрипт. Так работают Petooh (транслируется в десяток языков), язык для реальных пацанов (транслируется в javascript) и, разработанный авторами этого курса, язык pithon [писон] (транслируется в python).

Второй вариант выглядит гораздо доступнее, поэтому выбрать на этом этапе предлагается именно его. Транслировать мы будем, конечно, в python.

Требования к языку

Чтобы языком можно было пользоваться, он должен поддерживать достаточное количество операций, включая:

  • определение переменных
  • операции с переменными
  • условный оператор, логические операции
  • циклы

Для каждой из этих операций можно придумать свое название и синтаксис, но, учитывая необходимость трансляции, старайтесь всегда держать в голове процесс преобразования вашего языка в Python.

В самом простом случае в вашем языке можно просто переназвать все команды, а в процессе трансляции использовать replace для замены на команды из питона.

Как написать свой язык программирования

Вячеслав Слинько

Веб разработчик вот уже 10 лет. Начинал по классике, с бекенда на PHP. Постепенно расширял кругозор: пробовал разные языки и технологии, занимался DevOps и поднимал сервера, управлял проектами и собирал команды. Последние 4 года акцентирую свое внимание на front-end и на работе с командами. Работаю в компании ЦИАН руководителем группы front-end разработки.

Разрабатывал транспиляторы для ES6, когда babel еще не существовал. Создавал собственные языки программирования (на поиграть) и DSL (для работы). Сейчас работаю над оптимизирующем компилятором для React и TypeScript.

У каждого программиста рано или поздно появляется желание создать собственный язык программирования 🙂 У меня это желание появилось несколько лет назад и тогда я не знал с чего начать.

На этом мастер-классе я хочу концентрированно поделиться своим опытом и показать вам на примерах, как сделать так, чтобы из исходного кода придуманного вами языка получилась работающая программа.

После мастер-класса вы будете обладать всеми знаниями, чтобы быстро продолжить свое погружение в удивительный и интересный мир языков программирования. Также эти знания позволят вам лучше понимать то, что происходит под капотом у тех языков программирования, которые вы используете каждый день.

На мастер-классе мы создадим простейший интерпретируемый язык и пройдем через несколько этапов:

- Как прочитать исходный файл (токенизация);
- Как понять, что написано в исходном файле (парсинг);
- Как из исходного файла сделать исполняемый код (компиляция);
- Как запустить исполняемый код (интерпретация).

Бонус темы:
- Как оптимизировать исполняемый код (оптимизация);
- Как проверить валидность кода (статический анализ).

В работе будем использовать JavaScript, потому что это самый общеизвестный язык программирования в веб отрасли. Подготовьтесь заранее и установите себе на компьютер стабильную LTS версию Node.js (>=6.10.0 <7.0.0).

Как создать свой язык программирования: теория, инструменты и советы от практика

Обложка поста Как создать свой язык программирования: теория, инструменты и советы от практика

На данный момент этот блок не поддерживается, но мы не забыли о нём! Наша команда уже занята его разработкой, он будет доступен в ближайшее время.

На протяжении последних шести месяцев я работал над созданием языка программирования (ЯП) под названием Pinecone. Я не рискну назвать его законченным, но использовать его уже можно — он содержит для этого достаточно элементов, таких как переменные, функции и пользовательские структуры данных. Если хотите ознакомиться с ним перед прочтением, предлагаю посетить официальную страницу и репозиторий на GitHub.

Введение

Я не эксперт. Когда я начал работу над этим проектом, я понятия не имел, что делаю, и всё еще не имею. Я никогда целенаправленно не изучал принципы создания языка — только прочитал некоторые материалы в Сети и даже в них не нашёл для себя почти ничего полезного.

Тем не менее, я написал абсолютно новый язык. И он работает. Наверное, я что-то делаю правильно.

В этой статье я постараюсь показать, каким образом Pinecone (и другие языки программирования) превращают исходный код в то, что многие считают магией. Также я уделю внимание ситуациям, в которых мне приходилось искать компромиссы, и поясню, почему я принял те решения, которые принял.

Текст точно не претендует на звание полноценного руководства по созданию языка программирования, но для любознательных будет хорошей отправной точкой.

Первые шаги

«А с чего вообще начинать?» — вопрос, который другие разработчики часто задают, узнав, что я пишу свой язык. В этой части постараюсь подробно на него ответить.

Компилируемый или интерпретируемый?

Компилятор анализирует программу целиком, превращает её в машинный код и сохраняет для последующего выполнения. Интерпретатор же разбирает и выполняет программу построчно в режиме реального времени.

Технически любой язык можно как компилировать, так и интерпретировать. Но для каждого языка один из методов подходит больше, чем другой, и выбор парадигмы на ранних этапах определяет дальнейшее проектирование. В общем смысле интерпретация отличается гибкостью, а компиляция обеспечивает высокую производительность, но это лишь верхушка крайне сложной темы.

Я хотел создать простой и при этом производительный язык, каких немного, поэтому с самого начала решил сделать Pinecone компилируемым. Тем не менее, интерпретатор у Pinecone тоже есть — первое время запуск был возможен только с его помощью, позже объясню, почему.

Выбор языка

Своеобразный мета-шаг: язык программирования сам является программой, которую надо написать на каком-то языке. Я выбрал C++ из-за производительности, большого набора функциональных возможностей, и просто потому что он мне нравится.

Но в целом совет можно дать такой:

  • интерпретируемый ЯП крайне рекомендуется писать на компилируемом ЯП (C, C++, Swift). Иначе потери производительности будут расти как снежный ком, пока мета-интерпретатор интерпретирует ваш интерпретатор;
  • компилируемый ЯП можно писать на интерпретируемом ЯП (Python, JS). Возрастёт время компиляции, но не время выполнения программы.

Проектирование архитектуры

У структуры языка программирования есть несколько ступеней от исходного кода до исполняемого файла, на каждой из которых определенным образом происходит форматирование данных, а также функции для перехода между этими ступенями. Поговорим об этом подробнее.

Лексический анализатор / лексер

На данный момент этот блок не поддерживается, но мы не забыли о нём! Наша команда уже занята его разработкой, он будет доступен в ближайшее время.

Первый шаг в большинстве ЯП — это лексический анализ. Говоря по-простому, он представляет собой разбиение текста на токены, то есть единицы языка: переменные, названия функций (идентификаторы), операторы, числа. Таким образом, подав лексеру на вход строку с исходным кодом, мы получим на выходе список всех токенов, которые в ней содержатся.

Обращения к исходному коду уже не будет происходить на следующих этапах, поэтому лексер должен выдать всю необходимую для них информацию.

Flex

При создании языка первым делом я написал лексер. Позже я изучил инструменты, которые могли бы сделать лексический анализ проще и уменьшить количество возникающих багов.

Одним из основных таких инструментов является Flex — генератор лексических анализаторов. Он принимает на вход файл с описанием грамматики языка, а потом создаёт программу на C, которая в свою очередь анализирует строку и выдаёт нужный результат.

Моё решение

Я решил оставить написанный мной анализатор. Особых преимуществ у Flex я в итоге не увидел, а его использование только создало бы дополнительные зависимости, усложняющие процесс сборки. К тому же, мой выбор обеспечивает больше гибкости — например, можно добавить к языку оператор без необходимости редактировать несколько файлов.

Синтаксический анализатор / парсер

На данный момент этот блок не поддерживается, но мы не забыли о нём! Наша команда уже занята его разработкой, он будет доступен в ближайшее время.

Следующая стадия — парсер. Он преобразует исходный текст, то есть список токенов (с учётом скобок и порядка операций), в абстрактное синтаксическое дерево, которое позволяет структурно представить правила создаваемого языка. Сам по себе процесс можно назвать простым, но с увеличением количества языковых конструкций он сильно усложняется.

Bison

На этом шаге я также думал использовать стороннюю библиотеку, рассматривая Bison для генерации синтаксического анализатора. Он во многом похож на Flex — пользовательский файл с синтаксическими правилами структурируется с помощью программы на языке C. Но я снова отказался от средств автоматизации.

Преимущества кастомных программ

С лексером моё решение писать и использовать свой код (длиной около 200 строк) было довольно очевидным: я люблю задачки, а эта к тому же относительно тривиальная. С парсером другая история: сейчас длина кода для него — 750 строк, и это уже третья попытка (первые две были просто ужасны).

Тем не менее, я решил делать парсер сам. Вот основные причины:

  • минимизация переключения контекста;
  • упрощение сборки;
  • желание справиться с задачей самостоятельно.

В целесообразности решения меня убедило высказывание Уолтера Брайта (создателя языка D) в одной из его статей:

Абстрактный семантический граф

На данный момент этот блок не поддерживается, но мы не забыли о нём! Наша команда уже занята его разработкой, он будет доступен в ближайшее время.

В этой части я реализовал структуру, по своей сути наиболее близкую к «промежуточному представлению» (intermediate representation) в LLVM. Существует небольшая, но важная разница между абстрактным синтаксическим деревом (АСД) и абстрактным семантическим графом (АСГ).

АСГ vs АСД

Грубо говоря, семантический граф — это синтаксическое дерево с контекстом. То есть, он содержит информацию наподобие какой тип возвращает функция или в каких местах используется одна и та же переменная. Из-за того, что графу нужно распознать и запомнить весь этот контекст, коду, который его генерирует, необходима поддержка в виде множества различных поясняющих таблиц.

Запуск

После того, как граф составлен, запуск программы становится довольно простой задачей. Каждый узел содержит реализацию функции, которая получает некоторые данные на вход, делает то, что запрограммировано (включая возможный вызов вспомогательных функций), и возвращает результат. Это — интерпретатор в действии.

Варианты компиляции

Вы, наверное, спросите, откуда взялся интерпретатор, если я изначально определил Pinecone как компилируемый язык. Дело в том, что компиляция гораздо сложнее, чем интерпретация — я уже упоминал ранее, что столкнулся с некоторыми проблемами на этом шаге.

Написать свой компилятор

Сначала мне понравилась эта мысль — я люблю делать вещи сам, к тому же давно хотел изучить язык ассемблера. Вот только создать с нуля кроссплатформенный компилятор — сложнее, чем написать машинный код для каждого элемента языка. Я счёл эту идею абсолютно не практичной и не стоящей затраченных ресурсов.

LLVM

LLVM — это коллекция инструментов для компиляции, которой пользуются, например, разработчики Swift, Rust и Clang. Я решил остановиться на этом варианте, но опять не рассчитал сложности задачи, которую перед собой поставил. Для меня проблемой оказалось не освоение ассемблера, а работа с огромной многосоставной библиотекой.

Транспайлинг

Мне всё же нужно было какое-то решение, поэтому я написал то, что точно будет работать: транспайлер (transpiler) из Pinecone в C++ — он производит компиляцию по типу «исходный код в исходный код», а также добавил возможность автоматической компиляции вывода с GCC. Такой способ не является ни масштабируемым, ни кроссплатформенным, но на данный момент хотя бы работает почти для всех программ на Pinecone, это уже хорошо.

Дальнейшие планы

Сейчас мне не достаёт необходимой практики, но в будущем я собираюсь от начала и до конца реализовать компилятор Pinecone с помощью LLVM — инструмент мне нравится и руководства к нему хорошие. Пока что интерпретатора хватает для примитивных программ, а транспайлер справляется с более сложными.

Заключение

Надеюсь, эта статья окажется кому-нибудь полезной. Я крайне рекомендую хотя бы попробовать написать свой язык, несмотря на то, что придётся разбираться во множестве деталей реализации — это обучающий, развивающий и просто интересный эксперимент.

Вот общие советы от меня (разумеется, довольно субъективные):

  • если у вас нет предпочтений и вы сомневаетесь, компилируемый или интерпретируемый писать язык, выбирайте второе. Интерпретируемые языки обычно проще проектировать, собирать и учить;
  • с лексерами и парсерами делайте, что хотите. Использование средств автоматизации зависит от вашего желания, опыта и конкретной ситуации;
  • если вы не готовы / не хотите тратить время и силы (много времени и сил) на придумывание собственной стратегии разработки ЯП, следуйте цепочке действий, описанной в этой статье. Я вложил в неё много усилий и она работает;
  • опять же, если не хватает времени / мотивации / опыта / желания или ещё чего-нибудь для написания классического ЯП, попробуйте написать эзотерический, типа Brainfuck. (Советуем помнить, что если язык написан развлечения ради, это не значит, что писать его — тоже сплошное развлечение. — прим. перев.)

Я делал довольно много ошибок по ходу разработки, но большую часть кода, на которую они могли повлиять, я уже переписал. Язык сейчас неплохо функционирует и будет развиваться (на момент написания статьи его можно было собрать на Linux и с переменным успехом на macOS, но не на Windows).

О том, что ввязался в историю с созданием Pinecone, ни в коем случае не жалею — это отличный эксперимент, и он только начался.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *