Перейти к содержимому

Как поменять кодировку в visual studio code

  • автор:

Как сменить кодировку открытого документа в Microsoft Visual Studio Code?

Открываю файл в UTF-8 и хочу сохранить в Windows-1251. Есть ли такая возможность в Microsoft Visual Studio Code? В самом редакторе или с помощью плагинов?

Отслеживать
48.6k 17 17 золотых знаков 56 56 серебряных знаков 100 100 бронзовых знаков
задан 12 окт 2017 в 8:45
Dedotmoroz Dedotmoroz
196 1 1 золотой знак 1 1 серебряный знак 12 12 бронзовых знаков
посмотрите тут
12 окт 2017 в 9:02
Кодировку спрятали в правом нижнем углу, на синей полоске. ОК.
12 окт 2017 в 9:23

2 ответа 2

Сортировка: Сброс на вариант по умолчанию

Внизу справа на панели статуса отображается кодировка, в которой открыт файл (например, UTF-8). Жмете на нее. Будет предложено два варианта:

  • Reopen with Encoding (открыть заново в другой кодировке)
  • Save with Encoding (сохранить в другой кодировке)

Жмете второй вариант, выбираете нужную кодировку из списка.

Отслеживать
ответ дан 17 фев 2020 в 6:09
48.6k 17 17 золотых знаков 56 56 серебряных знаков 100 100 бронзовых знаков

Вот сюда они спрятали выбор кодировок:

введите сюда описание изображения

Отслеживать
ответ дан 23 авг 2019 в 10:40
2,676 6 6 золотых знаков 36 36 серебряных знаков 72 72 бронзовых знака

Highly active question. Earn 10 reputation (not counting the association bonus) in order to answer this question. The reputation requirement helps protect this question from spam and non-answer activity.

    Важное на Мете
Похожие

Подписаться на ленту

Лента вопроса

Для подписки на ленту скопируйте и вставьте эту ссылку в вашу программу для чтения RSS.

Дизайн сайта / логотип © 2024 Stack Exchange Inc; пользовательские материалы лицензированы в соответствии с CC BY-SA . rev 2024.1.3.2953

Нажимая «Принять все файлы cookie» вы соглашаетесь, что Stack Exchange может хранить файлы cookie на вашем устройстве и раскрывать информацию в соответствии с нашей Политикой в отношении файлов cookie.

Кодировки и окончания строк

Область применения:yesVisual Studio Visual Studio для Mac noVisual Studio Code no

В Visual Studio следующие символы интерпретируются как разрывы строк:

  • CR LF: возврат каретки + перевод строки, символы Юникода 000D + 000A;
  • LF: перевод строки, символ Юникода 000A;
  • NEL: следующая строка, символ Юникода 0085;
  • LF: разделитель строки, символ Юникода 2028;
  • PS: разделитель абзаца, символ Юникода 2029.

Для текста, который копируется из других приложений, сохраняется исходная кодировка и символы разрыва строки. Например, при копировании текста из Блокнота и вставке его в текстовый файл в Visual Studio текст имеет те же параметры, которые применялись в Блокноте.

При открытии файла, который содержит разные символы разрыва строки, может появиться диалоговое окно с запросом о том, следует ли нормализовать несогласованные символы разрыва строки и какой тип разрыва строки выбрать.

Дополнительные параметры сохранения

Чтобы определить тип символов разрыва строки, можно использовать параметры в диалоговом окне Файл>Дополнительные параметры сохранения. Кроме того, с помощью этих параметров можно изменить кодировку файла.

Advanced Save Options dialog box

Если в меню Файл пункт Дополнительные параметры сохранения отсутствует, его можно добавить.

  1. Выберите Инструменты, Настроить,
  2. Откройте вкладку Команды, выберите переключатель Строка меню и в соответствующем раскрывающемся списке выберите Файл. Нажмите кнопку Добавить команду.
  3. В диалоговом окне Добавление команды в разделе Категории выберите Файл, а затем в списке Команды выберите элемент Дополнительные параметры сохранения. Нажмите кнопку OK.
  4. С помощью кнопок Вверх и Вниз переместите команду в нужное место в меню. Чтобы закрыть диалоговое окно Настройки, нажмите кнопку Закрыть. Дополнительные сведения см. в разделе Настройка меню и панелей инструментов.

Кроме того, чтобы открыть диалоговое окно Дополнительные параметры сохранения, можно выбрать пункт меню Файл>Сохранить как. В диалоговом окне Сохранить файл как щелкните треугольник раскрывающегося списка рядом с кнопкой Сохранить и выберите пункт Сохранить с кодировкой.

Связанный контент

Как поменять кодировку в visual studio code

Рис.1. Возможные значения объекта Environment.SpecialFolder

Чтобы установить требуемую кодировку для сохранения проектов в Visual Studio Code, например, UTF-8, нужно зайти в пункт меню программы Файл / Параметры / Параметры (Ctrl + ,), где найти аттрибут files.encoding.

Чтобы установить кодировку UTF-8, нужно указать:

Создаваемые файлы будут иметь кодировку utf8 без bom.

Рис.1. Изменение кодировки файлов на UTF8 в Visual studio code

Рис.1. Изменение кодировки файлов на UTF8 в Visual studio code

Основные сведения о кодировке файлов в VS Code и PowerShell

При использовании VS Code для создания и редактирования скриптов PowerShell важно сохранить файлы с помощью правильного формата кодировки символов.

Что такое кодировка и почему она важна?

VS Code управляет интерфейсом ввода строки символов в буфер пользователем и чтения-записи блоков байтов в файловой системе. При сохранении файла в VS Code используется кодирование текста для определения того, какие байты получит каждый символ. Подробные сведения см. в статье О шифровании символов.

Аналогичным образом, когда оболочка PowerShell запускает скрипт, ей необходимо преобразовать байты из файла в символы для преобразования файла в программу PowerShell. Так как VS Code записывает файл, а PowerShell считывает файл, этим средствам необходимо использовать одну и ту же систему кодировки. Этот процесс синтаксического анализа скрипта PowerShell идет так: байты ->символы ->лексемы -> дерево абстрактного синтаксиса ->выполнение.

И VS Code, и PowerShell устанавливаются с подходящей конфигурацией кодировки по умолчанию. Тем не менее кодировка по умолчанию, используемая PowerShell, была изменена с выпуском PowerShell 6. Чтобы избежать проблем с PowerShell и расширениями PowerShell в VS Code, необходимо настроить параметры VS Code и PowerShell должным образом.

Распространенные причины проблемы с кодировкой

Проблемы с кодировкой возникают, когда кодировка VS Code или файл скрипта не соответствует ожидаемой кодировке PowerShell. В PowerShell нет способа автоматически определить кодировку файла.

Проблемы с кодировкой более вероятны при использовании символов не из 7-разрядной кодировки ASCII. Например:

  • Расширенные небуквенные символы, такие как длинное тире ( — ), неразрывный пробел ( ) или левая двойная кавычка ( » ).
  • Латинские символы с диакритикой ( É , ü )
  • Нелатинские символы, такие как кириллица ( Д , Ц )
  • Символы иероглифического письма ( 本 , 화 , が ).

Распространенные причины проблем с кодировкой:

  • Кодировки VS Code и PowerShell не были изменены по умолчанию. В версиях до PowerShell 5.1 (включительно) кодировка по умолчанию отличается от используемой в VS Code.
  • Открыт другой редактор, и файл перезаписан в новой кодировке. Это часто происходит с интегрированной средой сценариев.
  • Файл проверка в систему управления версиями в кодировке, отличной от того, что ожидает VS Code или PowerShell. Это может произойти, когда участники совместной работы используют редакторы с различными конфигурациями кодировок.

Как определить наличие проблемы с кодировкой

Часто ошибки кодирования в скриптах представляются как ошибки синтаксического анализа. Если вы видите странные последовательности символов в скрипте, это может быть проблемой. В примере ниже тире ( – ) отображается в виде символов ※ :

Send-MailMessage : A positional parameter cannot be found that accepts argument 'Testing FuseMail SMTP. '. At C:\Users\\\Development\PowerShell\Scripts\Send-EmailUsingSmtpRelay.ps1:6 char:1 + Send-MailMessage â€"From $from â€"To $recipient1 â€"Subject $subject . + ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ + CategoryInfo : InvalidArgument: (:) [Send-MailMessage], ParameterBindingException + FullyQualifiedErrorId : PositionalParameterNotFound,Microsoft.PowerShell.Commands.SendMailMessage 

Эта проблема возникает, так как VS Code кодирует символ – в UTF-8 как байты 0xE2 0x80 0x93 . Когда эти байты декодируются как Windows-1252, они интерпретируются как символы ※ .

Некоторые странные последовательности символов, которые можно видеть:

  • ※ вместо – (en-dash)
  • ※ вместо — (em-dash)
  • Ä2 вместо Ä .
  • Â вместо (неразрывный пробел).
  • é вместо é .

Этот удобный справочник перечисляет распространенные шаблоны, которые указывают на проблему между кодировками UTF-8 и Windows-1252.

Взаимодействие расширения PowerShell для VS Code с кодировками

Расширение PowerShell взаимодействует со скриптами несколькими способами:

  1. При изменении скриптов в VS Code содержимое отправляется из VS Code в расширение. Протокол языкового сервера требует, чтобы это содержимое передавалось в UTF-8. Поэтому расширение не может получить неправильное кодирование.
  2. При выполнении скриптов в интегрированной консоли они считываются оболочкой PowerShell непосредственно из файла. Если кодировка PowerShell отличается от кодировки VS Code, может произойти сбой.
  3. Когда скрипт, открытый в VS Code, ссылается на другой скрипт, который не открыт в VS Code, расширение возвращается к загрузке содержимого этого скрипта из файловой системы. Расширение PowerShell по умолчанию использует кодировку UTF-8, но при этом применяет обнаружение метки порядка байтов (BOM), чтобы выбрать правильную кодировку.

Проблема возникает при предположении кодировки, не использующей BOM (такой как UTF-8 без метки порядка байтов или Windows-1252). Расширение PowerShell по умолчанию использует UTF-8. Расширение не может изменить параметры кодирования VS Code. Дополнительные сведения см. в разделе Проблема № 824.

Выбор подходящей кодировки

Различные системы и приложения могут использовать различные кодировки:

  • В .NET Standard, в Интернете и в среде Linux теперь в основном используется кодировка UTF-8.
  • Во многих приложениях .NET Framework используется UTF-16. По историческим причинам ее иногда называют «Юникод»; сейчас этот термин относится к более широкому стандарту, охватывающему UTF-8 и UTF-16.
  • В Windows многие приложения, которые были созданы еще до распространения Юникода, по-прежнему могут по умолчанию использовать Windows-1252.

Кодировки Юникода также используют понятие метки порядка следования байтов (BOM). BOM ставится в начале текста, чтобы декодер мог определить, какая кодировка используется в тексте. Для многобайтовых кодировок BOM также указывает порядок следования байтов кодировки. BOM представляются байтами, которые редко встречаются в тексте в Юникоде. Это позволяет сделать обоснованное предположение, что текст записан в Юникоде, если присутствует метка BOM.

BOM не являются обязательными; в мире Linux они не так популярны, поскольку во всех прочих местах используется надежное соглашение UTF-8. Большинство приложений Linux предполагают, что текстовый ввод кодируется в UTF-8. Хотя многие приложения Linux распознают и правильно обрабатывают BOM, число не выполняется, что приводит к артефактам в тексте, обрабатываемом этими приложениями.

Таким образом:

  • Если вы работаете в основном с приложениями Windows и Windows PowerShell, следует предпочтительно использовать такие кодировки, как UTF-8 с BOM или UTF-16.
  • Если вы работаете на разных платформах, следует отдавать предпочтение UTF-8 с BOM.
  • Если вы работаете главным образом в контексте Linux, следует отдавать предпочтение UTF-8 без BOM.
  • Windows-1252 и latin-1 — устаревшие кодировки, которых по возможности следует избегать. Тем не менее некоторые приложения предыдущих версий в Windows зависят от их.
  • Также стоит отметить, что подписывание скриптов зависит от кодировки, то есть изменение кодировки в подписанном скрипте потребует повторного подписывания.

Настройка VS Code

Кодировка VS Code по умолчанию — UTF-8 без метки порядка байтов.

Чтобы задать кодировку VS Code, перейдите к параметрам VS Code ( CTRL + , ) и задайте параметр «files.encoding» :

"files.encoding": "utf8bom" 

Возможны следующие значения:

  • utf8 : [UTF-8] без метки порядка байтов
  • utf8bom : [UTF-8] с меткой порядка байтов
  • utf16le : [UTF-16] с прямым порядком байтов
  • utf16be : [UTF-16] с обратным порядком байтов
  • windows1252 : [Windows-1252]

Должен отобразиться раскрывающийся список представления графического пользовательского интерфейса или дополнение в представлении JSON.

Чтобы обеспечить автоматическое определение кодировки, если это возможно, можно также добавить следующее:

"files.autoGuessEncoding": true 

Если вы не хотите, чтобы эти параметры влияли на все типы файлов, в VS Code можно задавать конфигурации для каждого языка отдельно. Создать параметр для конкретного языка можно, поместив параметры в поле [] . Например:

"[powershell]":

Вы также можете установить средство отслеживания Gremlins для Visual Studio Code. Это расширение показывает определенные символы Юникода, которые легко повреждены, так как они невидимы или выглядят как другие обычные символы.

Настройка PowerShell

В PowerShell кодировка по умолчанию зависит от версии:

  • В PowerShell 6+ кодировка по умолчанию на всех платформах — UTF-8 без метки порядка байтов.
  • В Windows PowerShell кодировка по умолчанию обычно является Windows-1252, которая является расширением latin-1 (также известного как ISO 8859-1).

В PowerShell 5 + можно определить кодировку по умолчанию так:

[psobject].Assembly.GetTypes() | Where-Object < $_.Name -eq 'ClrFacade'>| ForEach-Object

Следующий скрипт может использоваться для определения кодировки, которую ваш сеанс PowerShell выводит для скрипта, где нет метки порядка байтов.

$badBytes = [byte[]]@(0xC3, 0x80) $utf8Str = [System.Text.Encoding]::UTF8.GetString($badBytes) $bytes = [System.Text.Encoding]::ASCII.GetBytes('Write-Output "') + [byte[]]@(0xC3, 0x80) + [byte[]]@(0x22) $path = Join-Path ([System.IO.Path]::GetTempPath()) 'encodingtest.ps1' try < [System.IO.File]::WriteAllBytes($path, $bytes) switch (& $path) < $utf8Str < return 'UTF-8' break >default < return 'Windows-1252' break >> > finally

Можно настроить PowerShell так, чтобы использовать заданную кодировку в более общем виде с помощью параметров профиля. См. следующие статьи:

  • Ответ @mklement0 о кодировке PowerShell на сайте StackOverflow.
  • Запись блога @rkeithhill об обработке входных данных в UTF-8 без метки порядка байтов в PowerShell.

Заставить PowerShell использовать конкретную кодировку для входных данных невозможно. В PowerShell 5.1 и более ранних версий в Windows с языковым стандартом en-US по умолчанию используется кодировка Windows-1252, если отсутствует метка порядка байтов. Другие параметры языкового стандарта могут использовать другую кодировку. Для обеспечения совместимости лучше сохранять скрипты в Юникоде с меткой порядка байтов.

Любые другие имеющиеся у вас инструменты для работы со скриптами PowerShell могут зависеть от выбранных параметров кодировки или преобразовывать скрипты в другую кодировку.

Существующие скрипты

Скрипты, которые уже находятся в файловой системе, могут нуждаться в повторном кодировании в указанную вами кодировку. В нижней строке VS Code вы увидите метку UTF-8. Щелкните ее, чтобы открыть панель действий, и выберите команду Сохранить с кодировкой. Теперь вы можете выбрать новую кодировку для этого файла. Подробные инструкции см. в разделе Кодировка VS Code.

Если вам нужно повторно кодировать несколько файлов, можно использовать следующий скрипт:

Get-ChildItem *.ps1 -Recurse | ForEach-Object

Интегрированная среда сценариев (ISE) PowerShell

При редактировании скриптов с помощью интегрированной среды сценариев PowerShell необходимо синхронизировать здесь параметры кодировки.

Интегрированная среда сценариев должна учитывать метку порядка байтов, но можно также использовать отражение для задания кодировки. Обратите внимание, что это значение не сохраняется между запусками.

Система управления версиями

Некоторые системы управления версиями, например git, игнорируют кодировки; git отслеживает только байты. Поведение других, например Azure DevOps или Mercurial, может отличаться. Даже некоторые средства, основанные на git, полагаются на декодирование текста.

Если это так, убедитесь, что вы:

  • Настроили кодировку в системе управления версиями в соответствии с вашей конфигурацией VS Code.
  • Сделали так, что все файлы добавляются в систему управления версиями в соответствующей кодировке.
  • Остерегайтесь изменять кодировки, полученные через систему управления версиями. Ключевым признаком здесь будет разностный файл, который указывает, что изменения отсутствуют (так как изменены байты, но не символы).

Среды других участников

Настроив систему управления версиями, убедитесь также, что параметры других участников, работающих над теми файлами, к которым вы предоставляете общий доступ, не переопределяют кодировку путем повторного кодирования файлов PowerShell.

Другие программы

Все другие программы, которые считывают или записывают скрипты PowerShell, могут перекодировать их.

Вот некоторые примеры:

  • Использование буфера обмена для копирования и вставки скрипта. Это часто происходит в таких сценариях:
    • Копирование скрипта в виртуальную машину.
    • Копирование скрипта из электронной почты или с веб-страницы.
    • Копирование скрипта через документ Microsoft Word или PowerPoint.
    • Блокнот
    • vim
    • любой другой редактор скриптов PowerShell.
    • Get-Content / Set-Content / Out-File
    • Операторы перенаправления PowerShell, такие как > и >> .
    • sed / awk
    • Веб-браузер при скачивании скриптов.
    • Общий файловый ресурс.

    Некоторые из этих средств работают с байтами, а не с текстом, но другие позволяют настраивать кодировки. В случаях, когда необходимо настроить кодировку, используйте те же параметры, что и в вашем редакторе, чтобы предотвратить возникновение проблем.

    Другие ресурсы о кодировках в PowerShell

    Существует несколько других достойных публикаций на тему кодировок и настройки кодирования в PowerShell:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *