Перейти к содержимому

Как экранировать в java

  • автор:

Как экранировать спецсимволы, например » \?», в строке URL из Java

Есть строка, содержащая знак вопроса ? , или несколько. Строка передается как параметр в URL. Знак вопроса нужно заменить на %3f . Как это сделать?

String text = text.replaceAll("\?", "%3f"); 

Такой код дает ошибку:

Dangling meta character '?' near index 0 

Перевод вопроса с enSO: «Replace a question mark (?) with (\?)», не дословный, но очень похоже.
Отслеживать
задан 29 сен 2017 в 17:27
user236980 user236980

3 ответа 3

Сортировка: Сброс на вариант по умолчанию

Разобрался сам. Поскольку знак вопроса «?» является спецсимволом в regexp, то экранировать его нужно не одним «\» слешем, а двумя «\\»

String text = text.replaceAll("\\?", "%3f"); 

Ну а в общем случае для разных спецсимволов у меня получилось вот что:

String text = text .replaceAll("%", "%25") // Процент .replaceAll(" ", "%20") // Пробел .replaceAll("\t", "%20") // Табуляция (заменяем на пробел) .replaceAll("\n", "%20") // Переход строки (заменяем на пробел) .replaceAll("\r", "%20") // Возврат каретки (заменяем на пробел) .replaceAll("!", "%21") // Восклицательный знак .replaceAll("\"", "%22") // Двойная кавычка .replaceAll("#", "%23") // Октоторп, решетка .replaceAll("\\$", "%24") // Знак доллара .replaceAll("&", "%26") // Амперсанд .replaceAll("'", "%27") // Одиночная кавычка .replaceAll("\\(", "%28") // Открывающаяся скобка .replaceAll("\\)", "%29") // Закрывающаяся скобка .replaceAll("\\*", "%2a") // Звездочка .replaceAll("\\+", "%2b") // Знак плюс .replaceAll(",", "%2c") // Запятая .replaceAll("-", "%2d") // Дефис .replaceAll("\\.", "%2e") // Точка .replaceAll("/", "%2f") // Слеш, косая черта .replaceAll(":", "%3a") // Двоеточие .replaceAll(";", "%3b") // Точка с запятой .replaceAll("", "%3e") // Закрывающаяся угловая скобка .replaceAll("\\?", "%3f") // Вопросительный знак .replaceAll("@", "%40") // At sign, по цене, собачка .replaceAll("\\[", "%5b") // Открывающаяся квадратная скобка .replaceAll("\\\\", "%5c") // Одиночный обратный слеш '\' .replaceAll("\\]", "%5d") // Закрывающаяся квадратная скобка .replaceAll("\\^", "%5e") // Циркумфлекс .replaceAll("_", "%5f") // Нижнее подчеркивание .replaceAll("`", "%60") // Гравис .replaceAll("\\", "%7d") // Закрывающаяся фигурная скобка .replaceAll("~", "%7e"); // Тильда 

Как экранировать кавычки внутри кавычек?

Всем привет!
Выполняю парсин данных из инстаграм на Java. Json, который возвращает instagram, является невалидным, т.к. иногда в некоторых полях с именованием внутри кавычек присутствуют ещё кавычки, которые не экранируются, например:
«full_name»: «Агроусадьба «Марусина Хата «»,
Должно быть:
«full_name»: «Агроусадьба \»Марусина Хата\»»,

Может кто-нибудь сталкивался, как можно экранировать кавычки внутри кавычек, используя регулярное выражение?

  • Вопрос задан более года назад
  • 949 просмотров

3 комментария

Простой 3 комментария

Как экранировать символ % в String.Format в Java

При работе с Java и в частности с методом String.Format могут возникать различные трудности. Одна из них — необходимость экранирования символа процента (%). Эта проблема часто возникает при формировании SQL-запросов, где символ % используется для поиска по шаблону.

Пример такого SQL-запроса:

SELECT Field1, Field2 FROM mytable WHERE Field1 LIKE '%something%'

Здесь символ % используется в операторе LIKE для обозначения любого количества любых символов. Для того чтобы заменить ‘something’ на нужное значение в Java, можно было бы использовать метод String.Format и заменить ‘something’ на %1$s.

SELECT Field1, Field2 FROM mytable WHERE Field1 LIKE '%%1$s%'

Однако, символ % в данном случае необходимо экранировать.

Для экранирования символа % в Java используется двойной символ %%. То есть, вместо одного символа % необходимо написать %%. Это правило актуально не только для SQL-запросов, но и для любых других строк, где требуется экранировать символ %.

Таким образом, корректная запись SQL-запроса будет выглядеть следующим образом:

SELECT Field1, Field2 FROM mytable WHERE Field1 LIKE '%%%1$s%%'

Это позволит корректно заменить %1$s на необходимое значение, а символы %% будут восприняты как обычный символ %.

Таким образом, при работе с методом String.Format в Java очень важно помнить о необходимости экранирования символа %. Это позволит избежать многих ошибок и сделает код более читаемым и понятным.

Экранирование, специальные символы

Как мы уже видели, обратная косая черта \ используется для обозначения классов символов, например \d . Это специальный символ в регулярных выражениях (как и в обычных строках).

Есть и другие специальные символы, которые имеют особое значение в регулярном выражении. Они используются для более сложных поисковых конструкций. Вот полный перечень этих символов: [ ] \ ^ $ . | ? * + ( ) .

Не надо пытаться запомнить этот список: мы разберёмся с каждым из них по отдельности, и таким образом вы выучите их «автоматически».

Экранирование символов

Допустим, мы хотим найти буквально точку. Не «любой символ», а именно точку.

Чтобы использовать специальный символ как обычный, добавьте к нему обратную косую черту: \. .

Это называется «экранирование символа».

alert( "Глава 5.1".match(/\d\.\d/) ); // 5.1 (совпадение!) alert( "Глава 511".match(/\d\.\d/) ); // null ("\." - ищет обычную точку)

Круглые скобки также являются специальными символами, поэтому, если нам нужно использовать именно их, нужно указать \( . В приведённом ниже примере ищется строка «g()» :

alert( "function g()".match(/g\(\)/) ); // "g()"

Если мы ищем обратную косую черту \ , это специальный символ как в обычных строках, так и в регулярных выражениях, поэтому мы должны удвоить её.

alert( "1\\2".match(/\\/) ); // '\'

Косая черта

Символ косой черты ‘/’ , так называемый «слэш», не является специальным символом, но в JavaScript он используется для открытия и закрытия регулярного выражения: /. шаблон. / , поэтому мы должны экранировать его.

Вот как выглядит поиск самой косой черты ‘/’ :

alert( "/".match(/\//) ); // '/'

С другой стороны, если мы не используем короткую запись /. / , а создаём регулярное выражение, используя new RegExp , тогда нам не нужно экранировать косую черту:

alert( "/".match(new RegExp("/")) ); // находит /

new RegExp

Если мы создаём регулярное выражение с помощью new RegExp , то нам не нужно учитывать / , но нужно другое экранирование.

Например, такой поиск не работает:

let regexp = new RegExp("\d\.\d"); alert( "Глава 5.1".match(regexp) ); // null

Аналогичный поиск в примере выше с /\d\.\d/ вполне работал, почему же не работает new RegExp(«\d\.\d») ?

Причина в том, что символы обратной косой черты «съедаются» строкой. Как вы помните, обычные строки имеют свои специальные символы, такие как \n , и для экранирования используется обратная косая черта.

Вот как воспринимается строка «\d.\d»:

alert("\d\.\d"); // d.d

Строковые кавычки «съедают» символы обратной косой черты для себя, например:

  • \n – становится символом перевода строки,
  • \u1234 – становится символом Юникода с указанным номером,
  • …А когда нет особого значения: как например для \d или \z , обратная косая черта просто удаляется.

Таким образом, new RegExp получает строку без обратной косой черты. Вот почему поиск не работает!

Чтобы исправить это, нам нужно удвоить обратную косую черту, потому что строковые кавычки превращают \\ в \ :

let regStr = "\\d\\.\\d"; alert(regStr); // \d\.\d (теперь правильно) let regexp = new RegExp(regStr); alert( "Глава 5.1".match(regexp) ); // 5.1

Итого

  • Для поиска специальных символов [ ] \ ^ $ . | ? * + ( ) , нам нужно добавить перед ними \ («экранировать их»).
  • Нам также нужно экранировать / , если мы используем /. / (но не new RegExp ).
  • При передаче строки в new RegExp нужно удваивать обратную косую черту: \\ для экранирования специальных символов, потому что строковые кавычки «съедят» одну черту.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *