Pg stat statements как включить
Модуль pg_stat_statements предоставляет возможность отслеживать статистику выполнения сервером всех операторов SQL.
Этот модуль нужно загружать, добавив pg_stat_statements в shared_preload_libraries в файле postgresql.conf , так как ему требуется дополнительная разделяемая память. Это значит, что для загрузки или выгрузки модуля необходимо перезапустить сервер.
Когда модуль pg_stat_statements загружается, он отслеживает статистику по всем базам данных на сервере. Для получения и обработки этой статистики этот модуль предоставляет представление pg_stat_statements и вспомогательные функции pg_stat_statements_reset и pg_stat_statements . Эти объекты не доступны глобально, но их можно установить в определённой базе данных, выполнив команду CREATE EXTENSION pg_stat_statements .
F.40.1. Представление pg_stat_statements
Статистика, собираемая модулем, выдаётся через представление с именем pg_stat_statements . Это представление содержит отдельные строки для каждой комбинации идентификатора базы данных, идентификатора пользователя и идентификатора запроса (но в количестве, не превышающем максимальное число различных операторов, которые может отслеживать модуль). Столбцы представления показаны в Таблице F.23.
Таблица F.23. Столбцы pg_stat_statements
| Имя | Тип | Ссылки | Описание |
|---|---|---|---|
| userid | oid | pg_authid .oid | OID пользователя, выполнявшего оператор |
| dbid | oid | pg_database .oid | OID базы данных, в которой выполнялся оператор |
| queryid | bigint | Внутренний хеш-код, вычисленный по дереву разбора оператора | |
| query | text | Текст, представляющий оператор | |
| calls | bigint | Число выполнений | |
| total_time | double precision | Общее время, затраченное на оператор, в миллисекундах | |
| min_time | double precision | Минимальное время, затраченное на оператор, в миллисекундах | |
| max_time | double precision | Максимальное время, затраченное на оператор, в миллисекундах | |
| mean_time | double precision | Среднее время, затраченное на оператор, в миллисекундах | |
| stddev_time | double precision | Стандартное отклонение времени, затраченного на оператор, в миллисекундах | |
| rows | bigint | Общее число строк, полученных или затронутых оператором | |
| shared_blks_hit | bigint | Общее число попаданий в разделяемый кеш блоков для данного оператора | |
| shared_blks_read | bigint | Общее число чтений разделяемых блоков для данного оператора | |
| shared_blks_dirtied | bigint | Общее число разделяемых блоков, «загрязнённых» данным оператором | |
| shared_blks_written | bigint | Общее число разделяемых блоков, записанных данным оператором | |
| local_blks_hit | bigint | Общее число попаданий в локальный кеш блоков для данного оператора | |
| local_blks_read | bigint | Общее число чтений локальных блоков для данного оператора | |
| local_blks_dirtied | bigint | Общее число локальных блоков, «загрязнённых» данным оператором | |
| local_blks_written | bigint | Общее число локальных блоков, записанных данным оператором | |
| temp_blks_read | bigint | Общее число чтений временных блоков для данного оператора | |
| temp_blks_written | bigint | Общее число записей временных блоков для данного оператора | |
| blk_read_time | double precision | Общее время, затраченное оператором на чтение блоков, в миллисекундах (если включён track_io_timing, или ноль в противном случае) | |
| blk_write_time | double precision | Общее время, затраченное оператором на запись блоков, в миллисекундах (если включён track_io_timing, или ноль в противном случае) |
По соображениям безопасности обычные пользователи не видят текст SQL и queryid для запросов, выполненных другими пользователями. Однако они могут видеть статистику, если в их базу данных установлено представление.
Планируемые запросы (то есть, SELECT , INSERT , UPDATE и DELETE ) объединяются в одну запись в pg_stat_statements , когда они имеют идентичные структуры запросов согласно внутреннему вычисленному хешу. Обычно два запроса будут считаться равными при таком сравнении, если они семантически равнозначны, не считая значений констант, фигурирующих в запросе. Однако служебные команды (то есть все другие команды) сравниваются строго по текстовым строкам запросов.
Когда значение константы игнорируется в целях сравнения запроса с другими запросами, эта константа заменяется в выводе pg_stat_statements знаком ? . В остальном этот вывод содержит текст первого запроса, имеющего определённое значение хеша queryid , связанное с записью в pg_stat_statements .
В некоторых случаях запросы с визуально различными текстами могут быть объединены в одну запись pg_stat_statements . Обычно это происходит только для семантически равнозначных запросов, но есть небольшая вероятность, что из-за наложений хеша несвязанные запросы могут оказаться объединёнными в одной записи. (Однако это невозможно для запросов, принадлежащих разным пользователям баз данных.)
Так как значение хеша queryid вычисляется по представлениям запроса на стадии после разбора, возможна и обратная ситуация: запросы с одинаковым текстом могут оказаться в разных записях, если они получили различные представления по разным причинам, например, из-за изменения search_path .
Потребители статистики pg_stat_statements могут пожелать использовать в качестве более стабильного и надёжного идентификатора для каждой записи не текст запроса, а queryid (возможно, в сочетании с dbid и userid ). Однако важно понимать, что стабильность значения хеша queryid гарантируется с ограничениями. Так как этот идентификатор получается из дерева запроса после анализа, его значение будет, помимо прочего, зависеть от внутренних идентификаторов объектов, фигурирующих в этом представлении. С этим связано несколько неинтуитивных следствий. Например, pg_stat_statements будет считать два одинаково выглядящих запроса разными, если они обращаются к таблице, которая была удалена, а затем воссоздана между этими запросами. Результат хеширования также чувствителен к различиям в машинной архитектуре и другим особенностям платформы. Более того, не стоит рассчитывать на то, что queryid будет оставаться неизменным при обновлении основных версий Postgres Pro .
Как правило, значения queryid можно считать надёжными и сравнимыми, только с условием, что версия сервера и детали метаданных каталога неизменны. Следовательно, можно ожидать, что два сервера, участвующие в репликации на основе воспроизведения физического WAL, будут иметь одинаковые queryid для одного запроса. Однако схемы с логической репликацией не гарантируют сохранения идентичности реплик во всех имеющих значение деталях, так что queryid не будет полезным идентификатором для накопления показателей стоимости по набору логических реплик. В случае сомнений в том или ином подходе, рекомендуется непосредственно протестировать его.
Текст, представляющий запрос, сохраняется во внешнем файле на диске и не занимает разделяемую память. Поэтому даже очень объёмный текст запроса может быть сохранён успешно. Однако если в файле накапливается много длинных текстов запросов, он может вырасти до неудобоваримого размера. В качестве решения этой проблемы, pg_stat_statements может решить стереть текст запросов, и в результате во всех существующих записях в представлении pg_stat_statements в поле query окажутся значения NULL, хотя статистика, связанная с каждым queryid будет сохранена. Если это происходит и мешает анализу, возможно, стоит уменьшить pg_stat_statements.max для предотвращения таких ситуаций.
F.40.2. Функции
pg_stat_statements_reset() returns void
Функция pg_stat_statements_reset очищает всю статистику, собранную к этому времени модулем pg_stat_statements . По умолчанию эту функцию могут выполнять только суперпользователи. pg_stat_statements(showtext boolean) returns setof record
Представление pg_stat_statements реализовано на базе функции, которая тоже называется pg_stat_statements . Клиенты могут вызывать функцию pg_stat_statements непосредственно, и могут указать showtext := false и получить результат без текста запроса (то есть, выходной аргумент ( OUT ), соответствующий столбцу представления query , будет содержать NULL). Эта возможность предназначена для поддержки внешних инструментов, для которых желательно избежать издержек, связанных с получением текстов запросов неопределённой длины. Такие инструменты могут кешировать текст первого запроса, который они получат самостоятельно, как это и делает pg_stat_statements , а затем запрашивать тексты запросов только при необходимости. Так как сервер сохраняет тексты запросов в файле, этот подход сокращает объём физического ввода/вывода, порождаемого при постоянном обращении к данным pg_stat_statements .
F.40.3. Параметры конфигурации
pg_stat_statements.max ( integer )
Параметр pg_stat_statements.max задаёт максимальное число операторов, отслеживаемых модулем (то есть, максимальное число строк в представлении pg_stat_statements ). Когда на обработку поступает больше, чем заданное число различных операторов, информация о редко выполняемых операторах отбрасывается. Значение по умолчанию — 5000. Этот параметр можно задать только при запуске сервера. pg_stat_statements.track ( enum )
Параметр pg_stat_statements.track определяет, какие операторы будут отслеживаться модулем. Со значением top отслеживаются операторы верхнего уровня (те, что непосредственно выполняются клиентами), со значением all также отслеживаются вложенные операторы (например, операторы, вызываемые внутри функций), а значение none полностью отключает сбор статистики по операторам. Значение по умолчанию — top . Изменять этот параметр могут только суперпользователи. pg_stat_statements.track_utility ( boolean )
Параметр pg_stat_statements.track_utility определяет, будет ли этот модуль отслеживать служебные команды. Служебными командами считаются команды, отличные от SELECT , INSERT , UPDATE и DELETE . Значение по умолчанию — on (вкл.). Изменить этот параметр могут только суперпользователи. pg_stat_statements.save ( boolean )
Параметр pg_stat_statements.save определяет, должна ли статистика операторов сохраняться после перезагрузки сервера. Если он отключён (имеет значение off ), статистика не сохраняется при остановке сервера и не перезагружается при запуске. Значение по умолчанию — on (вкл.). Этот параметр можно задать только в postgresql.conf или в командной строке сервера.
Этому модулю требуется дополнительная разделяемая память в объёме, пропорциональном pg_stat_statements.max . Заметьте, что эта память будет занята при загрузке модуля, даже если pg_stat_statements.track имеет значение none .
Эти параметры должны задаваться в postgresql.conf . Обычное использование выглядит так:
# postgresql.conf shared_preload_libraries = 'pg_stat_statements' pg_stat_statements.max = 10000 pg_stat_statements.track = all
F.40.4. Пример вывода
bench=# SELECT pg_stat_statements_reset(); $ pgbench -i bench $ pgbench -c10 -t300 bench bench=# \x bench=# SELECT query, calls, total_time, rows, 100.0 * shared_blks_hit / nullif(shared_blks_hit + shared_blks_read, 0) AS hit_percent FROM pg_stat_statements ORDER BY total_time DESC LIMIT 5; -[ RECORD 1 ]--------------------------------------------------------------------- query | UPDATE pgbench_branches SET bbalance = bbalance + ? WHERE bid = ?; calls | 3000 total_time | 9609.00100000002 rows | 2836 hit_percent | 99.9778970000200936 -[ RECORD 2 ]--------------------------------------------------------------------- query | UPDATE pgbench_tellers SET tbalance = tbalance + ? WHERE tid = ?; calls | 3000 total_time | 8015.156 rows | 2990 hit_percent | 99.9731126579631345 -[ RECORD 3 ]--------------------------------------------------------------------- query | copy pgbench_accounts from stdin calls | 1 total_time | 310.624 rows | 100000 hit_percent | 0.30395136778115501520 -[ RECORD 4 ]--------------------------------------------------------------------- query | UPDATE pgbench_accounts SET abalance = abalance + ? WHERE aid = ?; calls | 3000 total_time | 271.741999999997 rows | 3000 hit_percent | 93.7968855088209426 -[ RECORD 5 ]--------------------------------------------------------------------- query | alter table pgbench_accounts add primary key (aid) calls | 1 total_time | 81.42 rows | 0 hit_percent | 34.4947735191637631
F.40.5. Авторы
Такахиро Итагаки . Нормализацию запросов добавил Питер Гейган .
Pg stat statements как включить
Модуль pg_stat_statements предоставляет возможность отслеживать статистику планирования и выполнения сервером всех операторов SQL.
Этот модуль нужно загружать, добавив pg_stat_statements в shared_preload_libraries в файле postgresql.conf , так как ему требуется дополнительная разделяемая память. Это значит, что для загрузки или выгрузки модуля необходимо перезапустить сервер. Кроме того, для функционирования этого модуля должны вычисляться идентификаторы запросов, что происходит автоматически, когда для параметра compute_query_id задаётся значение auto или on или же загружается сторонний модуль, вычисляющий идентификаторы запросов.
Когда модуль pg_stat_statements активен, он отслеживает статистику по всем базам данных на сервере. Для получения и обработки этой статистики модуль pg_stat_statements предоставляет представления pg_stat_statements и pg_stat_statements_info , а также вспомогательные функции pg_stat_statements_reset и pg_stat_statements . Эти объекты не доступны глобально, но их можно установить в определённой базе данных, выполнив команду CREATE EXTENSION pg_stat_statements .
F.43.1. Представление pg_stat_statements
Статистика, собираемая модулем, выдаётся через представление с именем pg_stat_statements . Это представление содержит отдельные строки для каждой комбинации идентификатора базы данных, идентификатора пользователя, идентификатора запроса и признака верхнего уровня (но в количестве, не превышающем максимальное число различных операторов, которые может отслеживать модуль). Столбцы представления показаны в Таблице F.100.
Таблица F.100. Столбцы pg_stat_statements
userid oid (ссылается на pg_authid . oid )
dbid oid (ссылается на pg_database . oid )
total_plan_time double precision
min_plan_time double precision
max_plan_time double precision
mean_plan_time double precision
stddev_plan_time double precision
total_exec_time double precision
min_exec_time double precision
max_exec_time double precision
mean_exec_time double precision
stddev_exec_time double precision
blk_read_time double precision
blk_write_time double precision
По соображениям безопасности только суперпользователям и членам роли pg_read_all_stats разрешено видеть текст SQL и queryid запросов, выполняемых другими пользователями. Однако другие пользователи могут видеть статистику, если это представление установлено в их базу данных.
Планируемые запросы (то есть SELECT , INSERT , UPDATE и DELETE ) объединяются в одну запись в pg_stat_statements , когда они имеют идентичные структуры запросов согласно внутреннему вычисленному хешу. Обычно два запроса будут считаться равными при таком сравнении, если они семантически равнозначны, не считая значений констант, фигурирующих в запросе. Однако служебные команды (то есть все другие команды) сравниваются строго по текстовым строкам запросов.
Примечание
Нижеприведённые соображения о замене констант и queryid применимы, только если включён compute_query_id. Если же для вычисления queryid вы используете встроенный модуль, обратитесь к его документации.
Когда значение константы игнорируется в целях сравнения запроса с другими запросами, эта константа заменяется в выводе pg_stat_statements обозначением параметра, например, $1 . В остальном этот вывод содержит текст первого запроса, хеш которого равнялся значению queryid , связанному с записью в pg_stat_statements .
В некоторых случаях запросы с визуально различными текстами могут быть объединены в одну запись pg_stat_statements . Обычно это происходит только для семантически равнозначных запросов, но есть небольшая вероятность, что из-за наложений хеша несвязанные запросы могут оказаться объединёнными в одной записи. (Однако это невозможно для запросов, принадлежащих разным пользователям баз данных.)
Так как значение хеша queryid вычисляется по представлениям запроса на стадии после разбора, возможна и обратная ситуация: запросы с одинаковым текстом могут оказаться в разных записях, если они получили различные представления по разным причинам, например, из-за изменения search_path .
Потребители статистики pg_stat_statements могут пожелать использовать в качестве более стабильного и надёжного идентификатора для каждой записи не текст запроса, а queryid (возможно, в сочетании с dbid и userid ). Однако важно понимать, что стабильность значения хеша queryid гарантируется с ограничениями. Так как этот идентификатор получается из дерева запроса после анализа, его значение будет, помимо прочего, зависеть от внутренних идентификаторов объектов, фигурирующих в этом представлении. С этим связано несколько неинтуитивных следствий. Например, pg_stat_statements будет считать два одинаково выглядящих запроса разными, если они обращаются к таблице, которая была удалена, а затем воссоздана между этими запросами. Результат хеширования также чувствителен к различиям в машинной архитектуре и другим особенностям платформы. Более того, не стоит рассчитывать на то, что queryid будет оставаться неизменным при обновлении основных версий Postgres Pro .
Как правило, значения queryid можно считать надёжными и сравнимыми, только с условием, что версия сервера и детали метаданных каталога неизменны. Следовательно, можно ожидать, что два сервера, участвующие в репликации на основе воспроизведения физического WAL, будут иметь одинаковые queryid для одного запроса. Однако схемы с логической репликацией не гарантируют сохранения идентичности реплик во всех имеющих значение деталях, так что queryid не будет полезным идентификатором для накопления показателей стоимости по набору логических реплик. В случае сомнений в том или ином подходе, рекомендуется непосредственно протестировать его.
Обозначения параметров, применяемые для замены констант в представляющем запросы тексте, нумеруются, начиная со следующего за последним параметром $ n в исходном тексте запроса, или с $1 в отсутствие параметров в нём. Стоит отметить, что в некоторых случаях на эту нумерацию могут влиять скрытые символы параметров. Например, PL/pgSQL применяет такие символы для добавления в запросы значений локальных переменных функций, так что оператор PL/pgSQL вида SELECT i + 1 INTO j будет представлен в тексте как SELECT i + $2 .
Текст, представляющий запрос, сохраняется во внешнем файле на диске и не занимает разделяемую память. Поэтому даже очень объёмный текст запроса может быть сохранён успешно. Однако если в файле накапливается много длинных текстов запросов, он может вырасти до неудобоваримого размера. В качестве решения этой проблемы, pg_stat_statements может решить стереть текст запросов, и в результате во всех существующих записях в представлении pg_stat_statements в поле query окажутся значения NULL, хотя статистика, связанная с каждым queryid будет сохранена. Если это происходит и мешает анализу, возможно, стоит уменьшить pg_stat_statements.max для предотвращения таких ситуаций.
Показатели plans и calls не обязательно должны совпадать, так как статистика планирования и выполнения обновляется в конце соответствующей фазы и только при успешном завершении этой фазы. Например, если для оператора успешно выполнилось планирование, но во время выполнения произошла ошибка, изменится только статистика планирования. Если же планирование пропускается по причине использования кешированного плана, увеличивается только счётчик выполнения.
F.43.2. Представление pg_stat_statements_info
Статистика самого модуля pg_stat_statements собирается и выдаётся через представление с именем pg_stat_statements_info . Это представление содержит только одну строку. Столбцы представления показаны в Таблице F.101.
Таблица F.101. Столбцы pg_stat_statements_info
Pg stat statements как включить
The pg_stat_statements module provides a means for tracking planning and execution statistics of all SQL statements executed by a server.
The module must be loaded by adding pg_stat_statements to shared_preload_libraries in postgresql.conf , because it requires additional shared memory. This means that a server restart is needed to add or remove the module. In addition, query identifier calculation must be enabled in order for the module to be active, which is done automatically if compute_query_id is set to auto or on , or any third-party module that calculates query identifiers is loaded.
When pg_stat_statements is active, it tracks statistics across all databases of the server. To access and manipulate these statistics, the module provides views pg_stat_statements and pg_stat_statements_info , and the utility functions pg_stat_statements_reset and pg_stat_statements . These are not available globally but can be enabled for a specific database with CREATE EXTENSION pg_stat_statements .
F.32.1. The pg_stat_statements View #
The statistics gathered by the module are made available via a view named pg_stat_statements . This view contains one row for each distinct combination of database ID, user ID, query ID and whether it’s a top-level statement or not (up to the maximum number of distinct statements that the module can track). The columns of the view are shown in Table F.22.
Table F.22. pg_stat_statements Columns
userid oid (references pg_authid . oid )
OID of user who executed the statement
dbid oid (references pg_database . oid )
OID of database in which the statement was executed
True if the query was executed as a top-level statement (always true if pg_stat_statements.track is set to top )
Hash code to identify identical normalized queries.
Text of a representative statement
Number of times the statement was planned (if pg_stat_statements.track_planning is enabled, otherwise zero)
total_plan_time double precision
Total time spent planning the statement, in milliseconds (if pg_stat_statements.track_planning is enabled, otherwise zero)
min_plan_time double precision
Minimum time spent planning the statement, in milliseconds (if pg_stat_statements.track_planning is enabled, otherwise zero)
max_plan_time double precision
Maximum time spent planning the statement, in milliseconds (if pg_stat_statements.track_planning is enabled, otherwise zero)
mean_plan_time double precision
Mean time spent planning the statement, in milliseconds (if pg_stat_statements.track_planning is enabled, otherwise zero)
stddev_plan_time double precision
Population standard deviation of time spent planning the statement, in milliseconds (if pg_stat_statements.track_planning is enabled, otherwise zero)
Number of times the statement was executed
total_exec_time double precision
Total time spent executing the statement, in milliseconds
min_exec_time double precision
Minimum time spent executing the statement, in milliseconds
max_exec_time double precision
Maximum time spent executing the statement, in milliseconds
mean_exec_time double precision
Mean time spent executing the statement, in milliseconds
stddev_exec_time double precision
Population standard deviation of time spent executing the statement, in milliseconds
Total number of rows retrieved or affected by the statement
Total number of shared block cache hits by the statement
Total number of shared blocks read by the statement
Total number of shared blocks dirtied by the statement
Total number of shared blocks written by the statement
Total number of local block cache hits by the statement
Total number of local blocks read by the statement
Total number of local blocks dirtied by the statement
Total number of local blocks written by the statement
Total number of temp blocks read by the statement
Total number of temp blocks written by the statement
blk_read_time double precision
Total time the statement spent reading data file blocks, in milliseconds (if track_io_timing is enabled, otherwise zero)
blk_write_time double precision
Total time the statement spent writing data file blocks, in milliseconds (if track_io_timing is enabled, otherwise zero)
temp_blk_read_time double precision
Total time the statement spent reading temporary file blocks, in milliseconds (if track_io_timing is enabled, otherwise zero)
temp_blk_write_time double precision
Total time the statement spent writing temporary file blocks, in milliseconds (if track_io_timing is enabled, otherwise zero)
Total number of WAL records generated by the statement
Total number of WAL full page images generated by the statement
Total amount of WAL generated by the statement in bytes
Total number of functions JIT-compiled by the statement
jit_generation_time double precision
Total time spent by the statement on generating JIT code, in milliseconds
Number of times functions have been inlined
jit_inlining_time double precision
Total time spent by the statement on inlining functions, in milliseconds
Number of times the statement has been optimized
jit_optimization_time double precision
Total time spent by the statement on optimizing, in milliseconds
Number of times code has been emitted
jit_emission_time double precision
Total time spent by the statement on emitting code, in milliseconds
For security reasons, only superusers and roles with privileges of the pg_read_all_stats role are allowed to see the SQL text and queryid of queries executed by other users. Other users can see the statistics, however, if the view has been installed in their database.
Plannable queries (that is, SELECT , INSERT , UPDATE , DELETE , and MERGE ) and utility commands are combined into a single pg_stat_statements entry whenever they have identical query structures according to an internal hash calculation. Typically, two queries will be considered the same for this purpose if they are semantically equivalent except for the values of literal constants appearing in the query.
Note
The following details about constant replacement and queryid only apply when compute_query_id is enabled. If you use an external module instead to compute queryid , you should refer to its documentation for details.
When a constant’s value has been ignored for purposes of matching the query to other queries, the constant is replaced by a parameter symbol, such as $1 , in the pg_stat_statements display. The rest of the query text is that of the first query that had the particular queryid hash value associated with the pg_stat_statements entry.
Queries on which normalization can be applied may be observed with constant values in pg_stat_statements , especially when there is a high rate of entry deallocations. To reduce the likelihood of this happening, consider increasing pg_stat_statements.max . The pg_stat_statements_info view, discussed below in Section F.32.2, provides statistics about entry deallocations.
In some cases, queries with visibly different texts might get merged into a single pg_stat_statements entry. Normally this will happen only for semantically equivalent queries, but there is a small chance of hash collisions causing unrelated queries to be merged into one entry. (This cannot happen for queries belonging to different users or databases, however.)
Since the queryid hash value is computed on the post-parse-analysis representation of the queries, the opposite is also possible: queries with identical texts might appear as separate entries, if they have different meanings as a result of factors such as different search_path settings.
Consumers of pg_stat_statements may wish to use queryid (perhaps in combination with dbid and userid ) as a more stable and reliable identifier for each entry than its query text. However, it is important to understand that there are only limited guarantees around the stability of the queryid hash value. Since the identifier is derived from the post-parse-analysis tree, its value is a function of, among other things, the internal object identifiers appearing in this representation. This has some counterintuitive implications. For example, pg_stat_statements will consider two apparently-identical queries to be distinct, if they reference a table that was dropped and recreated between the executions of the two queries. The hashing process is also sensitive to differences in machine architecture and other facets of the platform. Furthermore, it is not safe to assume that queryid will be stable across major versions of PostgreSQL .
As a rule of thumb, queryid values can be assumed to be stable and comparable only so long as the underlying server version and catalog metadata details stay exactly the same. Two servers participating in replication based on physical WAL replay can be expected to have identical queryid values for the same query. However, logical replication schemes do not promise to keep replicas identical in all relevant details, so queryid will not be a useful identifier for accumulating costs across a set of logical replicas. If in doubt, direct testing is recommended.
The parameter symbols used to replace constants in representative query texts start from the next number after the highest $ n parameter in the original query text, or $1 if there was none. It’s worth noting that in some cases there may be hidden parameter symbols that affect this numbering. For example, PL/pgSQL uses hidden parameter symbols to insert values of function local variables into queries, so that a PL/pgSQL statement like SELECT i + 1 INTO j would have representative text like SELECT i + $2 .
The representative query texts are kept in an external disk file, and do not consume shared memory. Therefore, even very lengthy query texts can be stored successfully. However, if many long query texts are accumulated, the external file might grow unmanageably large. As a recovery method if that happens, pg_stat_statements may choose to discard the query texts, whereupon all existing entries in the pg_stat_statements view will show null query fields, though the statistics associated with each queryid are preserved. If this happens, consider reducing pg_stat_statements.max to prevent recurrences.
plans and calls aren’t always expected to match because planning and execution statistics are updated at their respective end phase, and only for successful operations. For example, if a statement is successfully planned but fails during the execution phase, only its planning statistics will be updated. If planning is skipped because a cached plan is used, only its execution statistics will be updated.
Enable pg_stat_statements for PostgreSQL
The pg_stat_statements module provides a means for tracking planning and execution statistics of all SQL statements executed by a server.
Modify PostgreSQL Configuration
warning
The pg_stat_statements module must be loaded by adding pg_stat_statements to shared_preload_libraries in postgresql.conf, because it requires additional shared memory.
To enable pg_stat_statements, you need to modify the following PostgreSQL configuration in PostgreSQL configuration file (e.g. /etc/postgresql/12/main/postgresql.conf ):
shared_preload_libraries = 'pg_stat_statements' pg_stat_statements.track = all
Restart PostgreSQL
After you change the PostgreSQL configuration, you need to restart PostgreSQL to make the change effective.
Create pg_stat_statements Extension for Each Database
Currently, pg_stat_statements only tracks the statistics of the database where the extension is created. So you need to create the extension for each database.
CREATE EXTENSION IF NOT EXISTS pg_stat_statements;
You can use the Bytebase Batch Change feature to create the extension for all databases.
Check pg_stat_statements
SELECT count(*) FROM pg_stat_statements;
References
️ Live Demo
We have prepared a guided live demo for you to play with.