Как скопировать динамический массив c
Кроме отдельных динамических объектов в языке C++ мы можем использовать динамические массивы. Для выделения памяти под динамический массив также используется оператор new , после которого в квадратных скобках указывается, сколько массив будет содержать объектов:
int *numbers ; // динамический массив из 4 чисел // или так // int *numbers = new int[4];
Причем в этом случае оператор new также возвращает указатель на объект типа int — первый элемент в созданном массиве.
В данном случае определяется массив из четырех элементов типа int, но каждый из них имеет неопределенное значение. Однако мы также можем инициализировать массив значениями:
int *numbers1 >; // массив состоит из чисел 0, 0, 0, 0 int *numbers2 >; // массив состоит из чисел 1, 2, 3, 4 int *numbers3 >; // массив состоит из чисел 1, 2, 0, 0 // аналогичные определения массивов // int *numbers1 = new int[4]<>; // массив состоит из чисел 0, 0, 0, 0 // int *numbers1 = new int[4](); // массив состоит из чисел 0, 0, 0, 0 // int *numbers2 = new int[4]< 1, 2, 3, 4 >; // массив состоит из чисел 1, 2, 3, 4 // int *numbers3 = new int[4]< 1, 2 >; // массив состоит из чисел 1, 2, 0, 0
При инициализации массива конкретными значениями следует учитывать, что если значений в фигурных скобках больше чем длина массива, то оператор new потерпит неудачу и не сможет создать массив. Если переданных значений, наоборот, меньше, то элементы, для которых не предоставлены значения, инициализируются значением по умолчанию.
Стоит отметить, что в стандарт С++20 добавлена возможность выведения размера массива, поэтому, если применяется стандарт С++20, то можно не указывать длину массива:
int *numbers >; // массив состоит из чисел 1, 2, 3, 4
После создания динамического массива мы сможем с ним работать по полученному указателю, получать и изменять его элементы:
int *numbers >; // получение элементов через синтаксис массивов std::coutПричем для доступа к элементам динамического массива можно использовать как синтаксис массивов ( numbers[0] ), так и операцию разыменования ( *numbers )
Соответственно для перебора такого массива можно использовать различные способы:
unsigned n< 5 >; // размер массива int* p < new int[n] < 1, 2, 3, 4, 5 >>; // используем индексы for (unsigned i<>; i < n; i++) < std::cout std::cout ; i < n; i++) < std::cout std::cout ; q != p + n; q++) < std::cout std::coutОбратите внимание, что для задания размера динамического массива мы можем применять обычную переменную, а не константу, как в случае со стандартными массивами.
Для удаления динамического массива и освобождения его памяти применяется специальная форма оператора delete :
delete [] указатель_на_динамический_массив;#include int main() < unsigned n< 5 >; // размер массива int* p < new int[n] < 1, 2, 3, 4, 5 >>; // используем индексы for (unsigned i<>; i < n; i++) < std::cout std::cout
Чтобы после освобождения памяти указатель не хранил старый адрес, также рекомендуется обнулить его:
delete [] p; p = nullptr; // обнуляем указательМногомерные массивы
Также мы можем создавать многомерные динамические массивы. Рассмотрим на примере двухмерных массивов. Что такое по сути двухмерный массив? Это набор массив массивов. Соответственно, чтобы создать динамический двухмерный массив, нам надо создать общий динамический массив указателей, а затем его элементы - вложенные динамические массивы. В общем случае это выглядит так:
#include int main() < unsigned rows = 3; // количество строк unsigned columns = 2; // количество столбцов int** numbers>; // выделяем память под двухмерный массив // выделяем память для вложенных массивов for (unsigned i<>; i < rows; i++) < numbers[i] = new int[columns]<>; > // удаление массивов for (unsigned i<>; i < rows; i++) < delete[] numbers[i]; >delete[] numbers; >Вначале выделяем память для массива указателей (условно таблицы):
int** numbers>;Затем в цикле выделяем память для каждого отдельного массива (условно строки таблицы):
numbers[i] = new int[columns]<>;Освобождение памяти идет в обратном порядке - сначала освобождаем память для каждого отдельного вложенного массива, а затем для всего массива указателей.
Пример с вводом и выводом данных двухмерного динамического массива:
#include int main() < unsigned rows = 3; // количество строк unsigned columns = 2; // количество столбцов int** numbers>; // выделяем память под двухмерный массив for (unsigned i<>; i < rows; i++) < numbers[i] = new int[columns]<>; > // вводим данные для таблицы rows x columns for (unsigned i<>; i < rows; i++) < std::cout ; j < columns; j++) < std::cout > numbers[i][j]; > > // вывод данных for (unsigned i<>; i < rows; i++) < // выводим данные столбцов i-й строки for (unsigned j<>; j < columns; j++) < std::cout std::cout for (unsigned i<>; i < rows; i++) < delete[] numbers[i]; >delete[] numbers; >Пример работы программы:
Enter data for 1 row 1 column: 2 2 column: 3 Enter data for 2 row 1 column: 4 2 column: 5 Enter data for 3 row 1 column: 6 2 column: 7 2 3 4 5 6 7Указатель на массив
От типа int** , который представляет указатель на указатель (pointer-to-pointer) следует отличать ситуацию "указатель на массив" (pointer to array). Например:
#include int main() < unsigned n; // количество строк int (*a)[2] = new int[n][2]; int k<>; // устанавливаем значения for (unsigned i<>; i < n; i++) < // устанавливаем данные для столбцов i-й строки for (unsigned j<>; j < 2; j++) < a[i][j] = ++k; >> // вывод данных for (unsigned i<>; i < n; i++) < // выводим данные столбцов i-й строки for (unsigned j<>; j < 2; j++) < std::cout std::cout // удаляем данные delete[] a; a = nullptr; >Здесь запись int (*a)[2] представляет указатель на массив из двух элементов типа int. Фактически мы можем работать с этим объектом как с двухмерным массивом (таблицей), только количество столбцов в данном случае фиксировано - 2. И память для такого массива выделяется один раз:
int (*a)[2] = new int[n][2];То есть в данном случае мы имеем дело с таблице из n строк и 2 столцов. Используя два индекса (для строки и столца), можно обращаться к определенному элементу, установить или получить его значение. Консольный вывод данной программы:
1 2 3 4 5 6Реализация шаблона класса “Динамический массив”
Рассмотрим реализацию класса dynamic_array - динамический массив, то есть массив, размер которого может изменяться.
Реализация класса представляет собой шаблон, параметром шаблона является тип хранимых в массиве элементов.
Закрытые поля класса:
m_size - размер массива (количество элементов в массиве, доступных пользователю).
m_capacity - "вместимость" массива, то есть размер выделенной памяти для хранения элементов. При увеличении размера массива если новый размер не превосходит m_capacity, то новые элементы можно создать в массиве без выделения дополнительной памяти.
m_data - указатель на область памяти, где хранятся сами элементы массива.
template
class dynamic_array
private:
int m_size;
int m_capacity;
T * m_data;Конструкторы и деструкторы
Конструктор по умолчанию создает пустой массив, не содержащий элементов.
public:
dynamic_array()
m_size = 0;
m_capacity = 0;
m_data = NULL;
>Копи-конструктор создает копию существующего массива. Он нужен для того, чтобы при создании копии массива выделить новую память для хранения данных копии массива и скопировать туда все элементы. Если не сделать копи-конструктор, то при создании копии массива поле m_data у копии будет указывать на ту же область памяти, что и у исходного массива. Поэтому если в классе используется динамическое распределение памяти, то всегда необходимо создавать копи-конструктор.
dynamic_array(const dynamic_array
& a)
m_size = a.m_size;
m_capacity = m_size;
m_data = NULL;
if (m_size != 0)
m_data = new T[m_size];
else
m_data = 0;
for (int i = 0; i < m_size; ++i)
m_data[i] = a.m_data[i];
>Конструктор, который создает массив заданного размера.
dynamic_array(int size)
m_size = size;
m_capacity = size;
if (size != 0)
m_data = new T[size];
else
m_data = 0;
>Деструктор необходим для того, чтобы освободить выделенную память при удалении объекта.
~dynamic_array()
if (m_data)
delete[] m_data;
>Изменение размера массива
Метод resize изменяет размер массива, новый размер передается параметром size . Если значение size не превосходит значения m_capacity , то этот метод только изменяет значение поля m_size , иначе необходимо перевыделить память - выделяется новая область памяти для хранения элементов, существующие элементы массива копируются из старой области памяти в новую, выделенная ранее память освобождается.
Для того, чтобы память не выделялась слишком часто, размер выделенной памяти удваивается по сравнению со старым размером массива.
void resize(int size)
if (size > m_capacity)
int new_capacity = max(size, m_size * 2);
T * new_data = new T[new_capacity];
for (int i = 0; i < m_size; ++i)
new_data[i] = m_data[i];
delete[] m_data;
m_data = new_data;
m_capacity = new_capacity;
>
m_size = size;
>Метод push_back добавляет один новый элемент в конец массива.
void push_back(T val)
resize(m_size + 1);
m_data[m_size - 1] = val;
>Метод size возвращает размер массива.
int size() const
return m_size;
>Доступ к элементам массива
Доступ к элементам массива перегрузим оператор [] . Это позволит обращаться к элементам класса dynamic_array так же, как к элементам обычного массива: a[i] .
Массивы в C++
Продолжаем серию «C++, копаем вглубь». Цель этой серии — рассказать максимально подробно о разных особенностях языка, возможно довольно специальных. Это четвертая статья из серии, первые три, посвященные перегрузке в C++, находятся здесь, здесь и здесь.
Эта статья посвящена массивам. Массивы можно отнести к наиболее древним слоям C++, они пришли из первых версий C. Тем не менее, массивы вошли в объектно-ориентированную систему типов C++, хотя и с определенными оговорками. Программисту важно знать об этих особенностях, чтобы избежать потенциальных ошибок. В статье также рассмотрено другое наследие C – тривиальные типы и неинициализированные переменные. Часть нововведений C++11, С++14, С++17 затрагивают работу с массивами, все эти новые возможности также подробно описаны. Итак, попробуем рассказать о массивах все.
Оглавление
Оглавление
1. Общие положения
Массив является простейшим агрегатным типом. Он моделирует набор однотипных элементов, расположенных подряд в непрерывном отрезке памяти. Массивы в той или иной форме поддерживаются практически всеми языками программирования и неудивительно, что они появились в первых версиях C и затем стали частью C++.
1.1. Объявление массивов
Если T некоторый тип, N константа или выражение, вычисляемое во время компиляции, то инструкция
T a[N];объявляет переменную a типа «массив из N элементов типа T » (array of N elements of the type T ). Тип N должен иметь неявное приведение к типу std::size_t , а его значение, называемое размером массива, должно быть больше нуля. Массив располагается в непрерывном отрезке памяти, под каждый элемент массива выделяется sizeof(T) байт, соответственно размер памяти, необходимой для размещения всего массива, равен N*sizeof(T) байт. Эта величина ограничена сверху платформой и компилятором. Тип массива обозначается как T[N] , то есть он включает тип элементов и размер массива. Таким образом, массивы, имеющие одинаковый тип элементов, но разный размер, будут иметь разный тип.
Такие массивы еще называют встроенными массивами (regular arrays), чтобы подчеркнуть отличие от других вариантов массивов, термин «массив» используется в программировании и в том числе в C++ достаточно широко.
Вот примеры правильных объявлений массивов:const int N = 8; constexpr int Square(int n) < return n * n; >int a1[1]; int a2[N]; int a3['Q']; int a4[Square(2)];А вот примеры некорректных объявлений массивов:
int n; int b1[0]; // нулевой размер int b2[n]; // размер нельзя определить во время компиляции int b3["Q"]; // размер нельзя привести к size_tДоступ к элементам массива осуществляется через индексатор, значения индекса от 0 до N-1 . Вот пример:
int a[4]; a[0] = 42; int t = a[3];Выход за границы массива не контролируется, ошибка может привести к неопределенному поведению.
В одной инструкции можно объявить несколько массивов, но размер должен быть указан для каждого.
int a[4], b[8];Для типов массивов можно вводить псевдонимы. Можно использовать традиционный вариант с ключевым словом typedef :
typedef int I4[4];или более современный (C++11) с ключевым словом using :
using I4 = int[4];После этого массивы объявляются как простые переменные:
I4 a, b;Это будет то же самое, что
int a[4], b[4];1.2. Операторы и стандартные функции для работы с массивами
Для работы с массивами можно использовать оператор sizeof и несколько стандартных функций и макросов.
Оператор sizeof возвращает полный размер массива в байтах, то есть размер элемента умноженный на размер массива.
Макрос _countof() (в MSVS заголовочный файл ) возвращает размер массива, то есть количество элементов. В С++17 появился стандартный шаблон функции std::size() , которая делает то же самое (а еще имеет перегруженную версию, которая определяет размер стандартного контейнера).
int a[4]; std::cout16 4В C++11 в стандартной библиотеке появились свободные (не члены) шаблоны функций std::begin() и std::end() . Вызванная для массива std::begin() возвращает указатель на первый элемент массива, std::end() на past-the-last элемент. (Есть также константные версии: std::cbegin() , std::cend() .) Это позволяет использовать массивы в диапазонном for .
int a[4]< 4, 3, 2, 1 >; for (auto t : a)А также в стандартных алгоритмах:
std::sort(std::begin(a), std::end(a));1.3. Размещение в памяти
Если массив объявлен статически, то есть в глобальной области видимости, в области видимости пространства имен или в качестве статического члена класса, то он размещается в статической памяти. Массивам, объявленным локально, память выделяется на стеке. (Естественно, надо учитывать ограниченный размер стека при выборе размера локальных массивов.) Нестатические члены класса размещаются в границах экземпляра класса. Динамические массивы (см. раздел 6) размещаются в динамической памяти.
1.4. Ограничения на типы элементов массивов
Нельзя объявить массив, элементы которого имеют тип void .
Нельзя объявить массив ссылок.
int u, v; int &rr[2] = < u, v >; // ошибкаВместо этого можно использовать массив константных указателей.
int * const rr[2] = < &u, &v >;(Синтаксис инициализации массивов будет обсуждаться в разделе 3.2.)
В C++11 появился шаблон std::reference_wrapper<> . Он эмулирует интерфейс ссылки, но экземпляры конкретизации можно хранить в контейнерах и встроенных массивах. Но все же эмуляция интерфейса ссылки не совсем полная, иногда приходится использовать функцию-член get() . Вот пример.
int u = 42, v = 5; std::reference_wrapper rr[2] = < u, v >; std::coutНельзя объявить массив функций.
int ff[2](double); // ошибкаВместо этого можно использовать массив указателей на функцию.
int (*ff[2])(double);Шаблон std::reference_wrapper<> можно конкретизировать типом функции, но преимуществ перед указателем практически нет — функцию и так можно вызвать через указатель без разыменования, а инициализировать указатель именем функции без оператора & . Есть еще вариант эмулирования массива функций — это использование шаблона std::function<> , но этот шаблон является темой отдельного разговора.
Массив нельзя объявить с помощью ключевого слова auto .
auto x[2] = // ошибкаКвалификатор const не применим к типу массива, а только к типам его элементов.
using I4 = int[4]; const I4 ci; // то же, что и const int ci[4];2. Сведение и копирование массивов
В данном разделе рассматриваются особенности массивов, которые выделяют их из общей системы типов C++.
2.1. Сведение
Как было сказано выше, размер массива является составной частью типа массива, но в определенных ситуациях она теряется и это делает тип массива в некотором смысле «неполноценным». Эта потеря называется сведение (decay, array-to-pointer decay). (Для перевода термина «decay» еще используется слово «низведение», также можно встретить «разложение».) Суть сведения заключается в том, что почти в любом контексте массив преобразуется к указателю на первый элемент и информация о размере теряется. Исключениями являются оператор sizeof , оператор & (взятия адреса) и инициализация ссылки на массив. Оператор sizeof рассматривался в разделе 1.2, указатели и ссылки на массивы будут подробно рассмотрены в разделе 4. Объявление с помощью ключевого слова decltype также правильно определяет тип массива, без сведения.
Конечно, тесную связь массивов и указателей отрицать нельзя. Вот стандартный (в стиле C) способ обработать все элементы массива:
const int N = 100; int a[N]; for (int *d = a, *end = d + N; dНо все же сведение можно отнести к сишным архаизмам и с ним надо быть внимательным и аккуратным, иначе можно столкнуться с не самыми приятными неожиданностями.
Вот как сведение влияет на объявления функций. Функции
void Foo(int a[4]); void Foo(int a[]); void Foo(int *a);не являются перегруженными функциями — это одно и то же. Размер надо передавать дополнительным параметром или использовать специальное соглашение для определения размера (например, завершающий ноль для строк).
При внешнем связывании массива также происходит сведение.
// file 1 int A[4]; // file 2 extern int A[];Для размера также надо использовать дополнительную переменную или использовать специальное соглашение для определения размера.
При объявлении переменной с помощью ключевого слова auto также происходит сведение.
int a[4]; auto da = a; // тип da выводится как int*При конкретизации шаблона функции
template void Foo(T t);тип параметра шаблонной функции также будет выведен как указатель, если аргумент является массивом.
Сведение вызывает дополнительные проблемы при использовании наследования. (В C ведь нет наследования.) Рассмотрим пример.
class B* . */> ; class D : public B* . */> ; void Foo(B[], int size); // обработка массива элементов типа BСледующий код компилируется без ошибок и предупреждений.
D d[4]; Foo(d, _countof(d));2.2. Копирование
Наряду со сведением (и тесно связанная с ним) есть еще одна особенность типа массива, которая делает его в некотором смысле «неполноценным». Массивы не поддерживают привычный синтаксис инициализации и присваивания, основанный на семантике копирования:
using I4 = int[4]; I4 a; I4 b = a; // ошибка I4 b; // ошибка I4 b(a); // ошибка I4 b2; b2 = a; // ошибкаТакже функция не может возвращать массив.
I4 Foo(); // ошибкаНо если массив является членом класса/структуры/объединения, то копирующий конструктор и соответствующий оператор присваивания, генерируемые компилятором, выполняют поэлементное копирование такого массива.
struct X < int A[4]; >; X x = < >; X x2 = x; // копирование X x3; // копирование X x4; x4 = x; // присваивание X Foo() // возвращаемое значение функции < return < >; >Еще одна ситуация, когда происходит копирование массива — это захват массива по значению в лямбда-выражении.
intptr_t x[4]; auto f = [x]() < return sizeof(x) / sizeof(x[0]); >; std::coutНо если используется инициализирующий захват (C++14), то происходит сведение.
intptr_t u[4]; auto g = [x = u]() < return sizeof(x) / sizeof(x[0]); >; std::cout3. Инициализация массивов
Для описания правил инициализации массивов необходимо кратко рассказать о тривиальных типах.
3.1. Тривиальные типы и неинициализированные переменные
Конструкторы и деструкторы можно назвать ключевыми элементами объектной модели С++. При создании объекта обязательно вызывается конструктор, а при удалении — деструктор. Но проблемы совместимости с С вынудили сделать некоторое исключение, и это исключение называется тривиальные типы. Они введены для моделирования сишных типов и сишного жизненного цикла переменных, без обязательного вызова конструктора и деструктора. Сишный код, если он компилируется и выполняется в С++, должен работать так же, как в С. К тривиальным типам относятся числовые типы, указатели, перечисления, а также классы, структуры, объединения и массивы, состоящие из тривиальных типов. Классы и структуры должны удовлетворять некоторым дополнительным условиям: отсутствие пользовательского конструктора, деструктора, копирования, присваивания, виртуальных функций.
Переменная тривиального типа будет неинициализированной, если не использовать какой-нибудь вариант явной инициализации. Для тривиального класса компилятор может сгенерировать конструктор по умолчанию и деструктор. Конструктор по умолчанию обнуляет объект, деструктор ничего не делает. Но этот конструктор будет сгенерирован и использован только, если использовать какой-нибудь вариант явной инициализации, иначе переменная останется неинициализированной.
Неинициализированная переменная устроена следующим образом: если она объявлена в области видимости пространства имен (глобально), будет иметь все биты нулевыми, если локально, или создана динамически, то получит случайный набор битов. Понятно, что использование такой переменной может привести к непредсказуемому поведению программы. Массивы достаточно часто имеют тривиальный тип и поэтому эта проблема для них весьма актуальна.
Неинициализированные константы тривиального типа выявляет компилятор, иногда он выявляет и другие неинициализированные переменные, но с этой задачей лучше справляются статические анализаторы кода.
В стандартной библиотеке С++11 есть шаблоны, называемые свойствами типов (заголовочный файл ). Один из них позволяет определить, является ли тип тривиальным. Выражение std::is_trivial::value имеет значение true , если T тривиальный тип и false в противном случае.
3.2. Синтаксис инициализации массивов
3.2.1. Общие положения
Если не использовать явную инициализацию, то для массивов нетривиального типа гарантируется вызов конструктора по умолчанию для каждого элемента. Естественно, что в этом случае такой конструктор должен быть, иначе возникает ошибка. Но для массивов тривиального типа или, если конструктор по умолчанию отсутствует или не устраивает, необходимо использовать явную инициализацию.
Со времен C массивы можно было инициализировать с помощью синтаксиса агрегатной инициализации:
int a[4] = < 1, 2, 3, 4 >;В С++11 появилась универсальная инициализация (uniform initialization) и теперь можно инициализировать так:
int a[4]< 1, 2, 3, 4 >;Для универсальной инициализации также можно использовать =, и различать эти два типа инициализации не всегда просто, а, скорее всего, не очень нужно.
Размер массива можно не указывать, тогда он определится по числу инициализаторов.
int a[] < 1, 2, 3, 4 >;Если размер массива указан, то число инициализаторов не должно быть больше размера массива. Если размер массива больше числа инициализаторов, то для оставшихся элементов гарантируется вызов конструктора по умолчанию (который, естественно, должен быть), в том числе и для тривиальных типов. Таким образам, указав пустой список инициализации, мы гарантируем вызов конструктора по умолчанию для всех элементов массива тривиального типа.
int a[4]<>;Массивы констант тривиального типа требуют обязательного списка инициализации.
const int a[4] = < 3, 2, 1 >;Число инициализаторов может быть меньше размера массива, в этом случае оставшиеся элементы инициализируются конструктором по умолчанию.
Символьные массивы можно инициализировать строковым литералом.
const char str[] = "meow"; const wchar_t wstr[] = L"meow";Размер такого массива будет на единицу больше числа символов строки, нужно хранить завершающий нулевой символ.
3.2.2. Инициализация членов класса
В С++11 появилась возможность инициализировать массивы, являющиеся нестатическими членами класса. Это можно сделать двумя способами: непосредственно при объявлении или в списке инициализации членов при определении конструктора.
class X < int a[4]< 1, 2, 3, 4 >; int b[2]; // . public: X(int u, int v) : b < u, v ><> // . >;Правда в этом случае надо всегда явно задавать размер массива, неявное определение размера через список инициализации не разрешается.
Статические массивы, как и ранее, можно инициализировать только при определении, размер массива может быть определен через список инициализации.
class X < static int A[]; // . >; int X::A[] = < 1, 2, 3, 4 >;В C++17 появилась возможность объявлять статические члены (включая массивы) как inline . Таки члены можно инициализировать при объявлении, определение не обязательно.
class X < inline static int A[]< 1, 2, 3, 4 >; // . >;3.2.3. Требования к инициализаторам
Выражения, стоящие в списке инициализации, вычисляются непосредственно перед инициализацией, они не обязаны быть известными на стадии компиляции (конечно, за исключением массивов, объявленных как constexpr ). Требования к элементам списка инициализации такие же как и к аргументу функции, имеющей параметр того же типа, что и элемент массива — должно существовать неявное преобразование от типа элемента списка инициализации к типу элемента массива. Пусть у нас есть объявление массива:
Наличие нужного преобразования эквивалентно корректности инструкции
T t = x1;Элемент списка инициализации может быть сам списком инициализации. В этом случае корректность этой инструкции также гарантирует корректную инициализацию элемента массива.
class Int < int m_Value; public: Int(int v) : m_Value(v) <>// . >; // . int x, y; // . Int rr[] = < x, y >;Если мы объявим конструктор Int как explicit , то последнее объявление станет некорректным. В этом случае придется писать
Int rr[] = < Int(x), Int(y) >;Этот пример также демонстрирует как с помощью списка инициализации мы можем создать массив для типа у которого нет конструктора по умолчанию. Но в этом случае число инициализаторов должно совпадать с размером массива.
4. Указатели и ссылки на массивы
4.1. Указатели на массивы
Пусть у нас объявлен массив
T a[N];Указатель на этот массив объявляется и инициализируется следующим образом:
T(*pa)[N] = &a;Для получения указателя используется традиционный оператор & . Тип указателя на массива обозначается как T(*)[N] .
Обратим внимание на использование скобок, без них мы получим объявление массива из N элементов типа указатель на T .
Указатель на массив — это не указатель на первый элемент (хотя побитово они, конечно, совпадают), здесь нет никакого сведения. Это полноценный тип, который «знает» размер массива. Поэтому при инициализации размеры должны совпадать.
int a[4]; int(*pa)[4] = &a; // OK int(*p2)[2] = &a; // ошибка, размеры не совпадаютПри инкременте указатель на массив увеличивается на размер всего массива, а не на размер элемента.
Для доступа к элементу массива через указатель надо использовать оператор * и индексатор.
(*pa)[3] = 42;При использовании псевдонимов можно получить более привычный синтаксис объявления указателя на массив.
using I4 = int[4]; I4 a< 1, 2, 3, 4 >; I4 *pa = &a;Также можно использовать auto , компилятор правильно выводит тип переменной как указатель на массив исходя из типа инициализатора.
int a[4]; auto pa = &a; // тип pa выводится как int(*)[4]Понимание указателей на массивы необходимо для правильной работы с многомерными массивами, которые подробно будут рассмотрены далее.
4.2. Ссылки на массивы
Пусть у нас объявлен массив
T a[N];Ссылка на этот массив объявляется и инициализируется следующим образом:
Как и для любой ссылки, инициализация переменной типа ссылка на массив является обязательной. Тип ссылки на массива обозначается как T(&)[N] .
Также ссылку на массив можно инициализировать разыменованным указателем на массив.
T(*pa)[N] = &a; T(&ra)[N] = *pa;Как и указатель, ссылка «знает» размер массива. Поэтому при инициализации размеры должны совпадать.
int a[4]; int(&ra)[4] = a; // OK int(&r2)[2] = a; // ошибка, размеры не совпадаютДоступ к элементу массива через ссылку осуществляется так же, как и через идентификатор массива.
ra[3] = 0;Ссылки на массивы как раз и являются теми средствами, с помощью которых можно обойти сведение.
void Foo(T(&a)[N]);ожидает аргументы типа T[N] , указатели для нее не подходят.
При использовании псевдонимов можно получить более привычный синтаксис объявления ссылки на массив.
using I4 = int[4]; I4 a< 1, 2, 3, 4 >; I4 &ra = a;Также можно использовать auto , компилятор выводит тип переменной как ссылка на массив.
int a[4]; auto &ra = a; // тип ra выводится как int(&)[4]Обратите внимание на наличие & после auto , без него произошло бы сведение, и тип ra вывелся бы как int* .
При конкретизации шаблона функции
template void Foo(T& t);тип параметра шаблонной функции также будет выведен как ссылка на массив, если аргумент является массивом.
Особенно удобно использовать шаблоны с выводом типа и размера массива.
template void Foo(T(&a)[N]);При конкретизации такого шаблона компилятор выводит тип элементов T и размер массива N (который гарантировано больше нуля). В качестве аргументов можно использовать только массивы, указатели будут отвергнуты. Именно этот прием используется при реализации макроса _countof() и шаблона функции std::size() , а так же шаблонов функций std::begin() и std::end() , которые обеспечивают для массивов реализацию диапазонного for и делают более комфортной работу с алгоритмами. В разделе 5 приведен пример реализации такого шаблона.
5. Многомерные массивы
C++ не поддерживает настоящие многомерные массивы, то есть выражение a[N, M] некорректно, но многомерность моделируется в виде «массива массивов», то есть можно использовать выражение a[N][M] .
Если T некоторый тип, N и M выражения, допустимые для определения размера массива, то инструкция
T a[N][M];объявляет a как массив массивов, массив из N элементов, каждый из которых является массивом из M элементов типа T . Такой массив будем называть двумерным массивом. Выражение a[i][j] , где i от 0 до N-1 , j от 0 до M-1 , дает доступ к элементам этого массива. Первый индекс выбирает массив из массива массивов, второй выбирает элемент в этом массиве. Значение N можно назвать внешним размером двумерного массива, M внутренним. Тип многомерного массива обозначается как T[N][M] .
Выражение a[i] является массивом из M элементов типа T . Соответственно к нему может быть применено сведение, у него можно взять адрес или использовать для инициализации ссылки.
T *dai = a[i]; T(*pai)[M] = &a[i]; T(&rai)[M] = a[i];Сведение преобразует массив к указателю на элемент. Для двумерного массива этот элемент сам является массивом, а значит двумерный массив сводится к указателю на массив.
T a[N][M]; T(*da)[M] = a;Таким образом, при передаче двумерного массива в функцию следующие варианты объявления соответствующего параметра эквивалентны:
void Foo(T a[N][M]); void Foo(T a[][M]); void Foo(T(*a)[M]);Это означает, что внешний размер двумерного массива теряется и его надо передавать отдельным параметром.
При использовании псевдонимов можно получить более лаконичный синтаксис объявления двумерных массивов.
using I4 = int[4]; I4 b[2];Это то же самое, что
int b[2][4];Двумерные массивы инициализируются следующим образом:
int b[2][4] = , >;Если нужно гарантировать только инициализацию по умолчанию, то можно использовать пустой список инициализации <> . Определения размера по списку инициализации возможно только по внешнему размеру.
int b[][4] = , >; // ОК int b[][] = , >; // ошибкаМожно получить указатель на двумерный массив:
T a[N][M]; T(*pa)[N][M] = &a;Также можно получить ссылку. Вот пример использования ссылки на двумерный массив.
template void Print2dArray(T(&a)[N][M]) < for (int i = 0; i < N; ++i) < for (int j = 0; j < M; ++j) < std::cout std::cout > // . int b[2][4] = , >; Print2dArray(b);1 2 3 4 5 6 7 8Двумерный массив хорошо согласуется с математическими матрицами. В объявлении
T mtx[N][M];N можно интерпретировать как число строк матрицы, M как число столбцов, тогда mtx[i][j] это элемент матрицы находящийся на пересечении i -й строки и j -го столбца, а mtx[i] это массив размера M , который представляет i -ю строку матрицы. Соответственно, такая матрица располагается в памяти по строкам. Правда в математике принято нумеровать строки и столбцы с единицы, а не с нуля.
6. Динамические массивы
В C++ отсутствует тип «динамический массив». Имеются только операторы для создания и удаления динамического массива, доступ к нему осуществляется через указатели на начало массива (своего рода полное сведение). Размер такого массива надо хранить отдельно. Динамические массивы желательно инкапсулировать в C++ классы.
6.1. Создание и удаление динамического массива
Если T некоторый тип, n переменная, значение которой может определяются в процессе выполнения программы, то инструкция
T *pa = new T[n];создает массив в динамической памяти. Тип переменной n должен приводиться к std::size_t , значение может быть нулем. Размер памяти, необходимой для размещения массива, то есть n*sizeof(T) , ограничен сверху платформой и компилятором. Переменная pa указывает на первый элемент массива.
Если тип T тривиальный, то элементы будут иметь случайное значение, в противном случае для инициализации элементов будет использован конструктор по умолчанию.
В C++11 появилась возможность использовать список инициализации.
int *pa = new int[n];Если число инициализаторов больше размера массива, то лишние не используются (компилятор может выдать ошибку, если значение n известно на стадии компиляции). Если размер массива больше числа инициализаторов, то для оставшихся элементов гарантируется вызов конструктора по умолчанию, в том числе и для тривиальных типов. Таким образам, указав пустой список инициализации, мы гарантируем вызов конструктора по умолчанию для всех элементов массива тривиального типа.
Оператор new[] сначала выделяет память для всего массива. Если выделение прошло успешно, то, если T нетривиальный тип или есть список инициализации, вызывается конструктор для каждого элемента массива начиная с нулевого. Если какой-нибудь конструктор выбрасывает исключение, то для всех созданных элементов массива вызывается деструктор в порядке, обратном вызову конструктора, затем выделенная память освобождается. Стандартные функции выделения памяти при невозможности удовлетворить запрос выбрасывают исключение типа std::bad_alloc .
Динамический массив удаляется оператором delete[] , который применяется к указателю, возвращаемому оператором new[] .
delete[] pa;При этом, если при создании массива использовался конструктор, то для всех элементов массива вызывается деструктор в порядке, обратном вызову конструктора (деструктор не должен выбрасывать исключений), затем выделенная память освобождается.
В остальных отношениях указатель pa , возвращаемый оператором new[] , является просто указателем на начало массива, через него нельзя (во всяком случае «законно») получить размер массива, этот размер надо хранить отдельно. Соответственно с динамическим массивом нельзя использовать диапазонный for . Указатели в C/C++ поддерживают индексатор (встроенный оператор [] ), поэтому доступ к элементам динамического массива выглядит так же, как и к обычному массиву, контроля за корректностью индекса нет.
6.2. Динамические массивы и интеллектуальные указатели
Стандартный интеллектуальный указатель std::unique_ptr<> можно использовать для управления жизненным циклом динамического массива (см. [Josuttis]). Он имеет частичную специализацию для массивов (см. раздел 7), которая перегружает оператор [] вместо операторов -> и * , а также использует оператор delete[] в качестве удалителя по умолчанию. Вот пример:
int n = 100; std::unique_ptraptr(new int[n]); for (int i = 0; i Эта поддержка не является полноценной: не хранится информация о размере массива, поэтому нет возможности контролировать корректностью индекса, не поддерживается интерфейс стандартных контейнеров и диапазонный for .
В C++14 появилась возможность создать динамический массив и инициализировать им экземпляр std::unique_ptr<> с помощью std::make_unique<> :
auto aptr = std::make_unique(n); При этом гарантируется инициализация элементов массива по умолчанию, в том числе и для тривиальных типов.
Интеллектуальный указатель std::shared_ptr<> стал поддерживать такую специализацию только в C++17, а использование std::make_shared<> для этой специализации появилось только в C++20.
В качестве альтернативы такому использованию интеллектуальных указателей можно рекомендовать std::vector<> .
6.3. Многомерные динамические массивы
Динамический массив не может быть динамическим по нескольким измерениям, то есть выражение new T[n][m] , где оба значения n и m определяются в процессе выполнения программы, не корректно. Но мы можем создать динамический массив, каждый элемент которого является встроенным массивом с размером, известным на стадии компиляции. Если M выражение, допустимое для определения размера массива, то следующая инструкция создает такой массив:
T(*pa)[M] = new T[n][M];Оператор new[] возвращает указатель на массив. Доступ к элементам такого массива будет осуществляться через выражение pa[i][j] , в свою очередь pa[i] будет массив из M элементов типа T .
При использовании псевдонимов можно получить более лаконичный синтаксис.
using I4 = int[4]; I4 *pa = new I4[n];Используя перегрузку оператора [] легко создать класс, который хранит данные в одномерном массиве, но при этом предоставляет интерфейс многомерного массива. Вот пример предельно упрощенного класса матрицы.
template class MatrixView // 2D interface to a buffer < T * const m_Buff; int const m_RowCount; int const m_ColCount; public: MatrixView(T* buff, int rowCount, int colCount) : m_Buff(buff) , m_RowCount(rowCount) , m_ColCount(colCount) <>T *operator[](int rowInd) const < return m_Buff + rowInd * m_ColCount; >>; template class DynBuffer // buffer owner < T* const m_Buff; protected: T* Buff() const < return m_Buff; >; DynBuffer(int length) : m_Buff(new T[length]<>) <> ~DynBuffer() < delete[] m_Buff; >DynBuffer(const DynBuffer&) = delete; DynBuffer& operator=(const DynBuffer&) = delete; >; template class MatrixSimple : DynBuffer, public MatrixView < using Buff = DynBuffer; using View = MatrixView; public: MatrixSimple(int rowCount, int colCount) : Buff(rowCount * colCount) , View(Buff::Buff(), rowCount, colCount) <> >;Вот пример использования:
MatrixSimple mtx(3, 3); mtx[1][2] = 42; // первая строка, второй столбецБолее продвинутый класс матрицы может использовать специальный вложенный proxy-класс, представляющий строку, например RowProxy , и индексатор будет возвращать экземпляр этого класса. Такой класс может, например, контролировать значение индекса, предоставлять функции-члены begin() , end() , etc. Аналогичное решение может быть и для столбцов.
7. Использование массивов в шаблонах
Тип массива можно использовать в качестве шаблонных аргументов и для специализации шаблонов классов.
Можно определить частичную специализацию шаблона класса для массивов не задавая при этом размер массива, то есть для массивов «вообще». Для этого в качестве типа специализации надо использовать T[] . Конечно, можно определить частичную специализацию для массива с заданным размером. Вот пример.
// первичный шаблон template struct U < const char* Tag() const < return "primary"; >>; // частичная специализация для указателей template struct U < const char* Tag() const < return "pointer"; >>; // частичная специализация для массивов template struct U< const char* Tag() const < return "array"; >>; // частичная специализация для массивов с заданным размером template structs U < const char* Tag() const < return "array[N]"; >>; U u1; U u2; U u3; U u4; std::cout primary pointer array array[N]В стандартной библиотеке частичная специализация интеллектуального указателя std::unique_ptr<> и std::shared_ptr<> для массивов используется для управления жизненным циклом динамического массива, подробнее см. раздел 6.2.
Для программирования шаблонов, использующих массивы в качестве шаблонных аргументов, в стандартной библиотеке (заголовочный файл ) имеется несколько свойст типов: std::is_array<> , std::extent<> , std::rank<> , std::remove_extent<> . Вот примеры их использования (в примерах используется появившаяся в C++17 возможность использовать суффикс _v вместо члена value ):
std::cout1 1 1 0 0 4 8 0 1 1 2 0В качестве реального примера использования этих свойст типов приведем немного упрощенное определение перегруженного варианта шаблона функции std::make_unique<> для массивов (см. раздел 6.2):
template && extent_v == 0, int> s = 0> unique_ptr make_unique(size_t size) < using elem_t = remove_extent_t; // тип элемента массива return unique_ptr(new elem_t[size]<>); >Шаблоны функций не поддерживают частичную специализацию, поэтому здесь используется техника, которая называется отключение шаблонов (template disabling). Этот шаблон будет отключен, то есть не будет конкретизироваться, для любых аргументов шаблона, тип которых отличается от T[] . Соответственно, перегруженный вариант std::make_unique<> для аргументов шаблона остальных типов аналогичным способом будет отключен для T[] .
8. Стандартные альтернативы массивам
Стандартная библиотека предоставляет несколько классов (точнее шаблонов классов), которые рекомендуется использовать вместо массивов.
Вместо встроенных массивов рекомендуется использовать шаблон std::array<> . (Появился в C++11, см. [Josuttis].) Этот шаблон является объектной оберткой встроенного массива, он имеет два шаблонных параметра: тип элементов и размер. Размер должен быть известен на стадии компиляции, но в отличии от встроенного массива может быть нулевым. Вот пример:
std::array a;Этот шаблон поддерживает индексатор и традиционный интерфейс стандартного контейнера.
for (int i = 0; i < a.size(); ++i) < std::cout for (auto it = a.begin(); it != a.end(); ++it) < std::cout for (auto t : a)Вместо динамических массивов рекомендуется использовать std::vector<> . Этот шаблон хорошо известен программистам, подробно описан в литературе (стандартный контейнер №1), поэтому каких-то дополнительных подробностей можно не приводить.
Есть еще довольно специфический и не особо популярный шаблон std::valarray<> . Он позволяет эмулировать интерфейс многомерных массивов.
Список литературы
[Josuttis]
Джосаттис, Николаи М. Стандартная библиотека C++: справочное руководство, 2-е изд.: Пер. с англ. — М.: ООО «И.Д. Вильямс», 2014.Как скопировать массив в динамический массив? (Си)
Есть массив char str[] = "abcdef"; И динамический массив: char *dstr = (char*)malloc(sizeof(char) * N); Как скопировать str[] в dstr[] ? P.S. Заранее извиняюсь, если вопрос глупый.
Отслеживать
задан 24 мая 2018 в 20:10
Denis Komarov Denis Komarov
53 1 1 серебряный знак 7 7 бронзовых знаков2 ответа 2
Сортировка: Сброс на вариант по умолчанию
Есть 3 способа, нативное копирование области памяти, специальной функцией копирования строк, посимвольный перебор массива и запись в dstr .
memcpy(&str, &dstr, strlen(str) + 1); // Копирование области памятиstrcpy(dstr, str); // Специальная функция для строки// Перебор массива циклом. int strsize = strlen(str) + 1; for(int i = 0; iИмейте ввиду, в обоих случаях вы должны быть уверены что размер dstr больше на 1 чем длина строки str .
Отслеживать
Спасибо большое.
24 мая 2018 в 20:40Вместо i < strsize лучше использовать str[i] , тогда и длину считать не придётся. Кстати, в случае с длиной можно было использовать 24 мая 2018 в 21:44
Код содержит ошибки/странности! Если strsize = strlen(str) + 1 , то тогда правильная позиция для замыкающего нуля - это dstr[strsize - 1] , а не dstr[strsize] . Вы на самом деле уже скопировали этот ноль основным циклом. dstr[strsize] = '\0' уже делать не надо и позиция dstr[strsize] для нуля - неправильная.
24 мая 2018 в 22:21
@Qwertiy♦: Нолик и так уже "сам копируется" благодаря strsize = strlen(str) + 1 . А финальное dstr[strsize] = '\0' - это какая-то ненужная бессмыслица.
24 мая 2018 в 22:24
@Qwertiy Я бы в переборе не использовал strlen - по сути лишний проход по массиву. Достаточно int i; for(i = 0; str[i]; i++) dstr[i] = str[i]; dstr[i] = 0;
25 мая 2018 в 2:28
В данном случае (создание копии строки, не содержащей двоичных нулей) проще всего
(а если размер исходной строки не известен, то и не менее эффективно, чем использование malloc с последующими вызовами strlen , а затем strcpy или memcpy )
вызвать strdup#include . char str[] = "abcdef"; char *dstr = strdup(str);Конечно, возвращаемый указатель стоит проверить на NULL (аналогично использованию malloc ).