Перейти к содержимому

Как создать массив без размера с

  • автор:

Массивы

В структуре данных массива можно хранить несколько переменных одного типа. Чтобы объявить массив, следует указать тип его элементов. Если требуется, чтобы массив мог хранить элементы любого типа, можно указать object в качестве его типа. В унифицированной системе типов C# все типы, стандартные и определяемые пользователем, ссылочные типы и типы значений напрямую или косвенно наследуются из Object.

type[] arrayName; 

Массив имеет следующие свойства:

  • Массив может быть одномерным, многомерным или многомерным.
  • Число измерений задается при объявлении переменной массива. Длина каждого измерения устанавливается при создании экземпляра массива. Эти значения нельзя изменить во время существования экземпляра.
  • Массив массивов является массивом массивов, и каждый массив элементов имеет значение null по умолчанию.
  • Массивы индексируются от нуля: массив с n элементами индексируется от 0 до n-1 .
  • Элементы массива могут иметь любой тип, в том числе тип массива.
  • Типы массивов — это ссылочные типы, производные от абстрактного базового типа Array. Все массивы реализуют IList и IEnumerable. Для итерации по массиву можно использовать оператор foreach. Одномерные массивы также реализуют IList и IEnumerable .

Элементы массива можно инициализировать в известные значения при создании массива. Начиная с C# 12, все типы коллекций можно инициализировать с помощью выражения Collection. Элементы, которые не инициализированы, имеют значение по умолчанию. Значение по умолчанию — это 0-разрядный шаблон. Все ссылочные типы (включая типы, не допускающие значение NULL), имеют значения null . Все типы значений имеют 0-разрядные шаблоны. Это означает, Nullable.HasValue что свойство имеет false значение, и Nullable.Value свойство не определено. В реализации Value .NET свойство создает исключение.

В следующих примерах создаются одномерные массивы, многомерные массивы и массивы массивов:

// Declare a single-dimensional array of 5 integers. int[] array1 = new int[5]; // Declare and set array element values. int[] array2 = [1, 2, 3, 4, 5, 6]; // Declare a two dimensional array. int[,] multiDimensionalArray1 = new int[2, 3]; // Declare and set array element values. int[,] multiDimensionalArray2 = < < 1, 2, 3 >, < 4, 5, 6 >>; // Declare a jagged array. int[][] jaggedArray = new int[6][]; // Set the values of the first array in the jagged array structure. jaggedArray[0] = [1, 2, 3, 4]; 

Одномерные массивы

Одномерный массив — это последовательность таких элементов. Доступ к элементу осуществляется через его индекс. Индекс — это порядковое положение в последовательности. Первый элемент в массиве находится в индексе 0 . Для создания одномерного массива используется оператор new и указывается тип элементов массива и число элементов. В следующем примере объявляются и инициализируется одномерные массивы:

int[] array = new int[5]; string[] weekDays = ["Sun", "Mon", "Tue", "Wed", "Thu", "Fri", "Sat"]; Console.WriteLine(weekDays[0]); Console.WriteLine(weekDays[1]); Console.WriteLine(weekDays[2]); Console.WriteLine(weekDays[3]); Console.WriteLine(weekDays[4]); Console.WriteLine(weekDays[5]); Console.WriteLine(weekDays[6]); /*Output: Sun Mon Tue Wed Thu Fri Sat */ 

Первое объявление объявляет неинициализированный массив из пяти целых чисел от array[0] до array[4] . Элементы массива инициализируются до значения по умолчанию для типа элемента. Для целых чисел это 0 . Второе объявление объявляет массив строк и инициализирует все семь значений этого массива. Оператор foreach выполняет итерацию элементов массива weekday и выводит все значения. Для одномерных массивов оператор обрабатывает элементы в увеличении порядка индексов foreach , начиная с индекса 0 и заканчивая индексом Length — 1 .

Передача одномерных массивов в качестве аргументов

Инициализированный одномерный массив можно передать в метод. В следующем примере массив строк инициализируется и передается в качестве аргумента в метод DisplayArray для строк. Этот метод отображает элементы массива. Затем метод ChangeArray размещает элементы массива в обратном порядке, а метод ChangeArrayElements изменяет первые три элемента массива. После возврата каждого метода метод DisplayArray показывает, что передача массива по значению не препятствует изменению элементов массива.

class ArrayExample < static void DisplayArray(string[] arr) =>Console.WriteLine(string.Join(" ", arr)); // Change the array by reversing its elements. static void ChangeArray(string[] arr) => Array.Reverse(arr); static void ChangeArrayElements(string[] arr) < // Change the value of the first three array elements. arr[0] = "Mon"; arr[1] = "Wed"; arr[2] = "Fri"; >static void Main() < // Declare and initialize an array. string[] weekDays = ["Sun", "Mon", "Tue", "Wed", "Thu", "Fri", "Sat"]; // Display the array elements. DisplayArray(weekDays); Console.WriteLine(); // Reverse the array. ChangeArray(weekDays); // Display the array again to verify that it stays reversed. Console.WriteLine("Array weekDays after the call to ChangeArray:"); DisplayArray(weekDays); Console.WriteLine(); // Assign new values to individual array elements. ChangeArrayElements(weekDays); // Display the array again to verify that it has changed. Console.WriteLine("Array weekDays after the call to ChangeArrayElements:"); DisplayArray(weekDays); >> // The example displays the following output: // Sun Mon Tue Wed Thu Fri Sat // // Array weekDays after the call to ChangeArray: // Sat Fri Thu Wed Tue Mon Sun // // Array weekDays after the call to ChangeArrayElements: // Mon Wed Fri Wed Tue Mon Sun 

Многомерные массивы

Массивы могут иметь несколько измерений. Например, следующие объявления создают четыре массива: два имеют два измерения, два имеют три измерения. Первые два объявления объявляют длину каждого измерения, но не инициализировать значения массива. Во втором двух объявлениях используется инициализатор для задания значений каждого элемента в многомерном массиве.

int[,] array2DDeclaration = new int[4, 2]; int[,,] array3DDeclaration = new int[4, 2, 3]; // Two-dimensional array. int[,] array2DInitialization = < < 1, 2 >, < 3, 4 >, < 5, 6 >, < 7, 8 >>; // Three-dimensional array. int[,,] array3D = new int[,,] < < < 1, 2, 3 >, < 4, 5, 6 >>, < < 7, 8, 9 >, < 10, 11, 12 >> >; // Accessing array elements. System.Console.WriteLine(array2DInitialization[0, 0]); System.Console.WriteLine(array2DInitialization[0, 1]); System.Console.WriteLine(array2DInitialization[1, 0]); System.Console.WriteLine(array2DInitialization[1, 1]); System.Console.WriteLine(array2DInitialization[3, 0]); System.Console.WriteLine(array2DInitialization[3, 1]); // Output: // 1 // 2 // 3 // 4 // 7 // 8 System.Console.WriteLine(array3D[1, 0, 1]); System.Console.WriteLine(array3D[1, 1, 2]); // Output: // 8 // 12 // Getting the total count of elements or the length of a given dimension. var allLength = array3D.Length; var total = 1; for (int i = 0; i < array3D.Rank; i++) < total *= array3D.GetLength(i); >System.Console.WriteLine($" equals "); // Output: // 12 equals 12 

Для многомерных массивов элементы пересекаются таким образом, что индексы самого правого измерения увеличиваются сначала, а затем следующее левое измерение и т. д. до самого левого индекса. В следующем примере перечисляется как 2D, так и трехмерный массив:

int[,] numbers2D = < < 9, 99 >, < 3, 33 >, < 5, 55 >>; foreach (int i in numbers2D) < System.Console.Write($""); > // Output: 9 99 3 33 5 55 int[,,] array3D = new int[,,] < < < 1, 2, 3 >, < 4, 5, 6 >>, < < 7, 8, 9 >, < 10, 11, 12 >> >; foreach (int i in array3D) < System.Console.Write($""); > // Output: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 

В массиве 2D можно считать левый индекс строкой и правым индексом в качестве столбца .

Однако с многомерными массивами, используя вложенный цикл, вы можете более контролировать порядок обработки элементов массива:

int[,,] array3D = new int[,,] < < < 1, 2, 3 >, < 4, 5, 6 >>, < < 7, 8, 9 >, < 10, 11, 12 >> >; for (int i = 0; i < array3D.GetLength(0); i++) < for (int j = 0; j < array3D.GetLength(1); j++) < for (int k = 0; k < array3D.GetLength(2); k++) < System.Console.Write($""); > System.Console.WriteLine(); > System.Console.WriteLine(); > // Output (including blank lines): // 1 2 3 // 4 5 6 // // 7 8 9 // 10 11 12 // 

Передача многомерных массивов в качестве аргументов

Инициализированный многомерный массив можно передать в метод так же, как и одномерный массив. В следующем коде показано разделяемое объявление метода печати, который принимает в качестве аргумента двухмерный массив. Новый массив можно инициализировать и передать за один шаг, как показано в следующем примере. В следующем примере инициализируется двухмерный массив целых чисел, который передается в метод Print2DArray . Этот метод отображает элементы массива.

static void Print2DArray(int[,] arr) < // Display the array elements. for (int i = 0; i < arr.GetLength(0); i++) < for (int j = 0; j < arr.GetLength(1); j++) < System.Console.WriteLine("Element(,)=", i, j, arr[i, j]); > > > static void ExampleUsage() < // Pass the array as an argument. Print2DArray(new int[,] < < 1, 2 >, < 3, 4 >, < 5, 6 >, < 7, 8 >>); > /* Output: Element(0,0)=1 Element(0,1)=2 Element(1,0)=3 Element(1,1)=4 Element(2,0)=5 Element(2,1)=6 Element(3,0)=7 Element(3,1)=8 */ 

Массивы массивов

Массив массивов — это массив, элементы которого являются массивами и могут быть различных размеров. Многообразный массив иногда называется массивом массивов. Его элементы являются ссылочными типами и инициализированы в null . В следующих примерах показано, как объявлять и инициализировать массивы массивов, а также получать доступ к ним. Первый пример объявляется jaggedArray в одной инструкции. Каждый содержащийся массив создается в последующих инструкциях. Второй пример jaggedArray2 объявлен и инициализирован в одной инструкции. Массивы массивов и многомерные массивы можно смешивать. Последним примером jaggedArray3 является объявление и инициализация одномерного массива, содержащего три двухмерных элемента массива разных размеров.

int[][] jaggedArray = new int[3][]; jaggedArray[0] = [1, 3, 5, 7, 9]; jaggedArray[1] = [0, 2, 4, 6]; jaggedArray[2] = [11, 22]; int[][] jaggedArray2 = [ [1, 3, 5, 7, 9], [0, 2, 4, 6], [11, 22] ]; // Assign 77 to the second element ([1]) of the first array ([0]): jaggedArray2[0][1] = 77; // Assign 88 to the second element ([1]) of the third array ([2]): jaggedArray2[2][1] = 88; int[][,] jaggedArray3 = [ new int[,] < , >, new int[,] < , , >, new int[,] < , , > ]; Console.Write("", jaggedArray3[0][1, 0]); Console.WriteLine(jaggedArray3.Length); 

Элементы массива должны быть инициализированы перед их использованием. Каждый из элементов является массивом. Кроме того, можно использовать инициализаторы для заполнения элементов массива значениями. При использовании инициализаторов не требуется размер массива.

В этом примере создается массив, элементы которого являются массивами. Все элементы массива имеют разный размер.

// Declare the array of two elements. int[][] arr = new int[2][]; // Initialize the elements. arr[0] = [1, 3, 5, 7, 9]; arr[1] = [2, 4, 6, 8]; // Display the array elements. for (int i = 0; i < arr.Length; i++) < System.Console.Write("Element(): ", i); for (int j = 0; j < arr[i].Length; j++) < System.Console.Write("", arr[i][j], j == (arr[i].Length - 1) ? "" : " "); > System.Console.WriteLine(); > /* Output: Element(0): 1 3 5 7 9 Element(1): 2 4 6 8 */ 

Неявно типизированные массивы

Можно создать неявно типизированный массив, в котором тип экземпляра массива выводится из элементов, указанных в инициализаторе массива. Правила для любой неявно типизированной переменной также применяются к неявно типизированным массивам. Дополнительные сведения см. в разделе Неявно типизированные локальные переменные.

В следующих примерах показано, как создать неявно типизированный массив:

int[] a = new[] < 1, 10, 100, 1000 >; // int[] // Accessing array Console.WriteLine("First element: " + a[0]); Console.WriteLine("Second element: " + a[1]); Console.WriteLine("Third element: " + a[2]); Console.WriteLine("Fourth element: " + a[3]); /* Outputs First element: 1 Second element: 10 Third element: 100 Fourth element: 1000 */ var b = new[] < "hello", null, "world" >; // string[] // Accessing elements of an array using 'string.Join' method Console.WriteLine(string.Join(" ", b)); /* Output hello world */ // single-dimension jagged array int[][] c = [ [1,2,3,4], [5,6,7,8] ]; // Looping through the outer array for (int k = 0; k < c.Length; k++) < // Looping through each inner array for (int j = 0; j < c[k].Length; j++) < // Accessing each element and printing it to the console Console.WriteLine($"Element at c[][] is: "); > > /* Outputs Element at c[0][0] is: 1 Element at c[0][1] is: 2 Element at c[0][2] is: 3 Element at c[0][3] is: 4 Element at c[1][0] is: 5 Element at c[1][1] is: 6 Element at c[1][2] is: 7 Element at c[1][3] is: 8 */ // jagged array of strings string[][] d = [ ["Luca", "Mads", "Luke", "Dinesh"], ["Karen", "Suma", "Frances"] ]; // Looping through the outer array int i = 0; foreach (var subArray in d) < // Looping through each inner array int j = 0; foreach (var element in subArray) < // Accessing each element and printing it to the console Console.WriteLine($"Element at d[][] is: "); j++; > i++; > /* Outputs Element at d[0][0] is: Luca Element at d[0][1] is: Mads Element at d[0][2] is: Luke Element at d[0][3] is: Dinesh Element at d[1][0] is: Karen Element at d[1][1] is: Suma Element at d[1][2] is: Frances */ 

В предыдущем примере обратите внимание, что с неявно типизированными массивами квадратные скобки не используются слева от инструкции инициализации. Кроме того, многомерные массивы инициализированы так new [] же, как и одномерные массивы.

При создании анонимного типа, содержащего массив, этот массив необходимо неявно типизировать в инициализаторе объекта типа. В следующем примере contacts представляет собой неявный типизированный массив анонимных типов, каждый из которых содержит массив с именем PhoneNumbers . Ключевое var слово не используется внутри инициализаторов объектов.

var contacts = new[] < new < Name = " Eugene Zabokritski", PhoneNumbers = new[] < "206-555-0108", "425-555-0001" >>, new < Name = " Hanying Feng", PhoneNumbers = new[] < "650-555-0199" >> >; 

Совместная работа с нами на GitHub

Источник этого содержимого можно найти на GitHub, где также можно создавать и просматривать проблемы и запросы на вытягивание. Дополнительные сведения см. в нашем руководстве для участников.

Реализация шаблона класса “Динамический массив”

Рассмотрим реализацию класса dynamic_array — динамический массив, то есть массив, размер которого может изменяться.

Реализация класса представляет собой шаблон, параметром шаблона является тип хранимых в массиве элементов.

Закрытые поля класса:

m_size — размер массива (количество элементов в массиве, доступных пользователю).

m_capacity — «вместимость» массива, то есть размер выделенной памяти для хранения элементов. При увеличении размера массива если новый размер не превосходит m_capacity, то новые элементы можно создать в массиве без выделения дополнительной памяти.

m_data — указатель на область памяти, где хранятся сами элементы массива.

template
class dynamic_array
private:
int m_size;
int m_capacity;
T * m_data;

Конструкторы и деструкторы

Конструктор по умолчанию создает пустой массив, не содержащий элементов.

public:
dynamic_array()
m_size = 0;
m_capacity = 0;
m_data = NULL;
>

Копи-конструктор создает копию существующего массива. Он нужен для того, чтобы при создании копии массива выделить новую память для хранения данных копии массива и скопировать туда все элементы. Если не сделать копи-конструктор, то при создании копии массива поле m_data у копии будет указывать на ту же область памяти, что и у исходного массива. Поэтому если в классе используется динамическое распределение памяти, то всегда необходимо создавать копи-конструктор.

dynamic_array(const dynamic_array & a)
m_size = a.m_size;
m_capacity = m_size;
m_data = NULL;
if (m_size != 0)
m_data = new T[m_size];
else
m_data = 0;
for (int i = 0; i < m_size; ++i)
m_data[i] = a.m_data[i];
>

Конструктор, который создает массив заданного размера.

dynamic_array(int size)
m_size = size;
m_capacity = size;
if (size != 0)
m_data = new T[size];
else
m_data = 0;
>

Деструктор необходим для того, чтобы освободить выделенную память при удалении объекта.

~dynamic_array()
if (m_data)
delete[] m_data;
>

Изменение размера массива

Метод resize изменяет размер массива, новый размер передается параметром size . Если значение size не превосходит значения m_capacity , то этот метод только изменяет значение поля m_size , иначе необходимо перевыделить память — выделяется новая область памяти для хранения элементов, существующие элементы массива копируются из старой области памяти в новую, выделенная ранее память освобождается.

Для того, чтобы память не выделялась слишком часто, размер выделенной памяти удваивается по сравнению со старым размером массива.

void resize(int size)
if (size > m_capacity)
int new_capacity = max(size, m_size * 2);
T * new_data = new T[new_capacity];
for (int i = 0; i < m_size; ++i)
new_data[i] = m_data[i];
delete[] m_data;
m_data = new_data;
m_capacity = new_capacity;
>
m_size = size;
>

Метод push_back добавляет один новый элемент в конец массива.

void push_back(T val)
resize(m_size + 1);
m_data[m_size — 1] = val;
>

Метод size возвращает размер массива.

int size() const
return m_size;
>

Доступ к элементам массива

Доступ к элементам массива перегрузим оператор [] . Это позволит обращаться к элементам класса dynamic_array так же, как к элементам обычного массива: a[i] .

Массивы со статической и динамической размерностью. STL Часть 1

Прежде, чем приступать к обзору контейнерных типов библиотеки STL, разумно освежить в памяти информацию об организации массивов C и C++. Потому что контейнеры STL — это некоторые альтернативные формы организации коллекций данных, свободные от ограничений массивов.

Массивы — одна из самых используемых форм организаций данных, и исторически одна из самых первых форм, появившихся в языках программирования (языки конца 50-х годов XX века). Массив — это представление набора последовательных однотипных элементов. Принципиально важным в таком определении являются 2 момента, которые для массива должны выполняться обязательно:

  1. Каждый элемент массива нужно указать номером его местоположения в последовательности подобных элементов.
  2. Все элементы массива должны обязательно быть однотипными. Всем знакомы и понятны простейшие определения, например, целочисленных массивов: int array [ 100 ] . Но это вовсе не означает, что в массивы могут организовываться только простейшие встроенные типы языка C++. В массив могут организовываться объекты-переменные любого составного типа (класса, структуры) и степени сложности. Единственным ограничением является то, что все элементы одного массива должны быть одного типа. Например, так может описываться студенческая группа:

Массивы со статической и динамической размерностью, контейнеры STL C++ , Standard Template Library

К этому крайне важному обстоятельству — типы элементов массива — мы ещё вернёмся в дальнейшем.

Ещё со времён самых ранних языков программирования (FORTRAN и др.), на массивы накладывалось сильное ограничение: размер массива должен определяться только целочисленной константой, значение которой должно быть определено на момент компиляции кода. То же самое ограничение сохранилось и в языке C, который стал прародителем C++. Например:

Массивы со статической и динамической размерностью, контейнеры STL C++ , Standard Template Library

В C++ (в классическом, кроме стандартов последних лет!) это ограничение незначительно ослаблено до того, что размер массива может быть целочисленной константой, значение которой может вычисляться на момент компиляции кода. Например, так:

Одномерные массивы и циклы

Что такое “цикл” уже рассказывалось во введении.

Цикл с предусловием

Цикл с предусловием характеризуется тем, что перед выполнением каждой итерации проверяется заданное условие. Если это условие ложно, то цикл прекращается. Таким образом, в случае если условие ложно с самого начала, цикл не выполнится ни разу.

while ( /* условие повторения, круглые скобки обязательны */ ) < // действия, выполняемые в цикле >

Вечный цикл на основе while:

while (true) < // действия, выполняемые в цикле >

Для выхода из цикла “посередине” предназначена инструкция break . Также часто удобно использовать return , что позволяет прекратить выполнение сразу всех вложенных циклов в данной функции.

while (true) < /* действия */ if ( /* условие выхода */ ) break; /* действия */ > // Сюда приходим при выполнении break.

Например, можно модифицировать пример так, чтобы в случае ввода признака конца файла происходил выход из программы, а ошибки ввода игнорировались как и прежде. Для этого добавим “посередине” комбинацию if-break:

while (true) < cout "Enter a sequence of integers:\n"; for (int i; cin >> i;) cout << i ' '; if (cin.eof()) break; cout "\nPress Enter to repeat\n"; console_delay(); >

Цикл с постусловием

Цикл с постусловием отличается от цикла с предусловием тем, что условие повторения проверяется после каждой итерации (т.е. является условием продолжения цикла). Соответственно, хотя бы один раз цикл выполнится.

На практике цикл do-while применяется намного реже цикла while.

do < // действия, выполняемые в цикле > while( /* условие продолжения, круглые скобки обязательны */ );

Цикл for

Цикл for в C является “общим типом” цикла и используется значительно чаще while и do-while.

Например, вечный цикл на основе for записывается следующим образом:

for (;;) < // действия, выполняемые в цикле >

Следующие два цикла эквивалентны:

while (condition()) perform_action(); for (; condition();) perform_action();

Общий вид конструкции for следующий:

for ( /* определение переменных */ ; /* условие повторения */ ; /* инкремент */ ) < // действия, выполняемые в цикле >

Определение переменных может содержать определение группы переменных (одного типа), либо просто произвольное выражение, которое вычисляется однажды перед входом в цикл. Определённые в этой локации переменные существуют только во время выполнения цикла и видны только из тела цикла.

Условие повторения проверяется перед каждой итерацией. Таким образом, цикл for может не выполнить ни одной итерации.

Инкремент — произвольное выражение, которое вычисляется после каждой итерации.

// Вывести таблицу квадратов натуральных чисел от 1 до 10. for (int i = 1; i 10; ++i) cout "i == " << i "\ti squared == " 

Пример простого вложенного цикла for (двойной цикл):

// Вывести таблицу умножения for (int i = 1; i 10; ++i) < for (int j = 1; j 10; ++j) < cout "\t"; // Столбец. > cout // Строчка. >

Нередко новички в языке C или C++ пытаются записать подобный двойной цикл одной инструкцией for:

// Вывести таблицу умножения? for (int i = 1, j = 1; i 10, j 10; ++i, ++j) cout "\t";

Данный цикл будет перебирать пары значений переменных i, j вида 1, 1; 2, 2; … 10, 10 (всего 10 итераций) и выведет таблицу квадратов. Более того, конструкция i

Оператор запятая , вычисляет левую часть (до запятой), отбрасывает результат, затем вычисляет правую часть (после запятой). Этот оператор был введён в C как раз для того, чтобы было удобно записывать несколько действий внутри инкремента цикла for, и пригождается в некоторых других случаях, поэтому иногда будет встречаться в примерах. Оператор , отличается от запятой, разделяющей элементы в списках (например, параметры функции). Чтобы “включить” оператор , в контексте списка, надо взять выражение в скобки: sin( (++x, y) ) выполнит ++x и вернёт sin(y) .

Статические массивы

В случае, когда требуется группа однотипных значений определённого размера, удобно воспользоваться средством языка программирования, называемым массив array . Простейшей формой организации массивов в языке C++ являются одномерные статические массивы.

Слово одномерный означает, что для выбора конкретного значения из группы используется одно целое число — порядковый номер этого значения — его индекс (от лат. index — “указательный палец”). У такого массива единственное измерение, имеющее размер, равный количеству элементов в массиве. Индексы в C и C++ всегда отсчитываются от нуля (первый элемент) до размера измерения – 1 (последний элемент). Размер массива не может быть меньше единицы.

Слово статический означает, что память под массив распределяется компилятором (“статически”). При этом, однако, “статический” массив может размещаться в автоматической памяти и быть локальной переменной функции. Размер статического массива должен быть известен на момент компиляции (константа времени компиляции) и не может быть изменён во время работы программы.

Далее представлен простой пример, демонстрирующий определение статического массива и обращение к его элементам (с помощью оператора [] ).

// Определение -- глобальный статический массив из 10 элементов типа float. float global_array[10]; // Заполняет global_array конкретными значениями. void fill_global_array() < for (int i = 0; i < 10; ++i) global_array[i] = i * i; /* Элементу с индексом i присваивается значение, равное квадрату i */ > // Печатает содержимое global_array. void print_global_array() < for (int i = 0; i < 10; ++i) std::cout '\n'; > // Вывести значения в массиве. #include int main() < fill_global_array(); print_global_array(); return 0; >

В примере выше размер задан конкретным числом, но использование в таких целях непосредственно чисел чревато ошибками: если изменить размер массива в его определении, то можно забыть изменить его в других местах. Если выполнять автоматическую замену числа в тексте, то каждый случай замены надо проверять, а для больших программ это неудобно. Поэтому лучше определять размер в виде именованной константы и затем везде использовать не конкретное число, а его название.

// Размер массива -- глобальная константа времени компиляции. // Размеры массивов имеют тип size_t. const size_t GLOBAL_ARRAY_SIZE = 10; // Определение -- глобальный статический массив. float global_array[GLOBAL_ARRAY_SIZE]; // Заполняет global_array конкретными значениями. void fill_global_array() < for (size_t i = 0; i < GLOBAL_ARRAY_SIZE; ++i) global_array[i] = i * i; /* Элементу с индексом i присваивается значение, равное квадрату i */ > // Печатает содержимое global_array. void print_global_array() < for (int i = 0; i < GLOBAL_ARRAY_SIZE; ++i) std::cout '\n'; >

Указатели и массивы

Указатели являются адресами в явной форме и широко применяются при работе с массивами. Массив автоматически приводится к указателю на свой первый элемент. Для указателей допускается “арифметика указателей”. Эта арифметика напоминает аффинную структуру поверх векторного пространства: вектора можно и складывать, и вычитать, и умножать на число, а точки можно только вычитать, получая вектор. Также можно добавлять к точке или вычитать из точки вектор, получая другую точку. Аналогично с указателями: роль “векторов” играют целые числа, роль “точек” — указатели.

Указатели можно вычитать, получая целое число со знаком — смещение offset от одного указателя к другому в элементах массива, на которые указывают эти указатели. Если указатели не указывают на элементы одного массива, то попытка вычислить их разность приводит к неопределённому поведению. И наоборот, к указателю на некоторый элемент массива можно добавить (или вычесть из него) целое число (смещение), чтобы получить указатель на другой элемент массива, отстоящий от первого на заданное смещением число элементов. Полученный указатель может “выходить” на верхнюю границу массива, указывая на несуществующий элемент, который шёл бы сразу за последним элементом массива. Разность между таким указателем и указателем на первый элемент массива (на начало массива) равна размеру массива. Наконец, указатели позволяют обращаться к ним как к массивам, что эквивалентно обращению к смещённому на индекс указателю.

int arr[100] = <>; int *a = arr; // то же, что &arr[0] arr[50] = 50; assert(a[50] == arr[50]); a += 25; // сдвинуть указатель на 25 элементов вперёд assert(a[25] == 50); assert(a - &arr[0] == 25); // Обращение по индексу эквивалентно обращению по смещённому указателю: assert(*(a + 25) == 50); // а можно даже так, ведь сумма здесь коммутативна: assert("character array"[10] == 10["character array"]);

Указатели можно сравнивать не только на “равно” и “не равно”, но и “меньше”, “больше” и т.д. При этом p < q эквивалентно p - q < 0 .

Часто с указателями используются операции инкремента ++ и декремента -- . Они передвигают указатель на, соответственно, следующий и предыдущий элементы. Рассмотрим пример — копирование массива символов до первого нулевого символа (включая его):

size_t str_copy(char *dest, const char *src, size_t dest_size) < size_t copied = 0; while (copied != dest_size && *dest++ = *src++) ++copied; // нулевой символ не считаем в общем числе скопированных return copied; >

Здесь *dest++ и *src++ передвигают соответствующие указатели на одну позицию вперёд, но так как постинкремент возвращает старое значение переменной, то именно это старое значение указателя подвергается разыменованию, поэтому мы получаем ссылки на символы, стоящие на тех позициях, на которые указывали dest и src до инкремента.

Определение размера массива и передача массива в функцию

Размер статического массива в контексте видимости его объявления или определения можно запросить у компилятора (ведь размер известен на момент компиляции). Оператор sizeof , применённый к имени массива, возвращает его размер в байтах. Чтобы получить количество элементов, можно разделить размер массива в байтах на размер одного элемента.

// Заполняет global_array конкретными значениями. void fill_global_array() < for (size_t i = 0; i < sizeof(global_array) / sizeof(global_array[0]); ++i) global_array[i] = i * i; /* Элементу с индексом i присваивается значение, равное квадрату i */ >

Данный способ применяется в примерах ниже, но следует помнить, что он тоже несёт в себе опасность ошибки. Дело в том, что массивы часто передают по указателю и затем используют этот указатель как массив (для указателя также определён оператор [] , и действует он аналогично). Нередко программисты забывают о том, что некое имя — это уже не имя массива, а имя указателя на него. Оператор sizeof в таком случае возвращает размер указателя в байтах, а не размер массива, на который он указывает. Это очень неприятная ошибка, встречающаяся в реальном ПО, написанном на языке C.

// Попытается заполнить array квадратами. Но не сможет. void fill_with_squares(float array[]) < // Увы, но sizeof(array) / sizeof(array[0]) здесь равно 1 или 2 на большинстве современных систем // и никак не зависит от реального размера массива array. for (size_t i = 0; i < sizeof(array) / sizeof(array[0]); ++i) array[i] = i * i; >

Функция fill_with_squares на самом деле не видит определения массива, который может быть передан ей в качестве параметра. Это легко понять хотя бы исходя из того соображения, что исходный код, который будет использовать данную функцию, может быть написан уже после того, как тело этой функции было откомпилировано (раздельная компиляция).

Синтаксис объявления параметра функции в виде массива на самом деле объявляет передачу адреса массива (указателя на него) и только адреса. Поэтому не важно, какой размер указать там между квадратными скобками — можно не указывать никакого (как в примере). Если этот размер указать, то он может послужить для удобства чтения или в качестве намёка компилятору (с точки зрения оптимизации или предупреждений), но на семантику программы влияния не окажет.

Впрочем, C++ позволяет форсировать определённый размер массива, если принимать массив по ссылке. Например, в следующей функции мы требуем массивы из трёх элементов, представляющие трёхмерные вектора, над которыми выполняется операция “векторное произведение”. Однако такая функция будет работать только со статическими массивами. На практике это может оказаться слишком ограничивающим.

void cross_product(float (&res)[3], float (&left)[3], float (&right)[3]) < res[0] = left[1] * right[2] - left[2] * right[1]; res[1] = left[2] * right[0] - left[0] * right[2]; res[2] = left[0] * right[1] - left[1] * right[0]; >

В C++17 введена стандартная функция size (определённая в ), которая при применении к статическому массиву возвращает его размер в элементах. Применить её ненароком к указателю не получится — будет ошибка компиляции.

// Заполняет global_array конкретными значениями. void fill_global_array() < for (size_t i = 0; i < size(global_array); ++i) global_array[i] = i * i; /* Элементу с индексом i присваивается значение, равное квадрату i */ >

Впрочем, при отсутствии такой стандартной функции, её можно написать самостоятельно. Для этого даже не требуется поддержка компилятором новых стандартов C++. Но требуется использовать такой элемент языка как “шаблон функции” — это материал 2-го семестра.

template class Item, size_t Size> size_t size(Item (&)[Size]) < return Size; >

Итак, правильный способ передачи в функцию массива, размер которого не задан некоторой глобальной константой, состоит в передачи как его адреса, так и его размера. Побочным эффектом такого подхода является возможность передавать части массива (например, все элементы со второго до предпоследнего) — такие части массивов ещё называют срезы slices . Сам массив является наибольшим своим срезом.

// Заполняет array квадратами индексов. void fill_with_squares(float array[], size_t array_sz) < for (size_t i = 0; i < array_sz; ++i) array[i] = i * i; >// Выводим array в консоль. void print_array(float array[], size_t array_sz) < for (size_t i = 0; i < array_sz; ++i) cout '\n'; > int main() < // Локальный статический массив. Его размер виден только внутри main. float squares[100]; // Здесь можно использовать приём на основе sizeof. fill_with_squares(squares, sizeof(squares) / sizeof(squares[0])); print_array(squares, sizeof(squares) / sizeof(squares[0])); return 0; >

Другой способ передачи среза — передать два указателя: один (“begin”) — на первый элемент среза, второй (“end”) — на (возможно, фиктивный) элемент, следующий за последним элементом среза. Таким образом, последовательность элементов задаётся своего рода полуинтервалом [begin, to), называемым также диапазоном range . Проходящий по ней указатель вначале устанавливается на begin, а при достижении им значения end работа прекращается. Например, функцию fill_with_squares для работы с диапазоном можно переписать следующим образом:

// Заполняет [begin, end) квадратами индексов. void fill_with_squares(float* begin, float* end) < // Количество элементов равно разности указателей. for (size_t i = 0; begin + i != end; ++i) begin[i] = i * i; >

Иногда в такой ситуации можно обойтись и без индекса. Например, если мы заполняем массив копиями заранее заданного значения:

// Заполняет [begin, end) копиями value. void fill(float* begin, float* end, float value) < while (begin != end) *begin++ = value; >

Или просто выводим массив в консоль:

// Выводим array в консоль. void print_array(float* begin, float* end) < while (begin != end) cout '\n'; >

Данный подход был обобщён в Стандартной библиотеке C++ в виде принципов работы с абстрактными диапазонами итераторов. Например, вариант fill_with_squares на основе диапазона позволяет переписать пример с заполнением статического массива без использования громоздкого выражения с sizeof. Вместо этого, границы диапазона, соответствующего массиву можно получить с помощью стандартных функций begin и end , определённых в заголовочном файле (C++11). Дополнительный плюс этого подхода в том, что попытка вызвать begin или end от указателя приведёт к ошибке компиляции, т.е. ошибка, аналогичная ошибке с sizeof, здесь невозможна.

int main() < // Локальный статический массив. Его размер виден только внутри main. float squares[100]; // begin(squares) возвращает указатель на первый элемент массива, а // end(squares) возвращает указатель на фиктивный элемент, следующий за последним элементом массива. fill_with_squares(begin(squares), end(squares)); // Вывести в консоль. print_array(begin(squares), end(squares)); return 0; >

Если функция принимает размер массива, а не диапазон, то вместо sizeof всё равно можно использовать комбинацию begin/end: end(squares) - begin(squares) .

Цикл for для диапазона

Данная форма цикла for была введена в язык C++ в стандарте 2011 года и представляет собой вариант цикла “выполнить для каждого элемента”. Итерация выполняется для каждого элемента обобщённого диапазона. Для этого запись вида

for (Type var : range) < // var пробегает по всем элементам range // действия, выполняемые в цикле >

трактуется компилятором приблизительно как следующий код (переменные с префиксом __ не видны из пользовательского кода):

for (auto __begin = std::begin(range), __end = std::end(range); __begin != __end; ++__begin) < Type var = *__begin; // действия, выполняемые в цикле >

Поэтому, например, вместо

 // Вывести в консоль. print_array(begin(squares), end(squares));

можно было написать

 // Вывести в консоль. for (auto i: squares) cout '\n';

При изменении элементов массива в цикле следует указывать ссылочный тип:

 // Возвести каждый элемент squares в квадрат. for (auto &s: squares) s *= s;

Инициализация массива

Статические массивы можно инициализировать непосредственно на месте определения, указывая значения элементов. Если этого не сделать, то глобальные массивы инициализируются нулями, а локальные не инициализируются и могут содержать произвольные значения.

При инициализации не обязательно указывать все элементы — конечные можно опустить. Если указанных элементов меньше, чем размер массива, то оставшиеся в его конце элементы будут инициализированы нулями. И наоборот, при наличии в определении массива непустого инициализирующего выражения не обязательно указывать его размер. Если размер не будет указан явно, то в качестве размера будет взято количество элементов в инициализирующем выражении.

Несколько примеров инициализации (попробуйте запустить этот код).

#include using namespace std; // Макрос для "распечатки" статического массива. #define PRINTA(a) \ for (auto item: a) \ cout  \ cout int main() < // Указан и размер и значения всех элементов. int xyz[3] = < 1, 2, 3 >; PRINTA(xyz); // Последние три элемента будут нули. int zero_tail[6] = < 7, 7, 7 >; PRINTA(zero_tail); // Типичная инициализация локального массива нулями. float zeroes[10] = <>; PRINTA(zeroes); // Размер не указан, определяется количеством значений в инициализаторе. char word[] = < 'w', 'o', 'r', 'd' >; PRINTA(word); // В качестве инициализатора можно использовать строковый литерал. // В конце добавляется нулевой символ, поэтому размер greets 11, а не 10. char greets[] = "greetings!"; PRINTA(greets) sizeof(greets) '\n'; greets[3] = 'a'; cout

Начиная с C++11, писать = в инициализаторе массива не обязательно:

int a[] < 1, 2, 3 >;

есть то же самое, что

int a[] = < 1, 2, 3 >;

Многомерные массивы

Статические массивы

Поддержка многомерных массивов языками C и C++ весьма ограничена. Можно создать статический многомерный массив, который интерпретируется как массив массивов. Например, массив из двух массивов по три элемента типа int:

int arr[2][3] = < < 1, 2, 3 >, < 4, 5, 6 > >;

В памяти такие массивы укладываются последовательно одним блоком, эквивалентным одномерному массиву размера, равного произведению размеров по каждому из измерений. Т.е. в случае приведённого выше примера имеем блок из шести int (24 байта, если int занимает 4 байта), заполненный значениями 1, 2, …, 6 подряд — порядок заполнения в памяти соответствует порядку записи в инициализаторе: первая строка-подмассив из трёх элементов, затем вторая строка-подмассив из трёх элементов.

При обходе такого массива самый правый индекс соответствует элементам, стоящим друг за другом непосредственно, шаг же по прочим индексам равен произведению размеров измерений, стоящих правее. Т.е. arr[i][j] и arr[i][j+1] — соседствуют в памяти, а вот расстояние между адресами arr[i][j] и arr[i+1][j] равно размеру всей строки arr[i] , т.е. 3*sizeof(int) в этом примере.

Статический массив можно передать в функцию по указателю, но при этом необходимо явно указывать размеры всех измерений кроме самого левого, потому что иначе у компилятора не будет информации о том, на каком расстоянии в памяти элементы отстоят друг от друга (неизвестен шаг между ними). Например, можно передать в функцию указатель на массив произвольного размера, состоящий из массивов по три int:

void print(int a[][3], size_t n) < for (size_t i = 0; i < n; ++i) for (size_t j = 0; j < 3; ++j) cout ", "; cout int main() < int arr[2][3] = < < 1, 2, 3 >, < 4, 5, 6 > >; print(arr, 2); >

Более того, так как размеры подмассивов известны компилятору (зашиты в тип параметра a ), то можно оперировать ими как обычными статическими массивами. Например, пробегать по ним, используя форму цикла for для диапазонов:

void print(int a[][3], size_t n) < for (size_t i = 0; i < n; ++i) for (int item: a[i]) cout ", "; cout

Естественный обход многомерного массива осуществляется с помощью вложенных циклов for, каждый из которых перебирает диапазон значений индекса одного из измерений. Статический массив можно обойти целиком с помощью for:

int arr[2][3] = < < 1, 2, 3 >, < 4, 5, 6 > >; for (auto &x: arr) // x -- ссылка на подмассив из трёх элементов for (auto &item: x) cout 

Значок & после auto обозначает ссылку на объект, которая представляет собой неявный указатель и ведёт себя как объект, на который она ссылается (не требует явного разыменования). Во втором цикле for использование ссылки не обязательно (там можно опять поставить просто int как в предыдущем примере), а вот в первом — обязательно. Это связано с тем, что хотя в C++ и возможен тип int[3] (тип элементов массива arr , понимаемого как массив массивов), но невозможны временные значения такого типа. Поэтому оперировать статическими массивами можно только по указателю или завуалированному указателю — ссылке.

При инициализации статических многомерных массивов можно опускать внутренние фигурные скобки. При этом следует помнить, что логика заполнения массива элементами заключается в последовательном копировании заданных значений в массив (от младших адресов в памяти к старшим) и заполнении остатка нулями. Так же как и в случае одномерных массивов, начиная с C++11, можно опускать = в инициализаторе.

// То же самое, что //int arr[2][3] = < < 1, 2, 3 >, < 4, 5, 6 >>; int arr[2][3] < 1, 2, 3, 4, 5, 6 >;

Может быть опасно изменять код, удаляя “лишние” скобки в инициализаторе:

int m[3][3] < < 1 >, // то же, что < 1, 0, 0 >-- остаток забивается нулями < 0, 1 >, // то же, что < 0, 0, 1 > >;

Удалив внутренние скобки, получим запись последовательности < 1, 0, 1, 0, 0, 1, 0, 0, 0 >в m[3][3] (интерпретируемом как m[9])

int m[3][3] < 1, 0, 1, 0, 0, 1 >; /* Получили фактически int m[3][3]   < 1, 0, 1 >, // первые три указанных числа < 0, 0, 1 >, // следующие три указанных числа  < 0, 0, 0 >// остаток забивается нулями. >; -- это совсем не то же самое, что в предыдущем примере! */

Впрочем, статические массивы не очень популярны, а многомерные статические массивы используются только в особых случаях: обычно для матриц заранее фиксированных размеров (например, представляющих линейные отображения в трёхмерном пространстве). Чаще используются динамические массивы.

Многомерные динамические массивы в C и C++ можно реализовать различными способами. Далее представлено три способа.

Динамические массивы

Динамические массивы — массивы, располагающиеся в динамической памяти. В отличие от статических массивов, размер динамических массивов может определяться по ходу выполнения программы.

В C++ предусмотрены операторы new[] для создания динамических массивов (оператор возвращает ненулевой указатель на массив, в случае ошибки бросается исключение) и delete[] для их удаления.

// Создать массив из 5 int, не инициализировать. auto a = new int[5]; // Создать массив из 6 int, инициализировать нулями. auto b = new int[6]<>; assert(b[0] == 0); // Создать массив из 3 int, инициализировать заданными значениями. auto c = new int[3]1, 2, 3>; assert(c[0] == 1 && c[1] == 2 && c[2] == 3); // Создать массив строк, инициализировать по умолчанию (пустые строки). // -- std::string не может быть неинициализированным. auto s = new std::string[10]; assert(s[0] == ""); // Удаление s, c, b, a. delete[] s; delete[] c; delete[] b; delete[] a;

Способ 1

Создать массив указателей на массивы (матрица — вектор векторов). Создать каждый подмассив в виде отдельного динамического массива. Способ позволяет оформлять обращение к элементам динамического многомерного массива так же, как к элементам статического: заключая каждый индекс в квадратные скобки.

// Создать двумерный массив (массив массивов) размеров n, m. int** alloc_2d_array(size_t n, size_t m) < int **a = new int*[n]; // создать массив указателей на массивы int for (size_t i = 0; i < n; ++i) a[i] = new int[m]; // создать каждый подмассив отдельно return a; > // Удалить двумерный массив (массив массивов) со старшим размером n. void free_2d_array(int **a, size_t n) < for (size_t i = 0; i < n; ++i) delete[] a[i]; // удалить каждый подмассив delete[] a; > int main() < auto arr = alloc_2d_array(2, 3); arr[1][2] = 2; // элемент с индексами 1, 2 cout 1][2]; free_2d_array(arr, 2); >

Недостатком данного способа является множество выделений-освобождений динамической памяти и возможная “разбросанность” подмассивов в памяти. (Если бы все элементы массива шли в памяти подряд, то из этого можно было бы извлечь пользу в плане производительности и удобства кодирования некоторых операций.)

Преимуществом данного способа является относительная гибкость: можно, например, заменять или переставлять подмассивы, не затрагивая весь массив (достаточно изменить соответствующие указатели головного массива). Можно даже создавать подмассивы разной длины — “рваный” массив jagged array, ragged array .

Способ 2

Данный способ предполагает другую крайность — явно хранить всё содержимое многомерного массива в виде одномерного массива, переводя многомерные индексы в одномерные. Т.е. явно делать то, что делает компилятор при работе со статическими многомерными массивами.

Массив с размерностями (d0, d1, …, dr–1) содержит d0·d1dr–1 элементов. Количество размерностей r называют рангом rank массива. При укладке их подряд в памяти в духе статического многомерного массива получаем следующую формулу приведения r-мерного (векторного) индекса (i0, i1, …, ir–1) к одномерному индексу I в блоке:

В общем случае его удобно вычислять методом Горнера (только вместо домножения на x домножаем на следующий индекс).

В примерах ниже именно этот способ используется для представления матриц с произвольными размерами. В двумерном случае приведённая выше формула приобретает простой вид: I = i1 + i0 d1 (массив строк, в каждой строке по d1 столбцов). Т.е. индекс по первому измерению надо умножить на размер второго измерения и добавить индекс по второму измерению.

Преимуществами способа 2 являются: удобство кодирования и в среднем большее быстродействие операций, выполняемых над массивом целиком, а также минимизация операций выделения и освобождения памяти, минимизация затрат памяти (нет вспомогательного массива).

Недостатки: выделение сразу большого куска памяти может производиться медленно или быть вовсе невозможным из-за фрагментации кучи; простые операции, вроде перестановки строк, невозможно выполнить простой манипуляцией указателями: необходимо либо явно обменивать все элементы строк, либо применять промежуточное преобразование индексов, либо создавать новый изменённый массив.

Способ 3

Данный способ является гибридом двух предыдущих и удобен в случае двумерных массивов. Память выделяется сразу на все элементы массива (первый блок) и отдельно на головной массив с указателями, которые инициализируются вычислением смещений подмассивов (второй блок). В примере ниже указатель на массив-хранилище записывается “перед” первым элементом головного массива, чтобы можно было корректно удалить хранилище, не опираясь на, возможно, изменённые адреса подмассивов.

int** alloc_2d_array(size_t n, size_t m) < int **a = new int*[n + 1]; // создать головной массив *a++ = new int[n * m]; // создать хранилище a[0] = a[-1]; for (size_t i = 1; i < n; ++i) a[i] = a[i - 1] + m; return a; > void free_2d_array(int **a) < delete[] *--a; // удалить хранилище delete[] a; // удалить головной массив > int main() < auto arr = alloc_2d_array(2, 3); arr[1][2] = 2; // элемент с индексами 1, 2 cout 1][2]; free_2d_array(arr, 2); >

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *