Перейти к содержимому

Как назвать колонки в датафрейме pandas

  • автор:

Как получить список всех имен столбцов в Pandas (методы 4)

Вы можете использовать один из следующих четырех методов, чтобы перечислить все имена столбцов фрейма данных pandas:

Способ 1: Используйте скобки

[column for column in df] 

Способ 2: Используйте tolist()

df.columns.values.tolist () 

Способ 3: использовать список()

list(df) 

Способ 4: используйте list() со значениями столбца

list(df.columns.values ) 

В следующих примерах показано, как использовать каждый из этих методов со следующими пандами DataFrame:

import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame df points assists rebounds blocks 0 25 5 11 6 1 12 7 8 6 2 15 7 10 3 3 14 9 6 2 4 19 12 6 7 5 23 9 5 9 

Способ 1: Используйте скобки

В следующем коде показано, как перечислить все имена столбцов кадра данных pandas с помощью квадратных скобок:

[column for column in df] ['points', 'assists', 'rebounds', 'blocks'] 

Способ 2: Используйте tolist()

В следующем коде показано, как получить список всех имен столбцов с помощью функции .tolist() :

df.columns.values.tolist () ['points', 'assists', 'rebounds', 'blocks'] 

Способ 3: использовать список()

В следующем коде показано, как получить список всех имен столбцов с помощью функции list() :

list(df) ['points', 'assists', 'rebounds', 'blocks'] 

Способ 4: используйте list() со значениями столбца

В следующем коде показано, как перечислить все имена столбцов с помощью функции list() со значениями столбцов:

list(df.columns.values ) ['points', 'assists', 'rebounds', 'blocks'] 

Обратите внимание, что все четыре метода возвращают одинаковые результаты.

Обратите внимание, что для очень больших фреймов данных метод df.columns.values.tolist() работает быстрее всего.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные функции со столбцами кадра данных pandas:

Как переименовать столбцы в Pandas (с примерами)

Вы можете использовать один из следующих трех методов для переименования столбцов в датафрейме данных pandas:

Способ 1: переименовать определенные столбцы

df.rename(columns = , inplace = True ) 

Способ 2: переименовать все столбцы

df.columns = ['new_col1', 'new_col2', 'new_col3', 'new_col4'] 

Способ 3: заменить определенные символы в столбцах

df.columns = df.columns.str.replace('old_char', 'new_char') 

В следующих примерах показано, как использовать каждый из этих методов на практике.

Способ 1: переименовать определенные столбцы

В следующем коде показано, как переименовать определенные столбцы в датафрейме данных pandas:

import pandas as pd #определите DataFrame df = pd.DataFrame() #список названия столбцов list(df) ['team', 'points', 'assists', 'rebounds'] #переименуйте названия колонок df.rename(columns = , inplace = True ) #посмотреть обновленный список названий колонок list(df) ['team_name', 'points_scored', 'assists', 'rebounds'] 

Обратите внимание, что столбцы «команда» и «очки» были переименованы, а имена всех остальных столбцов остались прежними.

Способ 2: переименовать все столбцы

В следующем коде показано, как переименовать все столбцы в датафрейме pandas:

import pandas as pd #define DataFrame df = pd.DataFrame() #list column names list(df) ['team', 'points', 'assists', 'rebounds'] #rename all column names df.columns = ['_team', '_points', '_assists', '_rebounds'] #view updated list of column names list(df) ['_team', '_points', '_assists', '_rebounds'] 

Обратите внимание, что этот метод быстрее использовать, если вы хотите переименовать большинство или все имена столбцов в DataFrame.

Способ 3: заменить определенные символы в столбцах

В следующем коде показано, как заменить определенный символ в имени каждого столбца:

import pandas as pd #определение DataFrame df = pd.DataFrame() #list column names list(df) ['team', 'points', 'assists', 'rebounds'] #rename $ with blank in every column name df.columns = df.columns.str.replace('$', '') #view updated list of column names list(df) ['team', 'points', 'assists', 'rebounds'] 

Обратите внимание, что этот метод позволил нам быстро удалить «$» из имени каждого столбца.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Pandas как добавить название столбцов в первую строку дата фрейма, без промежуточного сохранения в файл

Нужно добавить название столбцов как первую строку в дата фрейм, без сохранения в файл. Данные не для выгрузки в exel. Вот фрейм:

name 1 2 3 4
serg 6 5 87 df
ivan 3 ef d 4
import pandas as pd df = df def data(df): f = [] g = [] x = 2 #Уровень столбца с названиями for i in range(0,len(df.columns)): g.append(df.columns[i][x]) for i in range(0,len(df.iloc[1])): h = [] h.append(g[i]) d = list(df.iloc[:, i]) for j in d: h.append(j) f.append(h) data = pd.DataFrame(f) data = data.T return data 

Добавить в первую строку в dataframe название столбцов. Ничего лучше этого не придумал, может есть какой-то другой способ быстрее и лучше.

Rukovodstvo

статьи и идеи для разработчиков программного обеспечения и веб-разработчиков.

Как переименовать столбец Pandas DataFrame в Python

Введение Pandas [https://pandas.pydata.org/] — это библиотека Python для анализа и обработки данных. Почти все операции в пандах вращаются вокруг DataFrames. Dataframe — это абстрактное представление двумерной таблицы, которая может содержать все виды данных. Они также позволяют нам давать имена всем столбцам, поэтому часто столбцы называются атрибутами или полями при использовании DataFrames. В этой статье мы увидим, как мы можем переименовать уже существующий столбец DataFrame.

Время чтения: 3 мин.

Вступление

Pandas — это библиотека Python для анализа и обработки данных. Почти все операции в pandas вращаются вокруг DataFrame s.

Dataframe — это абстрактное представление двумерной таблицы, которая может содержать все виды данных. Они также позволяют нам давать имена всем столбцам, поэтому часто столбцы называются атрибутами или полями при использовании DataFrames .

В этой статье мы увидим, как мы можем переименовать уже существующие DataFrame .

Есть два варианта управления именами столбцов DataFrame :

  1. Переименование столбцов существующего DataFrame
  2. Назначение имен пользовательских столбцов при создании нового DataFrame

Давайте посмотрим на оба метода.

Переименование столбцов существующего фрейма данных

У нас есть образец DataFrame ниже:

1 2 3 4 
 import pandas as pd  data = 'Name':['John', 'Doe', 'Paul'],  'age':[22, 31, 15]>  df = pd.DataFrame(data) 

DataFrame df выглядит так:

оригинальный фрейм данныхpandas

Чтобы переименовать столбцы этого DataFrame , мы можем использовать метод rename() который принимает:

  1. Словарь в качестве columns содержащий сопоставление исходных имен столбцов с именами новых столбцов в виде пар ключ-значение
  2. boolean значение в качестве inplace , которое, если установлено в True , внесет изменения в исходный Dataframe

Давайте изменим имена столбцов в нашем DataFrame с Name, age на First Name, Age .

 df.rename(columns = 'Name' : 'First Name', 'age' : 'Age'>, inplace = True) 

Теперь наш df содержит:

столбец переименования фрейма данныхpandas

Назначьте имена столбцов при создании фрейма данных

Теперь мы обсудим, как назначать имена столбцам при создании DataFrame .

Это особенно полезно, когда вы создаете DataFrame из csv и хотите игнорировать имена столбцов заголовков и назначить свои собственные.

Передав список names , мы можем заменить уже существующий столбец заголовка нашим собственным. В списке должно быть имя для каждого столбца данных, в противном случае создается исключение.

Обратите внимание: если мы хотим переименовать только несколько столбцов, лучше использовать метод rename DataFrame после его создания.

Мы будем создавать DataFrame используя out.csv , который имеет следующее содержимое:

1 2 3 4 
 Name, age  John, 22  Doe, 31  Paul, 15 

Обратите внимание, что первая строка в файле является строкой заголовка и содержит имена столбцов. Pandas по умолчанию назначает имена столбцов DataFrame из первой строки.

Следовательно, мы укажем игнорировать строку заголовка при создании нашего DataFrame и укажем имена столбцов в списке, который передается в аргумент names

1 2 3 
 columns = ['First Name', 'Age']  df = pd.read_csv('out.csv', header = None, names = columns)  df 

новый фрейм данных изменил именастолбцов

Другой способ сделать это — указать имена столбцов в простом старом конструкторе DataFrame() .

Единственное отличие состоит в том, что теперь параметр, который принимает список имен column называется столбцом вместо names :

1 2 3 4 5 6 
 import numpy as np   new_columns = ['First Name', 'Age']  data = np.array([["Nicholas", 23],["Scott", 32],["David", 25]])   df = pd.DataFrame(data, columns = new_columns) 

Это приводит к другому DataFrame :

конструктор dataframe переименоватьстолбец

Заключение

В этой статье мы быстро рассмотрели, как мы можем называть и переименовывать столбцы в DataFrame . Либо путем присвоения имен при DataFrame экземпляра DataFrame, либо путем переименования их после факта с помощью метода rename()

Licensed under CC BY-NC-SA 4.0

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *