Python pandas new dataframe

Как создать DataFrames Pandas в Python – 7 методов

Фрейм данных – это двухмерный набор данных, структура, в которой данные хранятся в табличной форме. Наборы данных упорядочены по строкам и столбцам; мы можем хранить несколько наборов данных во фрейме данных. Мы можем выполнять различные арифметические операции, такие как добавление выбора столбца или строки и столбцов или строк во фрейме данных.

Мы можем импортировать DataFrames из внешнего хранилища; эти хранилища могут быть базой данных SQL, файлом CSV или файлом Excel. Мы также можем использовать списки, словарь, список словаря и т. д.

В этом руководстве мы научимся создавать фрейм данных несколькими способами. Давайте разберемся как создать DataFrames Pandas в Python. Во-первых, нам нужно установить библиотеку pandas в среду Python.

Пустой фрейм данных

Мы можем создать базовый пустой фрейм данных. Для создания DataFrame необходимо вызвать конструктор фрейма данных.

# import pandas as pd import pandas as pd # Calling DataFrame constructor df = pd.DataFrame() print(df)
Empty DataFrame Columns: [] Index: []

Метод – 2: создать фрейм данных с помощью списка

Мы можем создать фрейм данных, используя простой список или список списков. Давайте разберемся в следующем примере.

# importing pandas library import pandas as pd # string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe)
0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go

Метод – 3: Dataframe из dict ndarray / lists

Dict ndarray / lists можно использовать для создания фрейма данных, все ndarray должны иметь одинаковую длину. По умолчанию индекс будет диапазоном(n); где n обозначает длину массива.

import pandas as pd # assign data of lists. data = # Create DataFrame df = pd.DataFrame(data) # Print the output. print(df)
Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18

Метод – 4: Создание фрейма данных индексов с использованием массивов

Давайте разберемся в примере создания фрейм данных индексов с использованием массивов.

# DataFrame using arrays. import pandas as pd # assign data of lists. data = <'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]># Creates pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # print the data print(df)
Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0

В приведенном выше коде мы определили имя столбца с различными названиями автомобилей и их рейтингами. Мы использовали массив для создания индексов.

Метод – 5: Dataframe из списка dicts

Мы можем передать списки словарей в качестве входных данных для создания фрейма данных Pandas. Имена столбцов по умолчанию используются в качестве ключей.

# the example is to create # Pandas DataFrame by lists of dicts. import pandas as pd # assign values to lists. data = [, ] # Creates DataFrame. df = pd.DataFrame(data) # Print the data print(df)
A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0

Давайте разберемся в другом примере создания фрейма данных pandas из списка словарей с индексом строки и индексом столбца.

import pandas as pd # assigns values to lists. data = [, ] # With two column indices, values same # as dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # With two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # print the first data frame print(dframe1, "\n") # Print the second DataFrame. print(dframe2)
x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN

Рассмотрим пример создания фрейма данных путем передачи списков словарей и строк.

# The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # assign values to lists data = [, ] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe)
x y z first 2 NaN 3 second 10 20.0 30

Мы обсудили три способа создания фрейма данных с использованием списков словаря.

Метод – 6: с помощью функции zip()

Функция zip() используется для объединения двух списков. Давайте разберемся в следующем примере.

# The example is to create # pandas dataframe from lists using zip. import pandas as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)
[('john', 95),('krish', 63),('arun', 54),('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47

Метод – 7: из Dicts серии

Словарь можно передать для создания фрейма данных. Мы можем использовать Dicts of series, где последующий индекс представляет собой объединение всех серий переданного значения индекса. Давайте разберем на примере.

# Pandas Dataframe from Dicts of series. import pandas as pd # Initialize data to Dicts of series. d = # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe)
Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96

В этом руководстве мы обсудили различные способы создания DataFrames.

Источник

Читайте также:  Java spring or ejb
Оцените статью