logo

Серия Python Pandas

Серията Pandas може да се дефинира като едноизмерен масив, който може да съхранява различни типове данни. Можем лесно да конвертираме списъка, кортежа и речника в серии, използвайки ' серия ' метод. Етикетите на редовете на серията се наричат ​​индекс. Поредицата не може да съдържа няколко колони. Има следния параметър:

    данни:Може да бъде произволен списък, речник или скаларна стойност.индекс:Стойността на индекса трябва да бъде уникална и хешируема. Трябва да е със същата дължина като данните. Ако не подадем никакъв индекс, по подразбиране np.arrange(n) ще бъде използвано.dtype:Отнася се за типа данни от серии.копие:Използва се за копиране на данни.

Създаване на серия:

Можем да създадем серия по два начина:

  1. Създайте празна серия
  2. Създайте серия, като използвате входове.

Създаване на празна серия:

Можем лесно да създадем празна серия в Pandas, което означава, че няма да има никаква стойност.

Синтаксисът, който се използва за създаване на празна серия:

 = pandas.Series() 

Примерът по-долу създава обект от тип Empty Series, който няма стойности и има тип данни по подразбиране, т.е. float64 .

Пример

 import pandas as pd x = pd.Series() print (x) 

Изход

 Series([], dtype: float64) 

Създаване на серия с помощта на входове:

Можем да създадем серии, като използваме различни входове:

  • Масив
  • Dict
  • Скаларна стойност

Създаване на серия от масив:

Преди да създадем серия, първо трябва да импортираме numpy модул и след това използвайте функцията array() в програмата. Ако данните са ndarray, тогава предаденият индекс трябва да е със същата дължина.

Ако не подадем индекс, тогава по подразбиране индекс на диапазон (n) се предава, където n определя дължината на масив, т.е. [0,1,2,.... обхват(len(масив))-1 ].

Пример

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Изход

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Създайте серия от dict

Можем също да създадем серия от dict. Ако обектът на речника се предава като вход и индексът не е посочен, тогава ключовете на речника се вземат в сортиран ред, за да се конструира индексът .

Ако индексът е предаден, тогава стойностите, съответстващи на определен етикет в индекса, ще бъдат извлечени от речник .

fmoviez
 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Изход

 x 0.0 y 1.0 z 2.0 dtype: float64 

Създайте серия с помощта на скалар:

Ако вземем скаларните стойности, тогава индексът трябва да бъде предоставен. Скаларната стойност ще бъде повторена за съвпадение на дължината на индекса.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Изход

 0 4 1 4 2 4 3 4 dtype: int64 

Достъп до данни от серии с Позиция:

След като създадете обект тип Series, можете да получите достъп до неговите индекси, данни и дори отделни елементи.

Данните в серията могат да бъдат достъпни подобно на тези в ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Изход

 1 

Атрибути на серийни обекти

Атрибутът Series се дефинира като всяка информация, свързана с обекта Series, като размер, тип данни. и т.н. По-долу са някои от атрибутите, които можете да използвате, за да получите информация за обекта Series:

Атрибути Описание
Series.index Определя индекса на серията.
Серия.форма Връща кортеж от формата на данните.
Series.dtype Връща типа данни на данните.
Серия.размер Връща размера на данните.
Серия.празна Връща True, ако обектът Series е празен, в противен случай връща false.
Серия.hasnans Връща True, ако има NaN стойности, в противен случай връща false.
Серия.nbytes Връща броя на байтовете в данните.
Серия съм Връща броя на измеренията в данните.
Series.itemsize Връща размера на типа данни на елемента.

Извличане на индексен масив и масив от данни на сериен обект

Можем да извлечем индексния масив и масива от данни на съществуващ обект Series, като използваме атрибутите index и values.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Изход

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Извличане на типове (dtype) и размер на типа (itemsize)

Можете да използвате атрибут dtype с обект Series като dtype за извличане на типа данни на отделен елемент от обект серия, можете да използвате размер на артикула атрибут, за да покаже броя на байтовете, разпределени за всеки елемент от данни.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Изход

 int64 8 float64 8 

Извличане на фигура

Формата на обекта Series определя общия брой елементи, включително липсващи или празни стойности (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Изход

 (4,) (3,) 

Извличане на измерение, размер и брой байтове:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Изход

 1 1 4 3 32 24 

Проверка на празнотата и наличието на NaN

За да проверите дали обектът Series е празен, можете да използвате празен атрибут . По същия начин, за да проверите дали серия обект съдържа някои NaN стойности или не, можете да използвате Хасан атрибут.

Пример

история в java
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Изход

 False False True True False False 4 3 3 3 

Серийни функции

Има някои функции, използвани в сериите, които са както следва:

Функции Описание
Pandas Series.map() Картирайте стойностите от две серии, които имат обща колона.
Pandas Series.std() Изчислете стандартното отклонение на даден набор от числа, DataFrame, колона и редове.
Pandas Series.to_frame() Преобразувайте серийния обект в рамката с данни.
Pandas Series.value_counts() Връща серия, която съдържа брой уникални стойности.