W Pandas, seria danych to po prostu ciąg wartości. Wartość numer 2 to po prostu element prostego typu. Bardzo podobnie na pierwszy rzut oka wygląda jednokolumnowy DataFrame, ale… pewne różnice są:
1 2 |
numbers=[1, 2, 3, 4] letters=['A', 'B', 'C', 'D'] |
Tak powstaje seria danych – dla „zmyłki” indeksem jest kolumna numbers:
1 2 |
ds = pd.Series(data=letters, index=numbers) ds |
oto wynik:
1 2 3 4 5 6 |
Out[45]: 1 A 2 B 3 C 4 D dtype: object |
A tak wygląda to, jeśli utworzymy DataFrame, który ma jedną kolumnę i indeks zdefiniowany w oparciu o numbers:
1 2 |
df = pd.DataFrame(data=letters, index=numbers) df |
wynik jest na pierwszy rzut oka podobny:
1 2 3 4 5 |
0 1 A 2 B 3 C 4 D |
Duże różnice pojawią się jednak przy odwołaniu do konkretnej pozycji:
1 2 |
ds.loc[1] Out[47]: 'A' |
a dla DataFrame:
1 2 3 4 |
df.loc[1] Out[48]: 0 A Name: 1, dtype: object |