Załóżmy, że mam listę z wartościami prezentującymi liczby, ale z nieco zamieszanymi formatami. W oparciu o tą listę tworzę serię: import pandas as pd lst = [’112,000.000′,’4,500,000′] s = pd.Series(lst) s wynik to: 0 112,000.000 1 4,500,000 dtype: object Jak widać typ to object, czyli w PANDAS – napis. Możesz teraz zbudować dowolną funkcję lambda oczyszczającą […]
Archiwum dla kategorii ‘Python’
Python – oczyszczanie kolumny tekstowej w PANDAS (Seria danych)
Python: formatowanie tekstu
W Pythonie mamy kilka sposobów na formatowanie tekstów, między innymi starszy z wykorzystaniem operatora % i nowy wykorzystujący metodę format. Jak to zwykle bywa nowsze metody pozwalają na wykonywanie większej ilości niestandardowych formatowań, niż te starsze. Część zadań można jednak realizować z wykorzystaniem obu metod – z porównywalnym efektem. Oto formatowanie napisu na 10 znakach […]
Python: zmiana wartości w DataFrame dla wierszy spełniających określony warunek
DataFrame może zawierać dużo wierszy. Czasami chcesz zmienić wartość w określonej kolumnie, ale tylko pod warunkiem, że dane w wierszu spełniają jakiś określony warunek.Zacznijmy od instrukcji tworzącej prosty data frame: import pandas as pd import numpy as np df = pd.DataFrame(columns=[’values’,’values2′]) for i in range(10): df.loc[i] = [i,i*10] df Teraz kolej na sztuczkę. Trzeba znaleźć […]
Python: Pandas: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame
Popatrzmy na takie polecenie: import pandas as pd df = pd.DataFrame({’Name’:[’Jack’,’Sue’,pd.np.nan,’Bob’,’Alice’,’John’], 'A’: [1, 2.1, pd.np.nan, 4.7, 5.6, 6.8], 'B’: [.25, pd.np.nan, pd.np.nan, 4, 12.2, 14.4], 'City’:[’Seattle’,’SF’,’LA’,’OC’,pd.np.nan,pd.np.nan]}) df[[’A’,’B’]].fillna(’?’, inplace=True) wynik to niestety ostrzeżenie: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation: […]
Kurs data science: „Analiza danych w Python i PANDAS” za free!
Od dzisiaj na platformie Udemy dostępny jest kurs „Analiza danych w Python i PANDAS”. Z tej okazji przez krótki czas kurs będzie dostępny za darmo! To taki give-back dla społeczności, bez której samodzielne rozwiązywanie wielu problemów byłoby koszmarne. Jeśli zdążyłeś/aś to poniższy link pozwoli na darmowe zapisanie się na szkolenie. Jeśli kurs został już sklasyfikowany […]
Python/Pandas: Testowe dane. Linki do dataset
Tym razem tylko porcja linków, pod którymi można znaleźć przdatne dane do testów i nauki Pythona i Pandas: Fantastyczny zbiór danych wraz z już opracowanym, opublikowanym i skąd inąd interesującym data story: https://github.com/fivethirtyeight/data Zadania do samodzielnego rozwiązania z zakresu Python/Pandas: https://www.w3resource.com/python-exercises/pandas/index.php Prawie, że kurs „hands on lab” z zakresu Pandas, z założenia skupia się na samej […]
Python: wycięcie z napisu tekstu w cudzysłowiu
Załóżmy, że masz taki tekst: message = 'Document „cv.doc” was printed on printer: XEROX’ z tego napisu chcesz wyciąć tylko nazwę dokumentu cv.doc. Można by to zrobić posługując się zwykłymi poleceniami pracującymi na napisach, ale nie jest to zbyt wygodne rozwiązanie – trzeba się sporo przy tym napracować, a na dodatek kod będzie nieczytelny, trudny […]





























