Archiwum dla kategorii ‘Python’

Python: Pandas: Zmiana kolejności kolumn w data frame

2020-05-31

Kiedy pracujesz z danymi często startujesz od pewnego zbioru danych, do którego dodajesz kolejne i kolejne kolumny. Koniec końców część z tych kolumn nie jest już potrzebna, a część jest nie tam, gdzie wizualnie byś chciał. Jak zrobić z tym porządek? Bardzo prosto! Wystarczy przepisać do nowego obiektu dataframe dane pobierane z oryginalnego data frame […]

Python: Pandas: Multiindex dla data frame

2020-05-31

Zazwyczaj kiedy pracujemy z data frame i mamy dane powstające wskutek grupowania wpadamy na pomysł założenia multiindeksu dla wierszy. Jednak czasami specyfika danych jest taka, że nawet struktura w kolumnach ma postać pogrupowaną, więc zgodną ze strukturą multiindeksu. Jak więc zbudować multiindeks zarówno na wierszach, jak i na kolumnach? Oto prosty przykład, który ilustruje ten […]

Python: Pandas: Wyświetlanie liczb float z określoną precyzją

2020-05-31

W idealnym świecie idealnie jest wyświetlać każdą liczbę z maksymalną dokładnością, ale… świat nie jest idealny. Bywa, że wyliczoną wartość 1.0000001 wolelibyśmy wyświetlić po prostu jako 1. Jedną z możliwością byłoby wykonanie odpowiednich obliczeń na DataFrame i pozbycie się problemu właściwie raz na zawsze. Jeśli jednak wolisz po prostu zmienić parametry tak, aby dane wyświetlały […]

Python: Pandas: Formatowanie kolumn – metoda to_string i parametr formatters

2020-04-10

Dane to dane i kiedy przetwarzasz je w data frame, to generalnie nie należy się przejmować wyglądem tych danych. Jednak od czasu do czasu chcesz zadbać również o to jak te dane mają wyglądać. Oto dataframe:

Data Frame ma metodę to_string, a metoda to_string przyjmuje parametr formatter, który wpływa na sposób wyświetlania danych:

[…]

Python: Usuwanie duplikatów z listy

2020-04-04

Tak stworzymy sobie listę, w której niektóre wyrazy się powtarzają:

Żeby sprawdzić jakie słowa się powtarzały możesz wywołać

Jest tu dużo powtarzających się wartości. Oprócz listy jest też w Pythonie obiekt set (zbiór). O ile w liście kolejność jest istotna i elementy się powtarzają, to w secie kolejności nie ma i obiekty się […]

Python: Pycharm – wyświetlanie dużych DataFame ze wszystkimi kolumnami bez kropek

2020-02-22

Kiedy pracujesz z dużymi danymi w Pycharm, chcesz zwykle zobaczyć, co w tych danych się znajduje. Najprościej to zrobić wyświetlając DataFrame na ekranie. Niestety, jeśli obiekt ma wiele kolumn to domyślnie zostanie wyświetlonych tylko kilka a między nimi pojawi się symbol trzech kropek mówiący o tym, że nie wszystko się zmieściło. Podobnie kiedy do wyświetlenia […]

Python: Numpy: Broadcasting na przykładach

2020-01-15

W uczeniu maszynowym często wykonujemy operacje na macierzach (wektor to też przykład macierzy, tylko że jeden z wymiarów wynosi 1). Cchcemy takie operacje wykonywać, gdzie tylko się da przy pomocy funkcji z modułu numpy, bo tak jest efektywniej! Matematyka jest bezlitosna. Istnieją pewne określone reguły, określające warunki kiedy na macierzach można wykonywać operacje: aby dodać […]