W uczeniu maszynowym często wykonujemy operacje na macierzach (wektor to też przykład macierzy, tylko że jeden z wymiarów wynosi 1). Cchcemy takie operacje wykonywać, gdzie tylko się da przy pomocy funkcji z modułu numpy, bo tak jest efektywniej! Matematyka jest bezlitosna. Istnieją pewne określone reguły, określające warunki kiedy na macierzach można wykonywać operacje: aby dodać […]
Archiwum dla kategorii ‘Data Science’
Python: Numpy: Broadcasting na przykładach
Python, PANDAS: Jak wywoływać funkcję apply() dla każdego wiersza DataFrame
Kiedy robisz rzeczy standardowe, korzystasz sobie ze standardowych metod, ale kiedy przychodzi zmierzyć się z niestandardowym problemem, to trzeba sięgnąć po funkcję apply. Tutaj mamy dosyć nietypowy DataFrame. Dla każdego wiersza DataFrame trzeba wykonać jakąś niestandardową czynność…
1 2 3 4 5 6 7 8 9 10 11 |
import pandas as pd df = pd.DataFrame( [ [-1, -1], [[11,12], [21, 22]], [-1,-1], [[101,102],[201,202]] ], columns=['rola','X_dist']) df |
1 2 3 4 5 |
rola X_dist 0 -1 -1 1 [11, 12] [21, 22] 2 -1 -1 3 [101, 102] [201, 202] |
Dajmy na to, że w zależności od zawartości kolumny „rola” trzeba zwrócić taki albo inny DataFrame […]
Python: sprawdzanie poprawności modelu w predykcji danych
Podczas budowania modelu predykcyjnego dane, na których model się uczy dzielone są na dane uczące (+/-80%) i dane testowe (+/-20%). Idea jest taka, aby algorytm mając do dyspozycji dane uczące „zauważył” i „nauczył” się reguł, które wpływają na powiązanie danych. Pozostałe dane testowe są na tym etapie ukryte przed algorytmem. Może się to wydawać trochę […]