2020-04-04
Tak stworzymy sobie listę, w której niektóre wyrazy się powtarzają:
text='''
Industrial Light & Magic: In this case, you find Python
used in the production process for scripting complex,
computer graphic-intensive films. Originally, Industrial
Light & Magic relied on Unix shell scripting, but it was
found that this solution just couldn't do the job. Python
was compared to other languages, such as Tcl and Perl, and
chosen because it's an easier-to-learn language that the
organization can implement incrementally. In addition, Python
can be embedded within a larger software system as a scripting
language, even if the system is written in a language such as
C/C++. It turns out that Python can successfully interact with
these other languages in situations in which some languages can't.
'''
words = text.replace("\n"," ").split(' ')
Żeby sprawdzić jakie słowa się powtarzały możesz wywołać
sorted(words)
Jest tu dużo powtarzających się wartości. Oprócz listy jest też w Pythonie obiekt set (zbiór). O ile w liście kolejność jest istotna i elementy się powtarzają, to w secie kolejności nie ma i obiekty się nie powtarzają. Taką set robi się prosto:
set(words)
Ów set można znowu skonwertować do listy:
list(set(words))
Taka przekonwertowana lista nie zawiera już elementów powtarzających się
2020-03-29
W ramach testów utworzyłem ResourceGroup i z chwilowego braku fantacji nazwałem tę grupę ppp… Szczęśliwie się okazało, że eksperymenty się udały i właściwie moje rozwiązanie mogłoby zostać tak jak jest, gdyby tylko nie ta głupia nazwa resource group…
Niestety nie ma możliwości zmiany nazwy grupy zasobów. Jest jednak trick 😉 Można utworzyć nową grupę zasobów, a następnie przenieść obiekty z feralnej grupy do nowo utworzonej grupy.
Jeśli wykonując to zadanie, nie chcesz zbyt dużo klikać, można skorzystać z powershella:
Get-AzResource -ResourceGroupName ppp | Move-AzResource -DestinationResourceGroupName OneDriveMailNotification_RG
Confirm
Are you sure you want to move these resources to the resource group
'/subscriptions/b0f2c2f3-c0ba-4f9b-b2ec-462472fdc456/resourceGroups/OneDriveMailNotification_RG' the resources:
/subscriptions/b0f2***56/resourceGroups/ppp/providers/Microsoft.Web/connections/onedrive
/subscriptions/b0f2***56/resourceGroups/ppp/providers/Microsoft.Web/connections/googledrive
/subscriptions/b0f2***56/resourceGroups/ppp/providers/Microsoft.Web/connections/gmail
/subscriptions/b0f2***56/resourceGroups/ppp/providers/Microsoft.Storage/storageAccounts/storageaccountppp8475
/subscriptions/b0f2***56/resourceGroups/ppp/providers/Microsoft.Logic/workflows/ProcessOrder
[Y] Yes [N] No [S] Suspend [?] Help (default is "Y"): y
WYkonanie nie było błyskawiczne, a wręcz myślałem, że coś się zawiesiło, ale koniec obiekty zostały poprawnie przeniesione. Teraz mogę rzeczywiście zrobić porządek 🙂
2020-03-15
Podczas odtwarzania bazy WideWorldImporters pojawiał się błąd, a właściwie cała seria błędów:
- An error occurred during recovery, preventing the database 'WideWorldImporters’ (7:0) from restarting. Diagnose the recovery errors and fix them, or restore from a known good backup. If errors are not corrected or expected, contact Technical Support.
- [WARNING] ALTER or DROP TABLE could not clean up root row within 10 seconds.
- [ERROR] HkHostRecoverDatabaseHelper::ReportAndRaiseFailure(): Database ID: [7] 'WideWorldImporters’. Failed to load XTP checkpoint. Error code: 0x82000018. (sql\ntdbms\hekaton\sqlhost\sqlmin\hkhostdb.cpp:5740)
- restoreHkDatabase: DbId 7, Msg 41316, Level 16, State 0, Restore operation failed for database 'WideWorldImporters’ with internal error code '0x82000031′.
- [ERROR] HkRtRestoreDatabase(): Recovery failed with error 0x82000031 on database 7. This error will be mapped to 'HK_E_RESTORE_ABORTED’ (0x82000018). (sql\ntdbms\hekaton\runtime\src\hkruntime.cpp:5505)
- The code generation directory cannot be created or set up correctly.
- Creation of directory \\?\F:\data\xtp failed for reason 3.
- [INFO] HkCkptLoadInternalEx(): Database ID: [7]. Root file: {3E231B6B-9EF1-4AE3-A1DB-BD01DC866DD9}, watermark: 40, RecoveryLsn: 00000272:00005EC4:0002, RecoveryCheckpointId: 4, RecoveryCheckpointTimestamp: 0xb
Czytaj dalej »
2020-03-09
W Pythonie występują typy mutable i immutable.
Immutable – niezmienne – typy takie jak int, float, bool, str. Zmienna wskazuje na komórkę w pamięci, ale kiedy do tej zmiennej wstawiasz nową wartość, to dla zmiennej rezerwuje się nową komórkę i tam przechowuje się jej wartość. Funkcja id() pozwala zmieniać adres tej komórki. W skrypcie poniżej początkowo i oraz new_i wskazują na tą samą wartość komórki, ale potem, po zmianie i, funkcja id() zwraca inne wartości dla każdej zmiennej. Immutable – wartość komórki pamięci się nie zmienia
i = 0
new_i = i
print(id(i), id(new_i))
i = 10
print(i, new_i)
print(id(i), id(new_i))
Mutable – zmienne – typy takie jak listy, zbiory, słowniki. Zmienna wskazuje na pewne miejsce w pamięci. Jeśli zmienia się wartość zmiennej (np. dodaje element do listy), to adres komórki zostaje ten sam, ale zmienia się zawartość struktury pamięciowej. Tutaj box i new_box, to właściwie to samo. Funkcja id() zwraca dokładnie ten sam identyfikator. Jeśli do box dodasz nowy element, to pojawi on się też w new_box. Mutable – wartość komórki pamięci się zmienia:
box = ['ab','bcd','cde']
new_box = box
print(id(box), id(new_box))
box.append('fgh')
print(box, new_box)
print(id(box), id(new_box))
Takie działanie typów mutable bywa niekiedy niepożądane i dlatego mamy do dyspozycji funkcję copy(). Ta metoda bierze oryginalny obiekt z pamięci i kopuje go w inne miejsce w pamięci, tworząc nową zmienną. Funkcja id() wywoływana dla zmiennej utworzonej poprzez copy() zwróci inną wartość, a co za tym idzie oba obiekty są różnymi obiektami i można je modyfikować niezależnie:
box = ['ab','bcd','cde']
another_box = box.copy()
print(id(box), id(another_box))
box.append('klm')
print(box, another_box)
print(id(box), id(another_box))
2020-03-01
Korzystanie z techik wirtualizacji to na dzisiaj konieczność. Zazwyczaj korzystam z Hyper-V, który jest licencjonowany razem z systemem operacyjnym, więc jeden kłopot z głowy.
Do zastosowań prywatnych są jednak dostępne rozwiązania VirtualBox lub VMPlayer. Od czasu do czasu trzeba więc skorzystać z jednej lub innej technologii. I tu może się pojawić konflikt.
Podczas uruchamiania maszyny wirtualnej pod VirtualBoxem pojawił się błąd:
WHvSetupPartition failed – VERR_NEM_VM_CREATE_FAILED
Najwyraźniej jest to powodowane właśnie obecnością innych „wirtualizatorów”, bo wykonanie polecenia:
bcdedit /set hypervisorlaunchtype off
i restart komputera pomogły!
2020-02-22
Kiedyś zapytanie działało dobrze, a teraz działa gorzej? Co się zmieniło, że spadek wydajności jest zauważalny?
Nie ma na to jednej odpowiedzi, bo do kroków analizy należałoby dodać także sprawdzenie dostępnej ilości RAM, szybkości dostępu do dysków itp. O ile jednak administratorzy z tymi testami zazwyczaj problemów nie mają, o tyle sprawdzanie wydajności z dokładnością do pojedynczego zapytania zwykle było pewnym problemem. Rozwiązaniem, które ma w tym pomóc jest Query Store dostępny w SQL Server od wersji 2016.
Dzięki zbieranym statystykom na temat zapytań, administrator może porównać plany zapytań jakie były wykorzystywane pewien czas temu z tymi, jakie są wykorzystywane teraz, a nawet określić, który plan zapytania ma być stosowany. I to wszystko odbywa się bez ingerencji w plan zapytania!
Oto jak skonfigurować Query Store
Query Store może być włączony na poziomie bazy danych:
ALTER DATABASE MyDb SET QUERY_STORE = ON
Korzystając z polecenia alter można zmieniać konfigurację Query Store: Czytaj dalej »
2020-02-22
Kiedy pracujesz z dużymi danymi w Pycharm, chcesz zwykle zobaczyć, co w tych danych się znajduje. Najprościej to zrobić wyświetlając DataFrame na ekranie. Niestety, jeśli obiekt ma wiele kolumn to domyślnie zostanie wyświetlonych tylko kilka a między nimi pojawi się symbol trzech kropek mówiący o tym, że nie wszystko się zmieściło. Podobnie kiedy do wyświetlenia jest wiele wierszy, może pojawić się jeden wiersz wypełniony kropkami, informujący o tym, że python zdecydował się nie wyświetlać wszystkiego:

Co zrobić?
Metoda 1. Dodajesz kilka poleceń, które zmieniają opcje działania poleceń wyświetlających data frame:
– display.width – ile znaków może być w jednej linijce w czasie wyświetlania wiersza
– display.max_columns – ile kolumn ma być maksymalnie wyświetlanych
– jeśli to samo chciałbyś robić z obiektami numpy to jest do tego opcja linewidth Czytaj dalej »