Przejdź do treści

Power Query & Excel – usuwanie dużych i małych liter polskiego alfabetu

Usuniemy wszystkie wystąpienia dużych i małych liter polskiego alfabetu. Zastosujemy odpowiedni zakres znaków typu Unicode.

Dane źródłowe

W tabeli danych mamy imiona i nazwiska osób. Przy tych danych są niepotrzebne znaki liczbowe, które należy usunąć.

Dane prezentują się następująco:

Usuwanie polskich znaków

  1. Dodaj kolumnę niestandardową
    • Przejdź do zakładki „Dodaj kolumnę”
    • Wybierz opcję „Kolumna niestandardowa”
  • W pasku formuły wpisz funkcję:
Text.Remove([dane], {"a".."z","A".."Z","Ą","ą","Ć","ć","Ę","ę","Ł","ł","Ń","ń","Ó","ó","Ś","ś","Ź","ź","Ż","ż"})

Funkcja usuwa w kolumnie [data] wystąpienia wszystkich małych liter w podstawowym alfabecie {„a”..”z”}, a następnie wielkie litery {„A”..”Z”}. Po przecinku wypisane są polskie znaki diakrytyczne: ą, ę, ć itd. Ważne, aby wypisać te znaki w dużym i małym formacie. W jednej parze cudzysłowów może być tylko jeden znak.

Po zatwierdzeniu funkcji edytor Power Query powinien prezentować się następująco:

Uwaga!

Dlaczego nie można wpisać {„A”..”z”}?. Teoretycznie jest to poprawny zapis. Należy pamiętać, że nie wybieramy zakresu znaków według alfabetu standaryzowanego tylko wg „alfabetu” listy znaków Unicode. Alfabet Unicode dzieli się na grupy i jest sortowany według własnych zasad.

{„A”..”Z”} to grupa Latin Alphabet Uppercase

{„a”..”z”} to grupa Latin Alphabet Lowercase

Pomiędzy grupą Uppercase i Lowercase znajduje się grupa ASCII Punctation & Symbols, która zawiera takie znaki: [ \ ] ^ _ `

Dlatego jeżeli wpiszemy zakres {„A”..”z”} to dodatkowo zostaną usunięte powyższe znaki.