Filtracja Znaków ASCII - Definicja i Zastosowanie
- Szczegóły
Wszystkie współczesne systemy operacyjne traktują dane jako ciągi znaków ASCII o numerach od 32 (x20, znak spacji) do 126 (x7e, znak tyldy ~).
Podstawowe Koncepcje
W wierszu poleceń filtry są traktowane jak nazwy programów, które należy uruchomić. Filtrem jest np. program more. Ma on podobne przeznaczenie, lecz jest bardziej rozbudowany. less potrafi wiele innych rzeczy.
Filtry "nie wiedzą" nic więcej o plikach standardowego wejścia i wyjścia. Pliki te są identyfikowane z konsolą, zwaną inaczej terminalem, tj. urządzenia, z którego wywołano program, lub wynikowych innego procesu.
Standardowy plik wejściowy jest tylko odczytywany po kolei, bez możliwości powrotu do danych już odczytanych, a wyjście standardowe bez możliwości ich odczytania ani modyfikacji po zapisaniu. Po przetworzeniu wszystkich danych z wejścia proces kończy się.
Przykłady Użycia Filtrów
Filtry mogą być używane do różnych celów, np.:
Przeczytaj także: Definicja i pomiar filtracji kłębuszkowej
- Spis zawartości kartoteki na monitor konsoli.
- Wyświetlanie zawartości plików, np. plik1 i plik2. (more i less to tzw. pagery).
Wykorzystanie w Przetwarzaniu Tekstu
Do tworzenia tabel służy element table. Elementy kolumn są oddzielane znakami tabulacji i spacjami.
Można stosować proste narzędzia do wyszukiwania według zadanego wzorca bez wizualnej kontroli operatora i zapisać w pliku sterującym. W żadnym wypadku nie powinien to być ten sam plik.
Program findstr ma funkcjonalność zbliżoną do grep i możliwościami. findstr służy do wyszukiwania ciągów znaków w wierszu poleceń.
tr (translate) to wyspecjalizowane narzędzie, które pozwala użytkownikowi samemu sprecyzować podział na kawałki (ang. split). Jest to ważne narzędzie do zamiany znaków z jednego zbioru na inny.
Przykłady Operacji na Tekście
Następujące wyrażenia regularne mogą być użyteczne:
Przeczytaj także: Webber AP8400 - wymiana filtrów
- \([a-zA-Z\-\. - do wyszukiwania słów z myślnikami i kropkami.
- \([a-zA-Z0-9\.,:;\/ \?\t=-]*\) - do wyszukiwania ciągów znaków z różnymi znakami interpunkcyjnymi.
Program uniq (z ang. unique) usuwa duplikaty z każdego bloku identycznych wierszy.
Program comm (z ang. compare) porównuje dwa wskazane pliki.
Program xargs (ang. extended arguments) przekazuje listę argumentów do innego polecenia.
Dodatkowe Opcje i Funkcje
Opcja -n (ang. number) w instrukcji użytkowania służy do drukowania informacji o nim na wyjściu, zgodnie z opcjami wywołania (np. drukuj zbiorczą informację o danych zgodnie z opcjami wywołania).
Jeśli chcemy zignorować wielkość liter w wyrażeniu, użyjemy opcji -i (skrót od Ignore letter case) języka.
Przeczytaj także: Optymalne rozcieńczenie bimbru
Opcja -c (ang. count) służy do zliczania i przeformatowania.
Opcja -v (ang. invert) odwraca znaczenie wzorca.
Przykłady Zastosowań w Analizie Danych
W wyniku kompletowania danych ze stacji terenowych, gdzie osobiście odczytywali pomiary, technika ta ma dodatkową zaletę: danych pośrednich nie trzeba zapisywać w plikach tymczasowych.
Filtrowanie znaków ASCII jest fundamentalne w przetwarzaniu danych i analizie tekstu, umożliwiając efektywne manipulowanie i transformowanie danych w różnorodnych zastosowaniach.
tags: #filtracja #znaków #ASCII #definicja

