Skip to content

Latest commit

 

History

History
103 lines (74 loc) · 2.87 KB

08-trier.rst

File metadata and controls

103 lines (74 loc) · 2.87 KB

Extraire, trier et filtrer des données

grep -i mot fichier
affiches les occurences de "mot" dans fichier sans faire attention à la casse.
grep -n mot fichier
affiche les n° de ligne
grep -v mot fichier
inversion de la recherche : "tout ce qui ne contient PAS mot"
grep -r mot répertoire
rechercher dans tous les fichiers et sous-dossiers (équivalent à rgrep)

grep "ma phrase contient des espaces" monFichier

grep -E mot fichier

grep avec expression régulière

Expressions régulières :
  • . : Caractère quelconque
  • ^ : Début de ligne (cherche un mot placé en début de ligne)
  • $ : Fin de ligne (cherche un mot placé en fin de ligne)
  • [] : Un des caractères entre les crochets
  • ? : L'élément précédent est optionnel (peut être présent 0 ou 1 fois)
  • * : L'élément précédent peut être présent 0, 1 ou plusieurs fois
  • + : L'élément précédent doit être présent 1 ou plusieurs fois
  • | : Ou
  • () : Groupement d'expressions
grep -r -i --include=\*.txt 'searchterm' ./
  • -r recursively
  • -i ignore-case
  • --include all *.txt: text files (escape with just in case you have a directory with asterisks in the filenames)
  • 'searchterm' What to search
  • ./ Start at current directory.
sort fichier
trier le contenu d'un fichier
sort -o noms_tries.txt noms.txt
avec sortie vers noms_tries.txt
sort -R fichier
trier aléatoirement
sort -n fichier
trier des nombres (ne se bas pas sur l'alphabet, sinon : 1 123 23 ...)
wc fichier.txt
renvoie un résultat type "a b c fichier.txt" où :
  • a : nb de lignes (-l)
  • b : nb de mots (-w)
  • c : nb d'octets (-c)
wc -m fichier.txt
nb de caractères dans le fichier
uniq fichier.txt
supprime les doublons
uniq doublons.txt sans_doublons.txt
sort ça dans sans_doublons.txt
uniq -c

compte le nb d'occurences

ex :
uniq -c doublons.txt

résultats :

1 Albert
3 François
1 Jean
2 Marcel
uniq -d fichier
uniquement les lignes en double
cut -c 2-5 noms.txt
conserve uniquement les caractères 2 à 5 de chaque ligne
cut -c -3 noms.txt
conserve uniquement les caractères 1 à 3 de chaque ligne
cut -c 3- noms.txt
du n°3 au dernier de chaque ligne
cut -d , -f 1 notes.csv
  • -d : indique quel est le délimiteur dans le fichier (ici ',')
  • -f : indique le numéro du ou des champs à couper, cad que l'on garde (ici le 1er)
cut -d , -f 1,3 notes.csv
garde les champs 1 ET 3
cut -d , -f 1-3 notes.csv
garde les champs 1 à 3