The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  правила/FAQ  поиск  регистрация  вход/выход  слежка  RSS
"Раздел полезных советов: Примеры использования Awk"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Раздел полезных советов: Примеры использования Awk"  +/
Сообщение от auto_tips on 27-Окт-08, 14:35 
Использование сокращений.

Конструкцию, используемую для вывода строк соответствующих заданной маске:
   awk '{if ($0 ~ /pattern/) print $0}'

можно сократить до
   awk '/pattern/'

Условие в awk может быть задано вне скобок, т.е. получаем:
   awk '$0 ~ /pattern/ {print $0}'

По умолчанию, действия производится со всей строкой, $0 можно не указывать:
   awk '/pattern/ {print}'

print - является действием по умолчанию, его тоже можно не указывать.
   awk '/pattern/'

Для вывода значения первого столбца строки в которой присутствует маска LEGO:
   awk '/LEGO/ {print $1}'

Для вывода значения первого столбца строки во втором столбце которой присутствует маска LEGO:
   awk '$2 ~ /LEGO/ {print $1}'

Для замены слова LIGO на LEGO и вывода только измененных строк можно использовать:
   awk '{if(sub(/LIGO/,"LEGO")){print}}'

Но есть выводить нужно все строки (как sed ’s/LIGO/LEGO/’), конструкцию можно упростить
(1 - true для всех строк):
   awk '{sub(/LIGO/,"LEGO")}1'

Вывести все строки, за исключением каждой шестой:
   awk 'NR % 6'

Вывести строки начиная с 6 (как tail -n +6 или sed '1,5d'):
   awk 'NR > 5'

Вывести строки в которых значение второго столбца равно foo:
   awk '$2 == "foo"'

Вывести строки, в которых 6 и более столбцов:
   awk 'NF >= 6'

Вывести строки в которых есть слова foo и bar:
   awk '/foo/ && /bar/'

Вывести строки в которых есть слово foo, но нет bar:
   awk '/foo/ && !/bar/'

Вывести строки в которых есть слова foo или bar (как grep -e 'foo' -e 'bar'):
   awk '/foo/ || /bar/'

Вывести все непустые строки:
   awk 'NF'

Вывести все строки, удалив содержимое последнего столбца:
   awk 'NF--'

Вывести номера строк перед содержимым:
   awk '$0 = NR" "$0'

Заменим команды (пропускаем 1 строку, фильтруем строки с foo и заменяем foo на bar,
затем переводим в верхний регистр и выводим значение второго столбца)
   cat test.txt | head -n +1 | grep foo | sed 's/foo/bar/' | tr '[a-z]' '[A-Z]' | cut -d ' ' -f 2

аналогичной конструкцией на awk:
   cat test.txt | awk 'NR>1 && /foo/{sub(/foo/,"bar"); print toupper($2)}'


Использование диапазонов.

Вывести группу строк начиная со строки в которой есть foo и заканчивая строкой в которой есть bar:
   awk '/foo/,/bar/'

Исключив из вывода строки с вхождением заданных масок:
   awk '/foo/,/bar/{if (!/foo/ && !/bar/)print}'

Более оптимальные вариант:
   awk '/bar/{p=0};p;/foo/{p=1}'

Исключить только строку с завершающим вхождением (bar)
   awk '/bar/{p=0} /foo/{p=1} p'

Исключить только строку с начальным вхождением (foo)
   awk 'p; /bar/{p=0} /foo/{p=1}'


Разбиение файла по шаблонам.

Имеется файл (file) в котором группы строк разделены шаблонами FOO1,FOO2 и т.д.
Необходимо записать данные, находящиеся между метками FOO в разные файлы,
соответствующие указанным в FOO номерам.
   awk -v n=1 '/^FOO[0-9]*/{close("out"n);n++;next} {print > "out"n}' file

В GNU Awk можно сделать так:
   LC_ALL=C gawk -v RS='FOO[0-9]*\n' -v ORS= '{print > "out"NR}' file


Парсинг CSV.

По умолчанию, в качестве разделителя используется пробел и табуляция.
Чтобы определить иной разделитель, например запятую, нужно использовать FS=’,’ или опцию "-F"
в качестве параметра может быть задано регулярное выражение, например, FS=’^ *| *, *| *$’
Но для разбора CSV это не подойдет, так как пробелы могут присутствовать и внутри трок,
поэтому проще вырезать лидирующие пробелы перед и после запятой:

   FS=','
   for(i=1;i<=NF;i++){
     gsub(/^ *| *$/,"",$i);
     print "Field " i " is " $i;
   }

Если в CSV данные помещены в кавычки, например "field1","field2", то подойдет такой скрипт:

   FS=','
   for(i=1;i<=NF;i++){
     gsub(/^ *"|" *$/,"",$i);
     print "Field " i " is " $i;
   }

Но скрипт придется усовершенствовать для разбора полей вида:

field1, "field2,with,commas"  ,  field3  ,  "field4,foo"

   $0=$0",";  
   while($0) {
     match($0,/[^,]*,| *"[^"]*" *,/);
     sf=f=substr($0,RSTART,RLENGTH);
     gsub(/^ *"?|"? *,$/,"",f);
     print "Field " ++c " is " f;
     sub(sf,"");
   }


Проверка IPv4 адреса.

   awk -F '[.]' 'function ok(n) {
     return (n ~ /^([01]?[0-9]?[0-9]|2[0-4][0-9]|25[0-5])$/)
   }
   {exit (ok($1) && ok($2) && ok($3) && ok($4))}'


Сравнение двух файлов.

Вывод всех дублирующихся строк из двух неотсортированных файлах file1 и file2:
   awk '!($0 in a) {c++;a[$0]} END {exit(c==NR/2?0:1)}' file1 file2


Вывод только выделенных блоков текста.
Например, чтобы показать из файла с текстом только текст отмеченный как =текст=
можно использовать:
   awk -v RS='=' '!(NR%2)'

с форматированием переносов строк:
   awk -v RS='=' '!(NR%2){gsub(/\n/," ");print}'


URL: http://www.catonmat.net/blog/ten-awk-tips-tricks-and-pitfalls/
Обсуждается: http://www.opennet.me/tips/info/1811.shtml

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Примеры использования Awk"  +/
Сообщение от Queeq email on 27-Окт-08, 14:35 
Супер, спасибо!
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Примеры использования Awk"  +/
Сообщение от rrv (??) on 27-Окт-08, 19:05 
Вот кому интересно еще подборочка рецептов awk: http://rrv.nsk.ru/wiki/index.php/Awk_-_%D1%80%...
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

3. "Примеры использования Awk"  +/
Сообщение от Hubbitus (ok) on 28-Окт-08, 14:27 
Крайне полезно, однозначно обе ссылки в закладке.

В статье только крайне удручают кавычки в виде & #8217; :(

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

4. "Примеры использования Awk"  +/
Сообщение от Kreept email(??) on 21-Ноя-08, 11:18 
Спасибо! Очень интересная статейка.  
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

5. "Примеры использования Awk"  +/
Сообщение от Дмитрий Б. email on 07-Апр-10, 00:15 
Прошу подсказать, как вывести все столбцы начиная с 7-го и более. т.е. если их может быть бесконечно.

пример:

-rw-r--r-- 3 dmio   46 23 23:34 1
-rw-r--r-- 1 dmio    0 11 23:33 78
-rw-r--r-- 1 dmio    88 84 23:41 1 1 1 1

нужно вывести
1
78
1 1 1 1

подскажите как?

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

6. "Примеры использования Awk"  +/
Сообщение от Hubbitus (ok) on 10-Апр-10, 13:18 
>нужно вывести
>1
>78
>1 1 1 1
>
>подскажите как?

Ну если именно с помощью awk надо, то можно как-то так:
awk '{ for (i=7;i<=NF;i++) printf $i FS; print ""}'

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

7. "Примеры использования Awk"  +/
Сообщение от user (??) on 04-Ноя-10, 23:34 
Здравствуйте! Подскажите пожалуйста, как вывести для каждого из файлов отчёт вида: всего в магазине … продано товаров на сумму … рублей. // при помощи команды - awk
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

8. "Примеры использования Awk"  +/
Сообщение от Hubbitus (ok) on 05-Ноя-10, 03:20 
> Здравствуйте! Подскажите пожалуйста, как вывести для каждого из файлов отчёт вида: всего
> в магазине … продано товаров на сумму … рублей. // при
> помощи команды - awk

Для какого файла-то?? Какая структура?

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

9. "Примеры использования Awk"  +/
Сообщение от Demeo email on 14-Дек-10, 21:02 
А можно ли сортировать вывод по алфавиту?
При выводе командой ifstat -W 1 1 статистики с множества интерфейсов шапка оказывается отдельно от данных, но строки помечены буквой англ. алфавита.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

10. "Примеры использования Awk"  +/
Сообщение от Hubbitus (ok) on 15-Дек-10, 14:52 
> А можно ли сортировать вывод по алфавиту?
> При выводе командой ifstat -W 1 1 статистики с множества интерфейсов шапка
> оказывается отдельно от данных, но строки помечены буквой англ. алфавита.

Да можно конечно сортировать, команда sort Вам в помощь. Только как это к AWK-то относится??

Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

11. "Примеры использования Awk"  +/
Сообщение от uri email(??) on 23-Фев-11, 18:26 
<q>Вывести группу строк, начиная со строки, в которой есть foo, и заканчивая
строкой, в которой есть bar:
   awk '/foo/,/bar/'

Исключив из вывода строки с вхождением заданных масок:
   awk '/foo/,/bar/{if (!/foo/ && !/bar/)print}'

Более оптимальный вариант:
  awk '/bar/{p=0};p;/foo/{p=1}'</q>

"Более оптимальные вариант не работает"

$ cat test
0
1
2
3
4
5
6

$cat test|awk '/1/,/5/'
1
2
3
4
5

$ cat test|awk '/1/{p=0};p;/5/{p=1}'
6

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

12. "Примеры использования Awk"  +/
Сообщение от Анон on 28-Окт-11, 14:36 
>Например, чтобы показать из файла с текстом только текст, отмеченный как =текст=
>
>можно использовать:
>   awk -v RS='=' '!(NR%2)'
>
>с форматированием переносов строк:
>
>   awk -v RS='=' '!(NR%2){gsub(/\n/," ");print}'

А !(NR%2) здесь зачем? Либо дополните описание, либо уберите лишний функционал.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

13. "Примеры использования Awk"  +/
Сообщение от Андрей email(??) on 10-Май-12, 18:54 
Есть файл:
May  9 21:58:56 kernel: OUTPUT CentOS:IN= OUT=br0 SRC=192.168.0.1 DST=192.168.0.109 LEN=52 TOS=0x10 PREC=0x00 TTL=64 ID=50328 DF PROTO=TCP SPT=22 DPT=46410 WINDOW=3432 RES=0x00 ACK URGP=0
May  9 21:58:56 dropbear[2029]: Child connection from 192.168.0.109:46410
May  9 21:58:56 kernel: OUTPUT CentOS:IN= OUT=br0 SRC=192.168.0.1 DST=192.168.0.109 LEN=78 TOS=0x10 PREC=0x00 TTL=64 ID=50329 DF PROTO=UDP SPT=22 DPT=46410 WINDOW=3432 RES=0x00 ACK PSH URGP=0
May  9 21:58:56 kernel: INPUT CentOS:IN=br0 OUT= MAC=cc:5d:4e:4d:ee:ee:00:0c:29:d9:0e:7b:08:00 SRC=192.168.0.109 DST=192.168.0.1 LEN=140 TOS=0x10 PREC=0x00 TTL=64 ID=42370 DF PROTO=UDP SPT=46410 DPT=22 WINDOW=229 RES=0x00 ACK PSH URGP=0
May  9 21:58:56 kernel: INPUT CentOS:IN=br0 OUT= MAC=cc:5d:4e:4d:ee:ee:00:0c:29:d9:0e:7b:08:00 SRC=192.168.0.109 DST=192.168.0.1 LEN=52 TOS=0x10 PREC=0x00 TTL=64 ID=42371 DF PROTO=TCP SPT=46410 DPT=22 WINDOW=229 RES=0x00 ACK URGP=0
May  9 21:58:56 kernel: INPUT CentOS:IN=br0 OUT= MAC=cc:5d:4e:4d:ee:ee:00:0c:29:d9:0e:7b:08:00 SRC=192.168.0.109 DST=192.168.0.1 LEN=140 TOS=0x10 PREC=0x00 TTL=64 ID=42372 DF PROTO=TCP SPT=46410 DPT=22 WINDOW=229 RES=0x00 ACK PSH FIN URGP=0
May  9 21:58:56 kernel: OUTPUT CentOS:IN= OUT=br0 SRC=192.168.0.1 DST=192.168.0.109 LEN=52 TOS=0x10 PREC=0x00 TTL=64 ID=50330 DF PROTO=TCP SPT=22 DPT=46410 WINDOW=3432 RES=0x00 ACK URGP=0
May  9 21:58:56 kernel: OUTPUT CentOS:IN= OUT=br0 SRC=192.168.0.1 DST=192.168.0.109 LEN=52 TOS=0x10 PREC=0x00 TTL=64 ID=50331 DF PROTO=TCP SPT=22 DPT=46410 WINDOW=3432 RES=0x00 ACK FIN URGP=0
May  9 21:58:56 dropbear[2029]: Exit before auth: Exited normally
May  9 21:58:56 kernel: INPUT CentOS:IN=br0 OUT= MAC=cc:5d:4e:4d:ee:ee:00:0c:29:d9:0e:7b:08:00 SRC=192.168.0.109 DST=192.168.0.1 LEN=52 TOS=0x10 PREC=0x00 TTL=64 ID=0 DF PROTO=UDP SPT=46410 DPT=22 WINDOW=229 RES=0x00 ACK URGP=0

Как из всех строк данного файла, где есть PROTO вывести столбцы в которых содержиться PROTO=
Просто в одной строке PROTO содержиться в 17 столбце, в другой в 16 столбце.

Нужно что-то типа
1 PROTO=TCP
3 PROTO=UDP
4 PROTO=UDP
5 PROTO=TCP
6 PROTO=TCP
7 PROTO=TCP
8 PROTO=TCP
10 PROTO=UDP


Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

14. "Примеры использования Awk"  +/
Сообщение от AstraSerg (??) on 15-Июн-12, 22:07 
>[оверквотинг удален]
> 16 столбце.
> Нужно что-то типа
> 1 PROTO=TCP
> 3 PROTO=UDP
> 4 PROTO=UDP
> 5 PROTO=TCP
> 6 PROTO=TCP
> 7 PROTO=TCP
> 8 PROTO=TCP
> 10 PROTO=UDP

awk -F'PROTO=' '{print $2}' | awk '{print "PROTO="$1}'

Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору

15. "Примеры использования Awk"  +/
Сообщение от bzmn email on 01-Сен-12, 18:10 
а вывести только те строки, определенный столб которых содержит математическое значение равное/неравное/меньше/больше/мИЛИр/бИЛИр заданному значению?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

16. "Примеры использования Awk"  +/
Сообщение от bzmn email on 27-Сен-12, 21:07 
сам спросил - сам отвечаю:

awk ' $1 >= 0 '

Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

17. "Примеры использования Awk"  +/
Сообщение от ram email(??) on 30-Ноя-12, 17:38 
подскажите, как вывести только слова, обособленные к примеру скобками?

из такого:

[tekila]trololo[-borjomi]
[tort]tralala[-pizza]

получить:

trololo
tralala

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

18. "Примеры использования Awk"  +/
Сообщение от anon_ddqd on 25-Окт-13, 15:57 
bash-3.2$  less test.txt
[tekila]trololo[-borjomi]
[tort]tralala[-pizza]
bash-3.2$ less test.txt | awk -F"]" '{print $2}' | awk -F"[" '{print $1}'
trololo
tralala
bash-3.2$
Ответить | Правка | ^ к родителю #17 | Наверх | Cообщить модератору

19. "Примеры использования Awk"  +/
Сообщение от Кирилл email(??) on 21-Ноя-13, 11:59 
Здравствуйте.

Есть файл с содержимым типа:
a = b
b = c
a = b
a = b
a = b
b = c
a = b

и т.д

Как вывести только те a = b после которых идет b = c?

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

20. "Раздел полезных советов: Примеры использования Awk"  +/
Сообщение от palit email(ok) on 25-Дек-13, 18:39 
Добрый день !!!
подскажите как можно заменить определенное количество полей(колонок) в строке файла ?
есть файл вырезаю 4 поля с помощью awk и нужно вставить эти 4 поля в другой файл
#!/bin/bash
f1=addcron.txt
f2=file.txt
res=`awk '/#1/ {print $1, $2, $3, $4}' f1`  #вырезание 4 полей в одном файле
пробую вставить в другой файл заменяется только одно поле

awk '{sub ($1, "'"$res"'"); print}' $f2 #вставка 4 полей в другой файл
как можно заменить 4 поля в определенной строке или, написать скрипт в одной строке с помощью sed или awk

содержимое файла f1 addcron.txt
22 33 6 5      #1
192.168.2.1
содержимое файля f2 file.txt
/1 22 4 * root   /home/creattar.sh

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

21. "Примеры использования Awk"  +/
Сообщение от Yura email(??) on 18-Авг-17, 09:50 
Здравствуйте.
Есть файл  типа
Username: Александр
  ROLE_USER
  ROLE_ADMIN
  ROLE_SUPER_ADMIN
  ROLE_SUPPORT_CHAT
  ROLE_TAG_EDITOR
  ROLE_TEST

Username: Александр
  ROLE_USER
  ROLE_ADMIN
  ROLE_SUPER_ADMIN
  ROLE_SUPPORT_CHAT
  ROLE_TAG_EDITOR
  ROLE_TEST2

Username: Rus10Neo
  ROLE_USER
  ROLE_SONATA_EDITOR
  ROLE_SONATA_READER
  ROLE_SONATA_ADMIN
  ROLE_FOOTBALL_PLAYER_MERGE
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_STAFF
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_BET_LINK_EDITOR
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_EDITOR
  ROLE_ALL_TIPS_EDITOR
  ROLE_INTELL_ADMIN_ADMIN_FOOTBALL_MEETING_TV_CHANNEL_ADMIN
  ROLE_TIP_LOCALE_ADMIN

Username: Rus10Neo
  ROLE_USER
  ROLE_SONATA_EDITOR
  ROLE_SONATA_READER
  ROLE_SONATA_ADMIN
  ROLE_FOOTBALL_PLAYER_MERGE
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_STAFF
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_BET_LINK_EDITOR
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_EDITOR
  ROLE_ALL_TIPS_EDITOR
  ROLE_INTELL_ADMIN_ADMIN_FOOTBALL_MEETING_TV_CHANNEL_ADMIN
  ROLE_TIP_LOCALE_ADMIN
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_BET_LINK_ADMIN
  ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_ADMIN

нужно разбить на абзацы. количество строк динамическое и количество абзацев. Заранее благодарен

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

22. "Примеры использования Awk"  +/
Сообщение от Dima (??) on 18-Авг-17, 12:30 
>[оверквотинг удален]
>   ROLE_FOOTBALL_PLAYER_MERGE
>   ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_STAFF
>   ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_BET_LINK_EDITOR
>   ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_EDITOR
>   ROLE_ALL_TIPS_EDITOR
>   ROLE_INTELL_ADMIN_ADMIN_FOOTBALL_MEETING_TV_CHANNEL_ADMIN
>   ROLE_TIP_LOCALE_ADMIN
>   ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_BET_LINK_ADMIN
>   ROLE_INTELL_ADMIN_ADMIN_IN_FORECAST_ADMIN
> нужно разбить на абзацы. количество строк динамическое и количество абзацев. Заранее благодарен

Можно образец, как должен выглядеть результат?
Из описания не очень понятно.

Ответить | Правка | ^ к родителю #21 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру