ло двоеточий = 5
    Число точек с запятой = 6
    Число слов = 50
    Число символов в словах = 150
    Число предложений = 10
    Средняя длина предл. = 5 (слов)
    Средняя длина слова = 3


<b>6.  Ввод и вывод данных в AWK-программах</b>


     Ввод данных в AWK-программу определяется  именем  вход-
ного  файла в командной строке. Таких файлов может быть нес-
колько, и обрабатываться AWK-программой они будут последова-
тельно  в том порядке, в котором указаны в командной строке,
например:

    <b>awk  -f</b> prog f1 f2 f3 f4

AWK-программа из файла prog будет  выполняться  над  входным
потоком записей из файлов f1, f2, f3 и f4.  Здесь необходимо
отметить, что предопределенная  переменная  <b>NR</b>  будет  иметь
значение,  равное  порядковому номеру записи ( <b>NR</b> не обнуля-
ется при переходе к чтению очередного файла).  Пусть имеются
четыре файла. Файл f1:

    a[1][1]  a[1][2]  a[1][3]  a[1][4]
    a[2][1]  a[2][2]  a[2][3]  a[2][4]
    a[3][1]  a[3][2]  a[3][3]  a[3][4]
    a[4][1]  a[4][2]  a[4][3]  a[4][4]

Файл f2:

    b[1][1]  b[1][2]  b[1][3]  b[1][4]
    b[2][1]  b[2][2]  b[2][3]  b[2][4]
    b[3][1]  b[3][2]  b[3][3]  b[3][4]
    b[4][1]  b[4][2]  b[4][3]  b[4][4]

Файл f3:

    c[1][1]  c[1][2]  c[1][3]  c[1][4]
    c[2][1]  c[2][2]  c[2][3]  c[2][4]
    c[3][1]  c[3][2]  c[3][3]  c[3][4]
    c[4][1]  c[4][2]  c[4][3]  c[4][4]

Файл f4:


                           <b>- 26 -</b>


    d[1][1]  d[1][2]  d[1][3]  d[1][4]
    d[2][1]  d[2][2]  d[2][3]  d[2][4]
    d[3][1]  d[3][2]  d[3][3]  d[3][4]
    d[4][1]  d[4][2]  d[4][3]  d[4][4]

Каждый из этих файлов включает по четыре записи  (по  четыре
поля  в  каждой).   Другими  словами,  каждый файл - матрица
(4*4).  Допустим, необходимо получить новую матрицу  с  раз-
мерностью  (4*4),  столбцы  которой  составлены из элементов
диагоналей исходных матриц. Ниже приведен текст программы, в
которой решается эта задача:

    <b>{</b>
        <b>if</b>( <b>FILENAME !=</b> Name ) <b>{</b>
                i <b>=</b> 0<b>;</b>
                Name <b>= FILENAME;</b>
        <b>}</b>

        i<b>++;</b>
        <b>if</b>( i <b>==</b> 1 ) <b>{</b>
                Dig1 <b>=</b> Dig1 " " <b>$</b>1<b>;</b>
                <b>next;</b>
        <b>}</b>
        <b>if</b>( i <b>==</b> 2 ) <b>{</b>
                Dig2 <b>=</b> Dig2 " " <b>$</b>2<b>;</b>
                <b>next;</b>
        <b>}</b>
        <b>if</b>( i <b>==</b> 3 ) <b>{</b>
                Dig3 <b>=</b> Dig3 " " <b>$</b>3<b>;</b>
                <b>next;</b>
        <b>}</b>
        <b>if</b>( i <b>==</b> 4 ) Dig4 <b>=</b> Dig4 " " <b>$</b>4<b>;</b>
    <b>}</b>

    <b>END     {</b>
            <b>print</b>( Dig1 )<b>;</b>
            <b>print</b>( Dig2 )<b>;</b>
            <b>print</b>( Dig3 )<b>;</b>
            <b>print</b>( Dig4 )<b>;</b>
    <b>}</b>


     В программе два правила.  Первое  правило  не  содержит
селектора, следовательно, выполняется для всех входных запи-
сей.  Второе  правило  выполняется  по  завершению  входного
потока.  Программа работает следующим образом: первоначально
проверяется, изменилось ли имя входного  файла  (предопреде-
ленная  переменная  <b>FILENAME</b>),  затем,  если  не изменилось,
присваивается значение соответствующего поля записи к  пере-
менной  Dig (используется операция конкатенации старого зна-
чения Dig со значением поля и присваивания Dig нового значе-
ния).  Переменная  Name  предназначена  для сохранения имени
входного файла. Первоначально значения переменных Name и Dig


                           <b>- 27 -</b>


равны  пустым строкам. Важно, что мы знаем точно число запи-
сей, это позволяет выделять нужные поля в  записях.   Допус-
тим, выполняется следующая командная строка:

    <b>awk -f</b> prog  f1 f2 f3 f4 &gt<b>&</b>gt; Result

в файле Result будем иметь:

    a[1][1] b[1][1] c[1][1] d[1][1]
    a[2][2] b[2][2] c[2][2] d[2][2]
    a[3][3] b[3][3] c[3][3] d[3][3]
    a[4][4] b[4][4] c[4][4] d[4][4]

Результат работы программы  существенно  связан  с  порядком
чтения входных файлов. Если выполнить командную строку

    <b>awk -f</b> prog  f4 f3 f2 f1 &gt<b>&</b>gt; Result

получим:

    d[1][1] c[1][1] b[1][1] a[1][1]
    d[2][2] c[2][2] b[2][2] a[2][2]
    d[3][3] c[3][3] b[3][3] a[3][3]
    d[4][4] c[4][4] b[4][4] a[4][4]


     Когда возникает необходимость передать в  AWK-программу
значения некоторых переменных, можно воспользоваться возмож-
ностью указать их в файле.  Допустим,  заранее  не  известны
образцы  для выделения записей файла f1. В этом случае можно
создать файл f0 с описаниями  образцов  и,  воспользовавшись
значением  переменной  <b>FILENAME</b>,  присвоить  этим переменным
нужные значения. Пусть файл f0 имеет вид:

    aaa bbb ccc

Пусть файл f1 имеет вид:

    aaa bbb ccc ddd eee
    eee bbb ccc ddd aaa
    aaa fff ccc ddd eee
    aaa bbb ggg ttt eee

Программа на <b>AWK</b>:


                           <b>- 28 -</b>


    <b>FILENAME ==</b> "f0" <b>{</b>
            pat1 <b>=  $</b>1<b>;</b>
            pat2 <b>=  $</b>2<b>;</b>
            pat3 <b>=  $</b>3<b>;</b>
            <b>next;</b>
    <b>}</b>

    <b>$</b>1 <b>==</b> pat1 <b>{ print; next }</b>
    <b>$</b>2 <b>==</b> pat2 <b>{ print; next }</b>
    <b>$</b>3 <b>==</b> pat3 <b>{ print }</b>

После выполнения командной строки

    <b>awk -f</b> prog f0 f1

получим в файле Result:

    aaa bbb ccc ddd eee
    aaa fff ccc ddd eee
    aaa bbb ggg ttt eee


     Можно предусмотреть  ввод  переменных  со  стандартного
ввода;  воспользуемся тем, что переменная <b>FILENAME</b> для стан-
дартного ввода определена как "<b>-</b>".  Пусть файл f1 имеет вид:

    aaa bbb ccc ddd eee
    eee bbb ooo ddd aaa
    aaa fff ccc ddd eee
    qqq bbb ggg ttt eee
    ooo fff ggg ttt eee
    ccc bbb ggg ttt eee

Приведенная ниже программа позволяет получить значения пере-
менных с клавиатуры дисплея:

    <b>BEGIN   { print</b>("Вводите значения полей:")<b>; }</b>

    <b>FILENAME ==</b> "<b>-</b>" <b>{</b>
            pat1 <b>=  $</b>1<b>;</b>
            pat2 <b>=  $</b>2<b>;</b>
            pat3 <b>=  $</b>3<b>;</b>
    <b>}</b>

    <b>FILENAME ==</b> "f1" <b>{</b>
            <b>if</b>(<b>$</b>1 <b>==</b> pat1) <b>{ print</b>(<b>$</b>0)<b>; next }</b>
            <b>if</b>(<b>$</b>2 <b>==</b> pat2) <b>{ print</b>(<b>$</b>0)<b>; next }</b>
            <b>if</b>(<b>$</b>3 <b>==</b> pat3) <b>{ print</b>(<b>$</b>0)<b>;}</b>
    <b>}</b>

После запуска на выполнение следующей командной строки

    <b>awk -f</b> prog <b>-</b> f1


                           <b>- 29 -</b>


программа будет ждать ввода с клавиатуры дисплея  (завершить
ввод необходимо символом конец файла - <b>CTRL/D</b>). Например:

    Вводите значения полей:
    qqq fff ooo
    <b>CTRL/D</b>
    eee bbb ooo ddd aaa
    aaa fff ccc ddd eee
    qqq bbb ggg ttt eee
    ooo fff ggg ttt eee


     Как уже говорилось раньше, вывод AWK-программы  направ-
ляется  на  экран  дисплея,  если  не  было  указано другое.
Существует возможность направить вывод по нескольким каналам
непосредственно из AWK-программы, для этого можно воспользо-
ваться стандартными средствами системы ДЕМОС.  Например:

    <b>print</b>( <b>$</b>0 ) &gt<b>&</b>gt; "file"<b>;</b>

запись будет направлена в файл с именем ./file;

    <b>print</b>( <b>$</b>0 ) &gt<b>&</b>gt;&gt<b>&</b>gt; "file"<b>;</b>

запись будет дописана в ./file;

    <b>print</b>( <b>$</b>0 ) &gt<b>&</b>gt; <b>$</b>2<b>;</b>

запись будет направлена в файл с именем, равным  содержимому
ее второго поля.

     Существует возможность из AWK-программы направить вывод
в конвейер, например:

    <b>{</b>
       <b>print</b>(<b>$</b>0) <b>|</b> "<b>tr</b> ' ' '\n' <b>| sort</b> "<b>;</b>
    <b>}</b>

Здесь запись будет направлена команде  <b>tr</b>,  которая  заменит
пробел символом '\n', затем отсортирована командой <b>sort</b>.

     Пусть выполнена следующая командная строка:

    <b>awk -f</b> prog <b>-</b>

после ввода с клавиатуры нескольких записей

    dfa nrk klm njf rty xvz
    saa ass dcf vfr klm ttr
    <b>CTRL/D</b>

получим:


                           <b>- 30 -</b>


    ass
    dcf
    dfa
    klm
    klm
    njf
    nrk
    rty
    saa
    ttr
    vfr
    xvz

Вывод результата работы конвейера осуществляется по заверше-
нию  чтения последней входной записи. Канал вывода в примере
совпадает с каналом стандартного вывода, но его можно  пере-
определить на любой файл.

     В одной  AWK-программе  можно  одновременно  определить
несколько  каналов  вывода,  число  которых зависит от числа
файлов, разрешенных для  одновременного  использования.  Это
число  устанавливается  при  генерации  операционной системы
ДЕМОС.

     Для вывода данных в AWK-программе предназначен оператор
<b>print</b>.   До  настоящего момента мы применяли лишь одну форму
использования этого оператора:

    <b>print</b>(список_фактических_параметров)<b>;</b>

Круглые скобки использовались раньше для того, чтобы не отв-
лекать  читателя,  знакомого с языком программирования Си, -
их можно не указывать. Существуют и другие формы использова-
ния этого оператора:

<b>print;</b>
     выводится вся запись;

<b>print $</b>1, <b>$</b>2<b>;</b>
     значения полей выводятся через пробел;

<b>print $</b>1 <b>$</b>2<b>;</b>
     выводится конкатенация значений полей.


     При  необходимости  управления  форматом  вывода  можно
использовать   библиотечную   функцию  <b>printf</b>,  синтаксис  и
результат работы  которой такие же, как и в языке Си.

<b>7.  Использование встроенных функций</b>


                           <b>- 31 -</b>


     Интерпретатор <b>awk</b> включает  набор  встроенных  функций,
которые  можно  использовать в действиях правил.  Существуют
два способа вызова встроенных функций:

    имя_функции(список_фактических_параметров)

    имя_функции

Во втором случае в качестве фактического параметра  применя-
ется  вся текущая запись. Как обычно, значение функции подс-
тавляется в выражение в том месте, где определен вызов.

     Имеются следующие встроенные функции:

<b>length</b>(выражение)
     значением выражения является  строка.   Функция  <b>length</b>
     возвращает длину строки, например:

         <b>print</b>( <b>length</b>(<b>$</b>1 " " <b>$</b>2))<b>;</b>

     будет напечатана длина строки, полученной конкатенацией
     поля  <b>$</b>1, пробела и поля <b>$</b>2.  Форма без аргумента возв-
     ращает длину записи.

<b>exp</b>(выражение)
     возвращает экспоненту от выражения.

<b>log</b>(выражение)
     возвращает натуральный логарифм выражения.

<b>sqrt</b>(выражение)
     возвращает значение квадратного корня от выражения.

<b>int</b>(выражение)
     возвращает целую часть числа, равного значению  выраже-
     ния.

<b>substr(</b>S, M, N)
     возвращает часть строки S, начинающуюся от позиции M  и
     имеющую  длину  не более N символов. Символы в строке S
     нумеруются с 1.  Если аргумент N не указан,   возвраща-
     ются все символы от M до конца строки.

         string <b>= substr</b>( <b>$</b>0, 12, 20)<b>;</b>

     String будет включать 9 символов (с 12 по  20)  текущей
     записи.

<b>index</b>(As, Ps)
     возвращает номер позиции, с которой строка Ps совпадает
     со строкой As. Если совпадения нет, возвращается 0.


                           <b>- 32 -</b>


<b>sprintf</b>(формат, выражение, ...)
     возвращает строку,  выведенную  по  формату.  Синтаксис
     функции и результат работы аналогичны функции <b>sprintf</b> в
     библиотеке языка программирования Си.

<b>split</b>( S, Name, разделитель )
     строка S разбивается на поля, значения которых присваи-
     ваются  элементам  массива Name. Значением первого эле-
     мента  Name[1]  будет  содержимое  первого  выделенного
     поля,  значением  второго  элемента  Name[2]  - второго
     выделенного поля и так далее.  Если не указан  раздели-
     тель   полей,  используется  значение  предопределенной
     переменной <b>FS</b>.  Функция <b>split</b> возвращает число выделен-
     ных полей. Рассмотрим пример.  Пусть имеется файл f1

         aaa bbb ccc# ddd# eee fff# ggg
         ttt# ggg eee# ccc ddd sss# yyy

     и AWK-программа

         <b>{</b>
           i <b>= split</b>( <b>$</b>0, Name, "#")<b>;</b>
           <b>for</b>(j <b>=</b> 1; j &lt<b>&</b>lt;<b>=</b> i; j<b>++</b>)
               <b>print</b>( "Name["j"] =", Name[j])<b>;</b>
         <b>}</b>

     после выполнения командной строки

         <b>awk -f</b> prog f1

     получим:

         Name[1] = aaa bbb ccc
         Name[2] =  ddd
         Name[3] =  eee fff
         Name[4] =  ggg
         Name[1] = ttt
         Name[2] =  ggg eee
         Name[3] =  ccc ddd sss
         Name[4] =  yyy


                           <b>- 33 -</b>


                         СОДЕРЖАНИЕ


    Аннотация .........................................    2

1.  Принципы работы интерпретатора awk ................    3

2.  Переменные,  выражения  и   присваивания   в   AWK-
    программах ........................................    7

3.  Структура AWK-программы ...........................   13

4.  Селекторы .........................................   16

5.  Действия ..........................................   22

6.  Ввод и вывод данных в AWK-программах ..............   26

7.  Использование встроенных функций ..................   31


                           <b>- 34 -</b>