Blame view

vendor/yiisoft/multiparser/CsvParser.php 7.74 KB
1e991822   Mihail   csv parser with e...
1
2
  <?php
  /**
1e991822   Mihail   csv parser with e...
3
  
40ff24a1   Mihail   refactor CsvParse...
4
   */
036717a1   Mihail   add error excepti...
5
  namespace yii\multiparser;
93e39994   Mihail   fixed parser and ...
6
  use common\components\CustomVarDamp;
dc10d651   Mihail   add value filter ...
7
  
1e991822   Mihail   csv parser with e...
8
  
474f35bf   Mihail   add DynamicFormHe...
9
10
11
  /**
   * Class CsvParser
   * @package yii\multiparser
6215a30d   Mihail   add converter int...
12
   * @todo - перевести на анг. яз.
474f35bf   Mihail   add DynamicFormHe...
13
   */
6215a30d   Mihail   add converter int...
14
  class CsvParser extends Parser
999b9326   Mihail   add detectStartPo...
15
  {
40ff24a1   Mihail   refactor CsvParse...
16
17
      /** @var bool
      имеет ли файл заголовок который будет установлен ключами возвращемого массива*/
e55d56cc   Mihail   add draft version...
18
      public $hasHeaderRow = false;
40ff24a1   Mihail   refactor CsvParse...
19
20
21
      /** @var array - массив с заголовком,
       * если не указан и установлено свойство $hasHeaderRow - будет определен автоматически */
      public $keys;
1e991822   Mihail   csv parser with e...
22
  
40ff24a1   Mihail   refactor CsvParse...
23
      /** @var экземляр SplFileObject читаемого файла */
e55d56cc   Mihail   add draft version...
24
      public $file;
1e991822   Mihail   csv parser with e...
25
  
40ff24a1   Mihail   refactor CsvParse...
26
      /** @var int - первая строка с которой начинать парсить */
e55d56cc   Mihail   add draft version...
27
      public $first_line = 0;
1e991822   Mihail   csv parser with e...
28
  
40ff24a1   Mihail   refactor CsvParse...
29
30
31
32
33
      /** @var int - последняя строка до которой  парсить
       * если не указана, то парсинг происходит до конца файла*/
      public $last_line = 0;
  
      /** @var int - первая колонка файла с которой начнется парсинг */
e55d56cc   Mihail   add draft version...
34
      public $first_column = 0;
b13b1c83   Mihail   final version par...
35
  
40ff24a1   Mihail   refactor CsvParse...
36
      /** @var string - разделитель csv */
e55d56cc   Mihail   add draft version...
37
      public $delimiter = ';';
40ff24a1   Mihail   refactor CsvParse...
38
39
40
41
42
43
44
45
  
      /** @var bool
      нужно ли искать автоматически первоую значисмую строку (не пустая строка)
       * иначе первая строка будет взята из аттрибута $first_line */
      public $auto_detect_first_line = false;
  
      /** @var int - количество значимых колонок, что бы определить первую значимую строку
       * используется при автоопределении первой строки*/
e55d56cc   Mihail   add draft version...
46
      public $min_column_quantity = 5;
dc10d651   Mihail   add value filter ...
47
  
6215a30d   Mihail   add converter int...
48
49
50
51
  //    /** @var array - конфигурация конвертера значений */
  //    public $converter_conf = [];
  //    /** @var array - конвертер созданный по конфигурации */
  //    public $converter = NULL;
d3cf6647   Mihail   add multiply pric...
52
53
      /** @var int - текущая строка */
      private $current_line = 0;
5c710262   Mihail   edit csv parser -...
54
  
474f35bf   Mihail   add DynamicFormHe...
55
  
40ff24a1   Mihail   refactor CsvParse...
56
      /**
74072a2a   Mihail   add first version...
57
       * метод устанвливает нужные настройки объекта SplFileObject, для работы с csv
40ff24a1   Mihail   refactor CsvParse...
58
       */
e55d56cc   Mihail   add draft version...
59
60
      public function setup()
      {
999b9326   Mihail   add detectStartPo...
61
62
63
          $this->file->setCsvControl($this->delimiter);
          $this->file->setFlags(\SplFileObject::READ_CSV);
          $this->file->setFlags(\SplFileObject::SKIP_EMPTY);
aa518ad3   Mihail   finishing with co...
64
  
40ff24a1   Mihail   refactor CsvParse...
65
66
          if ($this->auto_detect_first_line) {
              $this->shiftToFirstValuableLine();
e55d56cc   Mihail   add draft version...
67
          }
aa518ad3   Mihail   finishing with co...
68
  
6215a30d   Mihail   add converter int...
69
70
71
          if ($this->hasHeaderRow) {
              // если у файла есть заголовок, то в результате имеем ассоциативный массив
              $this->converter_conf['hasKey'] = 1;
74072a2a   Mihail   add first version...
72
          }
74072a2a   Mihail   add first version...
73
  
6215a30d   Mihail   add converter int...
74
          parent::setup();
74072a2a   Mihail   add first version...
75
  
6215a30d   Mihail   add converter int...
76
      }
74072a2a   Mihail   add first version...
77
      /**
40ff24a1   Mihail   refactor CsvParse...
78
79
80
81
82
83
       * определяет первую значимую строку,
       * считывается файл пока в нем не встретится строка с непустыми колонками
       * в количестве указанном в атрибуте min_column_quantity
       * в результате выполнения курсор ресурса будет находится на последней незначимой строке
       */
      protected function shiftToFirstValuableLine()
e55d56cc   Mihail   add draft version...
84
      {
e55d56cc   Mihail   add draft version...
85
  
40ff24a1   Mihail   refactor CsvParse...
86
          $finish = false;
2cdc93f0   Mihail   add crud models f...
87
          while (!$finish ) {
d3cf6647   Mihail   add multiply pric...
88
89
              $this->current_line ++;
  
999b9326   Mihail   add detectStartPo...
90
              $j = 0;
93e39994   Mihail   fixed parser and ...
91
              $row = $this->file->fgetcsv();;
999b9326   Mihail   add detectStartPo...
92
93
              if ($row === false) {
                  continue;
e55d56cc   Mihail   add draft version...
94
              }
999b9326   Mihail   add detectStartPo...
95
  
999b9326   Mihail   add detectStartPo...
96
              for ($i = 1; $i <= count($row); $i++) {
999b9326   Mihail   add detectStartPo...
97
98
99
100
101
102
  
                  if ($row[$i - 1] <> '') {
                      $j++;
                  }
  
                  if ($j >= $this->min_column_quantity) {
40ff24a1   Mihail   refactor CsvParse...
103
                      break 2;
999b9326   Mihail   add detectStartPo...
104
                  }
e55d56cc   Mihail   add draft version...
105
106
              }
          }
2cdc93f0   Mihail   add crud models f...
107
108
109
110
          // @todo - сделать опционально
          // код для того что бы парсить первую строку, закомментировано как предполагается что первая значимая строка это заголовок
   //       $this->current_line --;
  //        $this->file->seek( $this->current_line );
e55d56cc   Mihail   add draft version...
111
      }
1e991822   Mihail   csv parser with e...
112
113
  
      /**
40ff24a1   Mihail   refactor CsvParse...
114
115
       * @return array - итоговый двумерный массив с результатом парсинга
       * метод считывает с открытого файла данные построчно
1e991822   Mihail   csv parser with e...
116
117
118
       */
      public function read()
      {
aa518ad3   Mihail   finishing with co...
119
  
1e991822   Mihail   csv parser with e...
120
          $return = [];
40ff24a1   Mihail   refactor CsvParse...
121
  
01746976   Mihail   fix errors with w...
122
123
124
125
          // будем считать количество пустых строк подряд - при трех подряд - считаем что это конец файла и выходим
          $empty_lines = 0;
          while ( $empty_lines < 3 ) {
              // прочтем строку из файла. Если там есть значения - то в ней массив, иначе - false
d3cf6647   Mihail   add multiply pric...
126
              $row = $this->readRow(  );
40ff24a1   Mihail   refactor CsvParse...
127
  
01746976   Mihail   fix errors with w...
128
129
130
131
132
133
              if ($row === false) {
                  //счетчик пустых строк
                  $empty_lines++;
                  continue;
              }
              // строка не пустая, имеем прочитанный массив значений
d3cf6647   Mihail   add multiply pric...
134
              $this->current_line++;
1e991822   Mihail   csv parser with e...
135
              if ($this->hasHeaderRow) {
93e39994   Mihail   fixed parser and ...
136
                  // в файле есть заголовок, но он еще не назначен, назначим
dc10d651   Mihail   add value filter ...
137
138
                  if ($this->keys === NULL) {
                      $this->keys = array_values($row);
1e991822   Mihail   csv parser with e...
139
                  }
1e991822   Mihail   csv parser with e...
140
              }
40ff24a1   Mihail   refactor CsvParse...
141
              // если у нас установлен лимит, при  его достижении прекращаем парсинг
d3cf6647   Mihail   add multiply pric...
142
              if (($this->last_line) && ($this->current_line > $this->last_line)) {
999b9326   Mihail   add detectStartPo...
143
144
                  break;
              }
01746976   Mihail   fix errors with w...
145
146
              // обнуляем счетчик, так как считаюся пустые строки ПОДРЯД
              $empty_lines = 0;
93e39994   Mihail   fixed parser and ...
147
148
  
              $return[] = $row;
1e991822   Mihail   csv parser with e...
149
150
151
          }
  
          $this->closeHandler();
1e991822   Mihail   csv parser with e...
152
153
154
          return $return;
      }
  
2957209c   Mihail   csv parser - add ...
155
  
dfeb2d10   Mihail   edit universal cs...
156
      protected function closeHandler()
1e991822   Mihail   csv parser with e...
157
      {
2957209c   Mihail   csv parser - add ...
158
          $this->file = NULL;
1e991822   Mihail   csv parser with e...
159
160
      }
  
40ff24a1   Mihail   refactor CsvParse...
161
162
163
      /**
       * @return array - одномерный массив результата парсинга строки
       */
d3cf6647   Mihail   add multiply pric...
164
      protected function readRow(  )
1e991822   Mihail   csv parser with e...
165
      {
999b9326   Mihail   add detectStartPo...
166
          $row = $this->file->fgetcsv();
706a1491   Mihail   add form, model a...
167
  
74072a2a   Mihail   add first version...
168
          if (is_array($row)) {
706a1491   Mihail   add form, model a...
169
170
171
172
              // уберем нулевые колонки
              $row = array_filter($row, function($val){
                  return $val <> '';
              });
93e39994   Mihail   fixed parser and ...
173
174
175
176
              // если есть заголовок, то перед конвертацией его нужно назначить
              if ($this->hasHeaderRow && $this->keys !== NULL) {
  
                  if (count($this->keys) !== count($row)) {
d3cf6647   Mihail   add multiply pric...
177
                      throw new \ErrorException("Ошибка парсинга файла в строке # {$this->current_line}. Не соответсвие числа ключевых колонок (заголовка) - числу колонок с данными", 0, 1, $this->file->getBasename(), $this->current_line);
93e39994   Mihail   fixed parser and ...
178
179
180
181
182
                  }
  
                  $row = array_combine($this->keys, $row);
              }
              // попытаемся конвертировать прочитанные значения согласно конфигурации котнвертера значений
74072a2a   Mihail   add first version...
183
              $row = $this->convert($row);
93e39994   Mihail   fixed parser and ...
184
185
              // обрежем массив к первой значимой колонке
              if ( $this->first_column ) {
40ff24a1   Mihail   refactor CsvParse...
186
  
74072a2a   Mihail   add first version...
187
                  $row = array_slice($row, $this->first_column);
40ff24a1   Mihail   refactor CsvParse...
188
  
74072a2a   Mihail   add first version...
189
              }
dfeb2d10   Mihail   edit universal cs...
190
          }
999b9326   Mihail   add detectStartPo...
191
192
          if (is_null($row))
              $row = false;
dc10d651   Mihail   add value filter ...
193
  
dfeb2d10   Mihail   edit universal cs...
194
          return $row;
1e991822   Mihail   csv parser with e...
195
196
197
  
      }
  
1e991822   Mihail   csv parser with e...
198
199
  
  }