Проблема неструктурированных наименований полей (Excel, Qlikview, Qlik Sense)

Автор Eva, 10 апреля 2017, 09:36:58

« назад - далее »

Eva

Добрый день.Сталкивались ли вы в своей работе с проблемой того,что пользователь предоставляет данные в ексель файлах с разрозненными наименованиями полей,например городов или названия клиентов написанны в произвольной форме. Например один и тот же клиент может идти с полным названием,с сокращенным,с припиской ооо в начале, в конце, совсем без нее,с ошибками в названиях И так далее.Или есть адрес,откуда нужно забрать город,но адреса так же не унифицированны и написаны произвольно.Как можно справиться с такой проблемой,мэпринг получается очень большой и трудозатратный,так как в файлах тысячи строк,а функции subfield  и другие строковые функции не получается примнгить из-за сильной неструктурированности полей?

admin

Цитата: Eva от 10 апреля  2017, 09:36:58  
Как можно справиться с такой проблемой?
Организацией порядка при вводе данных.

Prive

Цитата: Eva от 10 апреля  2017, 09:36:58  
Добрый день.Сталкивались ли вы в своей работе с проблемой того,что пользователь предоставляет данные в ексель файлах с разрозненными наименованиями полей,например городов или названия клиентов написанны в произвольной форме.
Вообще очисткой данных, приведением к собственным полям в учётной системе должна заниматься отдельное подразделение. (если это внешние данные)
Автоматически сделать не получится, будет большой процент ошибки.

Яндекс.Метрика