Как да свързваме данни от различни източници за създаване на анализи

Продължаваме серията си от материали, свързани с анализа на данни. Днес ще се фокусираме върху задача, която често затруднява бизнеса, а именно как да подходим към работата с данни от различни източници.

Данните, които генерира една компания, могат да произлизат от множество различни източници – справки, идващи от системите за управление на бизнеса (ERP и CRM), данни от производствените системи, справки от банки, отчети от външни контрагенти и ред други. Излишно е да казваме, че сами по себе си тези отделни източници не могат да ни предоставят цялостна информация, нужна за анализи, прогнози и вземане на решения. За да получим цялостната картина, която ни е необходима, трябва да свържем всички тези отделни парчета в едно общо цяло.

Свързването на данни от различни източници обаче често може да ни изправи пред редица предизвикателства. В нашата работа, ние също сме се сблъсквали с някои от тях:

  • Данните идват от две или повече независими системи, като в нито една от тях няма пълно множество
  • Файловете със записи за осъществени транзакции съдържат само код на артикул или контрагент и в тях липсва по-подробна информация за номенклатури
  • Транзакциите не съдържат аналитичностите в момента на регистрирането им, в резултат при промяна на сегментация се променя и историята
  • Недобре дефинираните връзки или недоброто структуриране на свързваните файлове могат напълно да изключат от анализа ценна за нас информация
  • Изграждането на цялостна картина се затруднява от липсата на автоматизиран експорт на данни от определени източници, тоест налага се да изчакаме друг човек да експортира данни от дадена система, за да ги използваме в своята работа
  • Затрудняваме се да намерим местоположението на данните в различните специфични системи и ред други

Като резултат от всички тези предизвикателства, често се озоваваме в ситуация, в която при свързването на файлове от различни източници:

  • Губим ценни данни, когато в никой от източниците ни няма пълно множество на изследваните параметри
  • Губим време в ръчно обединяване на данни, а възможност за допускане на грешки или дублиране на информация расте
  • В крайна сметка получаваме справки, в които ключови данни се променят и това затруднява по-нататъшния анализ
  • Всяко добавяне на нов източник на данни е свързано с влагане на допълнителни усилия за нова разработка на експорт

Най-правилният начин да преодолеем тези затруднения и последиците от тях, е чрез изграждането на база от данни, цялата информация в която е структурирана по начин, който включва информация за всички желани параметри. В зависимост от обема данни, с който работим, това може да бъде една единна таблица или цялостен Data Warehouse (DWH), в който са импортирани данните от всеки източник, с които разполагаме. Във всеки случай, нашия съвет към клиентите ни е възможно най-често да работят с агрегирани данни.

Как Tableau улеснява работата с данни от различни източници

Възможността да се работи с данни от множество различни източници е сред основните предимства, които поставят Tableau сред най-предпочитаните от потребителите софтуери за анализ. Предефинирани връзки към десетки различни типове източници на данни, разнообразие от възможности за свързване на отделни таблици с информация, възможност за писане на SQL заявки към бази данни са само част от улесненията, които Tableau предлага.

Свързване към различни типове източници на данни

Tableau разполага с предефинирани възможности за връзка към огромно разнообразие от източници на данни, като това множество продължава да расте с всяка следваща версия на решението.

Предефинирани връзки към източници на данни в Tableau

В допълнение, потребителите могат да използват и конкретно създадени заявки (query), за да се свързват към бази данни и да използват точно определена информация от тях. SQL заявките са отличен начин за свързване на различни таблици, реструктуриране на информацията, намаляване размера на данните, които подлежат на анализ и много други.

Relationships

Тъй като правилното и бързо свързване на данни от различни източници е един от основните проблеми, с които се сблъскват потребителите навсякъде по света, в последната си версия Tableau представи нова функционалност, която допълнително да облекчи този процес. Новата функционалност, наречена Relationships, добавя ново ниво на логика при свързването на източниците на данни. Тя позволява лесно да се създаде схема на взаимовръзки между отделните файлове, всеки от които носител на различни информационни аспекти. В резултат се получава една цялостна информационна картина, която служи като солидна основа за предстоящия анализ. Само с помощта на drag-and-drop действия потребителите могат да посочат коя таблица с данни с коя друга трябва да е свързана, като системата автоматично определя съществува ли възможност за свързване и как е най-добре да се дефинира то.

Relationships дават възможност за много по-бърз и пълноценен анализ на информация, идваща от множество различни източници без да се тревожим за риск от дублиране или евентуално изпускане на съществени данни. Системата извлича нужната за нашия анализ информация от различните източници без физически да ги смесва. По този начин се запазва детайлността на данните в различните източници, а потребителите могат лесно и бързо да намерят отговори на бизнес въпроси, които при други условия биха им отнели значително време, изгубено в обработка на таблици.

 

Свързване на данни от различни източници

Благодарение на Relationships можем да изградим анализ, черпейки информация от източници на данни, които няма как да свържем лесно с традиционните методи, а добавянето на нови файлове с данни е въпрос само на няколко клика.

Новата функционалност не е единствения вариант на връзка между източници на данни, която Tableau предлага. В зависимост от типа информация и нуждите на анализа, на разположение са също функционалностите като Aggregate, Join и Union.

Tableau Prep Builder

Включен в Creator лиценза на Tableau, този продукт е изцяло предназначен за първоначална обработка и подготовка на данните за анализ. Интерфейсът на продукта позволява лесно и бързо да прегледаме обобщен вид на данните, идващи от различни източници, да изчистим дублиращи се или некоректни данни, да трансформираме информацията в удобен за обработка вид и да я подготвим за анализ. Tableau Prep спестява много ръчни операции и съкращава значително времето за подготовка на данните.

 

Използването на съвременни BI инструменти като Tableau може значително да опрости сложната задача да работим паралелно данни, постъпващи от множество различни източници. Това от своя страна ще ускори анализа и ще ни даде възможност да намираме в данните отговори на въпросите, които ни вълнуват, точно когато имаме най-голяма нужда от тях.

 

Ако искате да научите още полезни съвети за работата с данни, не пропускайте да се включите в нашия безплатен онлайн трейнинг „Как да спестите време и пари при работата с данни“

Да, искам да науча как мога да спестя време и пари при работата с данни

 

Share This

Copy Link to Clipboard

Copy